Random Forest 의사결정트리의 단점(제한성이 많고 때때로 과최적화 발생) 을 개선하기 위해 만들어진 알고리즘 여러개의 나무가 모여서 하나의 숲을 형성한다는 의미 과정 과정1) 데이터셋에서 x개의 데이터를 추출, 새로운 샘플 데이터 선택 과정2) 새로 생성된 샘플 데이터셋을 이용 새로운 의사결정 트리 생성 1,2 n번 반복 n개의 의사결정트리를 이용해 예측 Random forest 데이터 예측 모듈 생성 여기에 테스트 데이터가 입력이 되면 각각 의사결정트리에 입력해 결과를 구해보고 가장 많이 나온 결과를 선택해서 최종 결과로 결정 Random forest의 성능평가 방법 Bagging 63%의 데이터 이용 -> 매개 tree 생성 나머지 37%의 데이터 이용 -> 매개 tree의 성능 평가 매개 ..