본문 바로가기
728x90

결정트리3

결정트리,랜덤포레스트,혼동행렬,교차검증 키워드 개념정리 결정트리 , 랜덤포레스트 , 혼동행렬 , 교차검증 지금 배우고 있는 Section2 의 개념이 모두 새롭기 때문에 개념들이 뒤섞이기 시작했다 조금이나마 편안하게 , 마음의 안정을 위해 지금껏 공부한 키워드를 적고, 이해가 안가는 부분을 표시해보자 (붉은색으로 된 글씨는 한번에 이해가 가지 않아 다시 봐야겠다고 표시해둔 것. 중요하다는 뜻이아님) 01 - 결정트리 (Decision tree) 사이킷럿 파이프라인 from category_encoders import OneHotEncoder from sklearn.impute import SimpleImputer from sklearn.preprocessing import StandardScaler from sklearn.linear_model import .. 2021. 2. 8.
Random Forest,랜덤포레스트_Day27 Step 1 : Create a "Bootstrapped" dataset. 주어진 데이터셋과 동일한 데이터셋을 만든다 내용은 랜덤하게 채운다 (포인트! 동일한 데이터셋이 중복되는걸 허락한다) Step 2 : Create a decision tree using the boostrapped dataset, but only use a random subset of variables(or columns) at each step. 원래 결정트리에서는 모든 열을 반영하지만, 랜덤포레스트에서는 랜덤하게 일부만 열 선택 가능 (나중에 얼마나, 어떤 열을 선택해야 하는지에 대해서도 배움) (첫번째 노드의 선택을 랜덤하게 했듯이, 두번째 노드도 첫번째를 제외한 항목중 랜덤하게 선택해서 넣는다) 한번더 정리하면 랜덤트리를 .. 2021. 2. 5.
결정트리,Decision Trees_Day26 결정트리 classification의 결과는 카테고리형이 될수도 , 숫자형이 될수도 있다 좌측의 질문순서와 우측의 질문순서가 꼭 같을 필요 없다 (우측에 도넛먹는지 물어봤다고 좌측에 도넛먹는지 먼저 물어볼 필요 없다는 뜻) Rood Node : The Root : 가장 상단의 시작점 (화살을 주기 시작하는 점) Internal Nodes : Nodes : 중간 지점의 연결점 (화살을 받기도 하고 , 주기도 한다) Leaf Nodes : Leaves : 가장 마지막의 최종점 ( 화살을 받기만 한다) = classification의 결과 (좌) 좌측에 주어진 데이터로 결정트리를 만들려고 한다. 어떤 조건이 가장 상단에 들어가야 하는가? (우) 각 조건별 타겟값의 분포를 보면 어느하나 100%로 구분되는 상황.. 2021. 2. 4.
728x90