빅분기 3-02. 분석 기법 적용
321. 분석기법 * 회귀 분석 단순회귀 - 최소제곱법 , 결정계수 다중회귀 다항회귀 곡선회귀 로지스틱회귀 비선형회귀 * 로지스틱 회귀분석 * 의사결정나무 * 인공신경망 * 서포트 벡터 머신 - 하드마진SVM , 소프트마진SVM * 연관성 분석 - 지지도 , 신뢰도 , 향상도 * 군집분석 - 계층적 군집 , k평균군집 , 혼합분포군집 , SOM 322. 고급분석기법 * 범주형자료분석 - 분할표 분석 , 교차분석(카이제곱분석) , 피셔의 정확검정 * 다변량 분석 - 상관분석 (피어슨상관계수 , 스피어만 상관계수) , 다차원 척도법 , 주성분분석 * 시계열 분석 * 베이지안기법 * 딥러닝분석 * 비정형데이터분석 * 앙상블분석 * 비모수통계
2021. 4. 12.
빅분기 3-01. 분석 모형 설계
311. 분석 절차 수립 통계기반 분석 모형 - 기술통계 - 상관분석 (단순상관분석, 다중상관분석, 변수간의 상관분석) - 회귀분석 (단순회귀, 다중회귀, 다항회귀, 곡선회귀, 로지스틱회귀, 비선형회귀) - 분산분석 (ANOVA) - 주성분분석 (PCA) - 판별분석 데이터마이닝기반 분석 모형 - 분류모델 (통계적기법, 트리기반기법, 최적화기법, 기계학습) - 예측모델 (회귀분석, 의사결정나무, 시계열분석, 인공신경망) - 군집화모델 (계층적 방법, 비 계층적 방법) - 연관규칙모델 머신러닝기반 분석 모형 - 지도학습 (로지스틱회귀, 인공신경망 분석, 의사결정나무, 서포트벡터머신, 랜덤포레스트, 감성분석) - 비지도학습 - 강화학습 변수에 따른 분석 모형 311. 분석 환경 구축 분석 도구 선정 - R ..
2021. 4. 9.
빅분기 2-01. 데이터 전처리
211. 데이터 정제 데이터 정제 절차 데이터 오류 원인 분석 -결측값 , 노이즈 , 이상값 데이터 정제 대상 선정 데이터 정제 방법 결정 -삭제, 대체, 예측값 삽입 데이터 일관성 유지 정제 기법 변환 파싱 보강 데이터 정제기술 ETL 맵리듀스 스파크/스톰 CEP 피그 플럼 데이터세분화방법 계층적 방법 = 응집분석법 , 분할분석법 비계층적 방법 = 인공신경망 모델, K-평균 군집화 데이터 결측값 처리 결측값 종류 완전 무작위 결측 , 무작위 결측 , 비 무작위 결측 데이터 결측값 처리절차 결측값 식별 , 결측값 부호화 , 결측값 대체 데이터 결측값 처리방법 단순 대치법 1)완전 분석법 2)평균 대치법 (비 조건부 평균 대치법 , 조건부 평균 대치법) 3) 단순 확률 대치법 (핫덱대체, 콜드덱대체, 혼합..
2021. 4. 2.