-
반응형
Explotory Data Analysis
- 문제 정의
- 시각화 & 변수탐색
- 결측치, 이상치 탐지
Data Preprocessing
- 적절한 데이터 처리
- 정규화
- 교차검증 설정
Feature Engineering
- 변수 생성
- 차원 축소
- 특징 추출
Modeling
- 예측 모델링
- 분류 모델링
- 결과 해석
Machine Learning : 어떠한 작업 T에 대하여 E라는 경험을 통해 T를 가장 효율적으로 만드는 것
사용할 Library : scikit learn
Data Splitting
original Data에서 랜덤으로 Training Data와 Test Data로 분리하여
Training Data를 활용하여 만들고 Test Data로 평가
Regression : 모든 값의 표준편차를 최소화 시키는게 목표
Simple Linear Regression : 단순 선형 회귀 분석 : 표준편차를 최소화하는 일차방정식을 찾는 것이 목표 (직선) : 변수 1개
Polynomial Regression : 다항 회귀 분석 : 표준편차를 최소화하는 이차방정식을 찾는 것이 목표 (곡선) : 변수 1개
Multiple Linear Regression : 다중 선형 회귀 분석 : 표준편차를 최소화하는 n차방정식을 찾는 것이 목표 (평면 혹은 그 이상) : 변수 n개
반응형