ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • #1104
    카테고리 없음 2020. 11. 4. 14:05
    반응형

    Explotory Data Analysis

    - 문제 정의

    - 시각화 & 변수탐색

    - 결측치, 이상치 탐지

     

    Data Preprocessing

    - 적절한 데이터 처리

    - 정규화

    - 교차검증 설정

     

    Feature Engineering

    - 변수 생성

    - 차원 축소

    - 특징 추출

     

    Modeling

    - 예측 모델링

    - 분류 모델링

    - 결과 해석

     

    Machine Learning : 어떠한 작업 T에 대하여 E라는 경험을 통해 T를 가장 효율적으로 만드는 것

     

    사용할 Library : scikit learn

     

    Data Splitting

    original Data에서 랜덤으로 Training Data와 Test Data로 분리하여

    Training Data를 활용하여 만들고 Test Data로 평가

     

    Regression : 모든 값의 표준편차를 최소화 시키는게 목표

     

    Simple Linear Regression : 단순 선형 회귀 분석 : 표준편차를 최소화하는 일차방정식을 찾는 것이 목표 (직선) : 변수 1개

     

    Polynomial Regression : 다항 회귀 분석 : 표준편차를 최소화하는 이차방정식을 찾는 것이 목표 (곡선) : 변수 1개

     

    Multiple Linear Regression : 다중 선형 회귀 분석 : 표준편차를 최소화하는 n차방정식을 찾는 것이 목표 (평면 혹은 그 이상) : 변수 n개

     

     

    반응형
Designed by Tistory.