-
#4. 머신러닝의 분류인공지능/케라스 창시자에게 배우는 딥러닝 2021. 2. 14. 19:29반응형
일반적으로 머신러닝 알고리즘은 4가지의 큰 범주 안에 속한다. 지도학습(Supervisied Learning), 비지도학습(Unsupervisied Learning), 자기지도학습(Self-supervisied Learning), 강화학습(Reinforcement Learning)이다. 각각의 범주는 명확하게 구분되어 있지는 않다. A 문제는 지도학습으로, B 문제는 비지도학습으로 푼다는 개념보다는 이러한 연속적인 범주에 다양한 알고리즘이 속한다는 정도로 인지하면 좋을 것이다.
지도학습(Supervisied Learning)은 사람 혹은 미리 레이블링된 샘플 데이터가 주어지면 입력 데이터를 이러한 레이블에 매핑하는 방법을 학습한다. 일반적으로 분류(Classification)와 회귀(Regression)를 지도학습의 예로 들지만 이를 조금 상세하게 나누면 사진에 대한 캡션을 생성하는 시퀀스 생성, 사진 내부의 특정 물체에 경계 상자를 그리는 물체 감지 등이 존재한다. 결국 정답이 존재하는 데이터들을 활용하여 가장 의미있는 표현을 찾아내는 것이 지도학습이라 할 수 있다.
비지도학습(Unsupervisied Learning)은 데이터에 대한 사전정보 없이 오직 데이터를 변환하는데 집중한다. 데이터를 서로 연관성이 있는 데이터끼리 묶어주는 군집(Clustering)가 기본적인 예시라고 할 수 있다. 데이터의 정보량이 너무 많아 이를 유의미한 정보를 가질 수 있는 한에서 축소하는 차원 축소(Dimensionality Reduction) 역시 비지도학습의 일종으로 지도학습 전 데이터 EDA 단계에서 사용하기도 한다. 알고리즘이라는 단어를 친숙하게 만들어준 추천 알고리즘을 예시로 들었을때 개인의 취향을 사용자의 집단에서 묶어주는 협업 필터링(Collaborative Filtering)이 가장 익숙한 비지도학습일 것이라 생각한다. 블로그 이름의 기원이자 가장 관심이 있는 분야이다.
가장 생소한 분류가 자기지도학습(Self-supervisied Learning)일 것이다. 어느 블로그에서는 지도학습의 일종으로, 또 다른 블로그에서는 비지도학습의 일종으로 포함하여 설명하기에 모호한 경계를 지닌 범주라고 생각된다. 지도학습과는 사전정의된 레이블의 유무에서, 비지도학습과는 레이블 존재의 유무에서 차이를 보인다. 입력 데이터를 압축하거나, 입력데이터에 노이즈를 추가할 수 있는 오토인코더(Auto Encoder)가 자기지도학습의 예시라고 할 수 있다. 오토인코더에 대해서는 향후 따로 다룰 예정이니 데이터에서 가장 의미있는 표현을 학습하고 입력 데이터를 그 표현을 가장 잘 활용할 수 있는 형태로 변환시키는 작업 정도로만 생각하기로 한다.
마지막으로 볼 범주는 강화학습(Reinforcement Learning)이다. 위의 사진은 구글 딥마인드가 아타리(Atari)의 벽돌깨기 플레이 학습에 성공한 사례를 보여주는 사진이다. 시작하고 미동도 하지 않거나, 구석으로 가서 꼼짝도 하지 않던 딥마인드의 플레이는 각 플레이 마다의 점수를 통해 보상을 확인하고 보상이 최대가 될 수 있는 플레이를 점점 학습한다. 결국 한쪽에 구멍을 뚫어 공을 위로 올려보내는 등의 가장 효율적인 게임 플레이를 재현해낸다. 환경에 대한 정보를 받아 보상을 최대화하는 행동을 선택하는 학습방법이다. 아직까지는 게임 이외의 성공 사례가 존재하지 않으나 가장 많은 잠재력을 갖고 있는 학습 방법이라 할 수 있다.
반응형'인공지능 > 케라스 창시자에게 배우는 딥러닝' 카테고리의 다른 글
#6. 데이터 전처리 (0) 2021.02.14 #5. 일반화된 모델을 위한 데이터 분할 (0) 2021.02.14 #3. 신경망의 구성요소 (0) 2021.02.07 #2. 텐서(Tensor) 이해하기 (0) 2021.01.22 #1. 딥러닝이란 무엇인가? (1) 2021.01.21