본문 바로가기

공부/데이터

머신러닝의 분류: 지도학습/비지도학습/강화학습

머신러닝은 데이터로부터 학습하여 예측이나 결정을 내리는 알고리즘의 집합이다. 주로 지도학습, 비지도학습, 강화학습이라는 세 가지 주요 학습 방법을 사용하는데, 각각의 방법은 다양한 하위 카테고리로 나뉘며, 어떤 문제를 해결할 지에 따라 다르다. 이 글에서는 이 세 가지 학습 방법과 그들의 하위 분류에 대해 설명한다.

지도학습 (Supervised Learning)

지도학습은 레이블이 지정된 데이터를 사용하여 모델을 학습시키는 방법으로, 주로 분류와 회귀로 두 가지 주요 유형으로 나뉜다.

분류 (Classification)

  • 정의: 입력 데이터를 미리 정의된 여러 클래스 중 하나로 분류하는 과정
  • 예시: 이메일 스팸 감지(스팸/비스팸), 의료 진단(질병/정상), ...

회귀 (Regression)

  • 정의: 연속적인 값을 예측하는 과정
  • 예시: 주택 가격 예측, 기온 예측 , ...

비지도학습 (Unsupervised Learning)

비지도학습은 레이블이 없는 데이터를 사용하여 숨겨진 패턴이나 구조를 찾는 방법으로, 주로 클러스터링과 차원 축소로 나뉜다.

클러스터링 (Clustering)

  • 정의: 유사한 특성을 가진 데이터 포인트를 그룹으로 묶는 과정
  • 예시: 고객 세분화, 유전자 분류 , ...

차원 축소 (Dimensionality Reduction)

  • 정의: 데이터의 특성을 줄이면서 중요한 정보를 유지하는 과정
  • 예시: 주성분 분석(PCA), t-SNE , ...

강화학습 (Reinforcement Learning)

강화학습은 에이전트가 환경과 상호작용하며 보상을 최대화하는 방법을 학습하는 과정이다. 이 방법은 주로 가치 기반, 정책 기반, 모델 기반으로 나눌 수 있다.

가치 기반 (Value-Based)

  • 정의: 최대의 누적 보상을 얻기 위한 최적의 상태 가치를 학습하는 방법
  • 예시: Q-러닝, Deep Q-Networks(DQN) , ...

정책 기반 (Policy-Based)

  • 정의: 최적의 행동을 직접 학습하는 방법
  • 예시: Policy Gradients, Actor-Critic 알고리즘 , ...

모델 기반 (Model-Based)

  • 정의: 환경의 모델을 학습하고, 이를 사용하여 최적의 전략을 계획하는 방법
  • 예시: 다이내믹 프로그래밍, Monte Carlo Tree Search , ...

각 학습 방법은 어떤 유형의 문제를 풀 지에 따라 선택되며, 우리는 문제의 성격에 따라 적절한 방법을 선택해야 한다. 지도학습은 명확한 목표가 있는 경우에, 비지도학습은 숨겨진 패턴을 발견할 필요가 있을 때, 강화학습은 연속적인 결정이 필요한 복잡한 환경에서 유용하게 사용될 수 있다.