본문 바로가기
programming/AI

머신러닝의 5단계 과정과 딥러닝

by 개코 - 개발과 코딩 2021. 7. 30.

머신러닝과 딥러닝을 위해 데이터가 많으면 많을 수록 좋긴 하지만 좀 더 효율적인 기계학습을 위한 5단계의 과정을 거치게 된다. 날 것의 데이터를 머신러닝에 잘 적용될 수 있도록 가공하는 과정인데, 이 과정 또한 어떻게 보면 사람이 문제를 해결하기 위해 학습하는 과정과 흡사하기도 하다.

머신러닝 5단계
머신러닝 5단계

 

머신러닝 5단계 과정

나 자신에게 필요한 것이 존재하고 하고 싶은 것이 있고 배우고 싶은 것이 있다면 우리는 사람은 그것을 위해 찾아나간다.

자료를 찾으며 불필요한 자료들은 제거하고 필요한 자료들만 추린다.

필요한 자료들을 추리면서 노트나 엑셀 등 문서도구에 라벨링을 하면서 정리를 한다.

그리고 공부를 지속하며 학습해 나간다.

이후 내가 하고자 하는 것들을 위해 학습한 것을 사용한다.

 

머신러닝도 마찬가지 같다는 생각이 든다.

위의 과정을 기계학습으로 비유하면 머신러닝 5단계가 나온다.

  1. 필요한 결과를 위한 데이터 수집 과정
  2. 필요없는 데이터를 제거하고 가공하고 정리한 데이터 전처리 과정
  3. 정리된 데이터의 공통된 것들을 구분하는 레이블링
  4. 가공한 데이터에서 중요한 피처만을 추출하는 피처 추출
  5. 위의 데이터를 기반으로 기계학습 시작
  6. 학습된 결과로 데이터가 맞는지 검증

위의 단계를 거쳐 데이터가 나오고 검증까지 완료되었다면 다음부터는 사용하면 된다.

하지만, 위의 단계들이 무조건 기계학습으로 되지는 않는다.

부분부분 데이터를 구분하고 추출하는데 의외로 사람이 관여하는 시간이 커질 수 있다.

 

사람의 시간을 줄이자. 딥러닝

데이터를 수집하고 추출하고 구분짓고 하는 것은 어쩌면 사람의 손이 많이 갈 수도 있다.

머신러닝을 위해 데이터가 많으면 좋다라고 하는 것은 그만큼 충분한 학습의 양이 많아 정확한 결과를 도출하기 위함이지 그 이전의 과정에서 사람의 손이 많이 가면 머신러닝의 의미가 부족할 수 있다.

 

그렇기에 나온 개념이 딥러닝이다.

원초적인 원본의 데이터들이 쌓이고 있다면 그 데이터들을 가공하고 구분짓고 피처까지 추출하고 학습을 하고 검증하여 결과를 도출하는 것까지 기계가 알아서 해주면 사람은 그저 다른 일을 하던지 기계학습 알고리즘에 좀 더 투자하는 시간을 가질 수 있다.

다시 말해

사람이 관여하는 단순 무식한 작업까지 기계가 알아서 해주고 학습하는 것을 딥러닝이라 한다.

머신러닝을 위해 좀 더 상세한 데이터까지 기계가 딥러닝해주면 앞으로 도출되는 결과물들은 무궁무진해 질 수 있을 것이다.

 

컨텐트 제작자라면 무한의 컨텐츠를 만들 수 있을지도 모르겠다.

반응형

댓글