강의실/머신러닝

01-2. 머신러닝의 개념

파아란기쁨 2021. 11. 10. 17:01

지난 시간에 머신러닝과 딥러닝 그리고 인공지능의 관계에 대해서 알아 보았습니다.

머신러닝은 약인공지능에 포함되는 기술이며 인공지능을 공부하기 위해서는 머신러닝과 딥러닝에 대해서 학습을 해야 합니다.

머신러닝(Machine Learning)을 한글로 풀어 쓰면 '기계학습' 입니다.

기계학습을 위키백과에서 찾아 보면 다음과 같이 정의 되어 있습니다.

 

경험을 통해 자동으로 개선하는 컴퓨터 알고리즘의 연구

 

머신러닝은 스스로 규칙을 수정합니다.

먼저 알아야 할 개념은 '학습' 입니다. 머신러닝과 딥러닝에서 말하는 학습은 데이터 규칙을 컴퓨터 스스로 찾아 내는 것을 말합니다.

우리가 전통적인 프로그래밍 규칙을 이용하여 프로그램을 개발을 했었다고 하면 위의 문장을 이해하기 어려울 수가 있습니다.

전통적인 프로그래밍을 했었다면 어떤 프로그램을 만들기 위해서 실생활에 필요한 규칙들을 세분화 하고 그러한 규칙에서 조금만 벗어나도 새로운 규칙을 생성하여 모든 조건을 감안하여 프로그래밍을 해야 했던 것에 비하면 이러한 머신러닝은 데이터를 학습하여 규칙을 찾아내어 스스로 수정을 합니다.

여기서 말하는 규칙을 찾아 수정하는 과정을 '학습' 또는 '훈련' 이라고 합니다.

스팸이메일을 분류하는 과정을 살펴 보면 위와 같이 이메일 데이터를 이용하여 규칙을 사람이 체크하는 대신에 알고리즘에서 지속적으로 모니터링을 하면서 자주 나타나는 패턴을 감지하여 학습하여 데이터를 처리합니다.

이때 스팸 메일의 내용이 변경 될 수 가 있습니다. 가령 4U 가 포함된 이메일이 스팸 확률이 높아서 알고리즘에서 스팸메일 처리 하는 것을 알고 For U 라고 내용을 바꿀 수가 있는데 머신러닝이 자동으로 학습하여 스팸메일로 분류를 하게 됩니다.

 

머신러닝의 학습방법을 이해 합니다.

머신러닝은 학습방법에 따라 지도학습(supervised learning),비지도학습(unsupervised learning),강화학습(reinforcement learning) 으로 분류합니다.

 

  • 지도학습(Supervised Learning) 

입력과 타깃으로 모델을 훈련시키는 학습방법

스팸 메일을 분류할때 스팸인지 아닌지를 정답을 기록한 '훈련데이터'를 바탕으로 모델을 훈련시킨 후 이 모델은 '4U가 포함되어 있는 메일은 스팸메일' 이라는 규칙을 얻었습니다.

여기서 훈련데이터,모델 등의 용어가 새로 등장하게 되는데요.

하나씩 살펴 보겠습니다.

훈련데이터란?

위의 그림에서 보는 것과 같이 모델을 훈련시키기 위해 사용되는 데이터를 통틀어 훈련데이터라고 부릅니다. 훈련데이터에는 '입력'과 타깃(target) 으로 구성되어 있습니다.

입력은 모델이 풀어야 할 일종의 문제이며 타깃은 모델이 맞춰야 할 정답과 같은 것입니다.

즉 지도학습은 문제에 대한 답을 주는 방법으로 모델을 훈련 시키는 것입니다.

우리가 수학공부를 할때 원리를 파악하지 않고 같은 유형의 문제와 정답을 엄청 많이 외우도록 한 후에 비슷한 유형의 문제에서 정답을 유추해 내는 것과 같은 방식입니다.

모델이란?

 모델은 위의 훈련데이터를 통해서 학습되어 어떤 규칙을 찾게 되는데 이 규칙을 모델이라고 합니다. 즉 위의 예에서 '4U가 포함되어 있는 메일은 스팸메일' 이란 규칙이 모델이 되는 것입니다.

이 모델은 새로운 입력에 대한 예측을 만듭니다. 즉 '학습을 통해 예측하는 프로그램' 이라고 이해하시면 됩니다.

 

  • 비지도학습(Unsupervised Learning)

타깃이 없는 훈련데이터를 사용하는 학습방법

예를 들어 블로그 방문자에 대한 데이터가 많이 있다고 하면 비슷한 방문자들을 그룹으로 묶기 위해 군집 알고리즘을 적용하려 합니다.

하지만 방문자가 어떤 그룹에 속하는지 알고리즘에 알려 줄 수 있는 데이터 포인트가 없습니다.

그래서 알고리즘이 스스로 방문자 사이의 연결고리를 찾습니다.

40%의 방문자가 만화책을 좋아하며 저녁때 블로그를 읽는 남성이고 20%는 주말에 방문하는 공상과학을 좋아하는 젊은 사람임을 알게 될지도 모릅니다.

이러한 비지도 학습은 훈련데이터에 타깃이 없으므로 모델의 훈련결과를 평가하기 어렵다는 특징이 있습니다.

 

  • 강화학습

주어진 환경으로부터 피드백을 받아 훈련하는 학습방법

주어진 환경(Environment)에서 에이전트(agent)가 최대의 보상(reward)를 얻기 위해 최상의 정책(policy)를 학습하는 방법으로 딥마인드의 알파고와 같은 게임이나 온라인 광고 등이 있습니다.

머신러닝이 유용한 분야

  • 많은 수동 조정과 규칙이 필요한 문제
  • 해결하기 너무 어렵거나 알려진 해가 없는 문제(음성인식,얼굴인식...)
  • 변화하는 환경에 적응해야 하는 문제
  • 복잡한 문제와 대량의 데이터에서 통찰얻기

 

<참고서적>

Do it 딥러닝 입문

핸즈온 머신러닝

 

[인천 서구 원당컴퓨터학원]

원당컴퓨터학원에서는?

1. 4차 산업 시대의 흐름은 컴퓨터를 얼마나 이해하느냐에 따라 삶의 질이 틀려 질 수 있다는 것을 항상 염두에 두고 있습니다.

2. 알고리즘은 프로그래밍의 근원이 되는 문제해결 능력이며, 머신러닝은 IoT등에 의해 모여진 데이터를 활용하는 기법입니다.

3. 이에 따라 초,중,고 학생들이 알기 쉽게 이해하는 인공지능 부터 알고리즘까지 학생들의 실력에 맞춰 수업을 진행중에 있습니다.

4. 현재 초등학생이 고등학생이 되는 때에는 고교학점제 도입에 따라 자신이 전공하고자 하는 특기가 크게 부각 될것입니다.

5. IT 업체중 규모가 큰 곳에서는 코딩테스트(알고리즘테스트)로 블라인드 면접을 수행하는곳이 늘고 있습니다.

6. 미래 IT를 꿈꾸는 학생들의 산실이 되기 위해 항상 최선을 다하는 원당컴퓨터학원이 되겠습니다.

 

※ 정보영재 혹은 인공지능 관련 수업에 관해 궁금하신 분은 문의(032-565-5497) 주세요.

 

 

원당컴퓨터학원 커리큘럼

- OA : 학교 수행 평가에 꼭 필요한 컴퓨터 활용능력 향상

- IT 자격증 과정 : 취업대비,대학생인증제,승진을 위한 국가공인 자격증 취득과정

- 정보영재 : 정보올림피아드 및 알고리즘 대회/소프트웨어특기자전형/디미고 특별전형 대비/코딩테스트 대비를 위한 알고리즘 과정

- 프로젝트반 : 응용프로그래밍/웹프로그래밍/앱프로그래밍 등을 통해 직접 만들어 보면서 컴퓨터 프로그래밍 이해(소프트웨어 학생부종합전형/특성화고(디미고,선린고등) 특별전형대비)

- 인공지능 : 인공지능의 이해 및 실습을 통해 빅데이터 가공(4차 산업 시대의 축이 되는 인공지능 시대를 대비)

- 일반고,과고,영재고,특성화고,컴퓨터학과(SW) 대학생을 위한 내신대비 : python,java,c++,자료구조,알고리즘,이산수학 

 

 

 

사업자 정보 표시
원당컴퓨터학원 | 기희경 | 인천 서구 당하동 1028-2 장원프라자 502호 | 사업자 등록번호 : 301-96-83080 | TEL : 032-565-5497 | Mail : icon001@naver.com | 사이버몰의 이용약관 바로가기

'강의실 > 머신러닝' 카테고리의 다른 글

02-1 독립변수와 종속변수  (7) 2021.12.15
01-5. 퍼셉트론이란?  (12) 2021.12.03
01-4. 튜링테스트란?  (9) 2021.11.25
01-3. 인공지능의 역사  (6) 2021.11.16
01-2. 머신러닝의 개념  (6) 2021.11.10
01-1. 인공지능(Artificial Intelligence)이란?  (12) 2021.11.05
1 ··· 4 5 6 7 8 9