머신러닝(Machine Learning) 소개
머신러닝(Machine Learning)이란 무엇인가?
머신 러닝은 AI의 한 분야입니다
기계 학습의 기본이 되는 아이디어는 컴퓨터 프로그램이 많은 데이터에 접근할 수 있도록 하고, 변수 간의 관계에 대해 학습하고 예측을 하도록 하는 것입니다. 기계 학습의 일부 기술은 1950년대로 거슬러 올라가지만 컴퓨터 속도와 데이터 저장 비용의 향상으로 기계 학습은 이제 실용적인 도구가 되었습니다.
실용적인 도구로서 Python, R, MatLab, Spark 및 Julia와 같은 몇 가지 대안이 있습니다. 매우 큰 데이터 세트를 처리할 수 있는 능력과 알고리즘을 구현하는 패키지의 가용성이 필요합니다. 이 중에서도 Python이 대세로 자리잡고 있습니다.
컴퓨터는 많은 비즈니스 결정을 자동화하는 데 사용되었습니다(페이롤, 송장 발송, 지역별 매출 요약 등). 이것을 다른 말로 디지털화 또는 3차 산업혁명이라고도 합니다. 머신 러닝은 더욱 진일보 하여 컴퓨터가 지능을 만드는 데 사용되는 4차 산업 혁명의 중심입니다,
머신러닝은 사용영역을 확대시키고 있습니다. 금융 또는 은해에서는 대출 담당자가 알려진 특정 규칙을 적용하면 우리는 그들의 활동을 자동화할 수 있습니다. 사용된 규칙을 모르는 경우 ML을 사용하여 규칙을 결정할 수 있습니다. 그러나 우리는 한 걸음 더 나아가 ML을 사용하여 대출을 수락하거나 거부하는 규칙을 개선할 수 있습니다
전통적 통계 개념과 머신러닝
머신러닝을 이해하는 데 기본중의 기본이라고 할 수 있는 전통적 통계 개념에는 다음과 같은 것들이 있습니다.
- 평균, SD
- 확률분포
- 유의성 검정
- 신뢰구간
- 선형 회귀
- 기타
하지만 머신러닝에서 실제 사용되고 있는 통계의 새로운 면은 다음과 같습니다.
- 거대한 데이터 세트
- 컴퓨터 처리 속도 및 데이터 저장 비용의 환상적인 개선
- 이제 기계 학습 도구가 가능합니다
- 비선형 예측 모델을 개발하고, 이전에는 불가능했던 방식으로 데이터에서 패턴을 찾고, 다단계 의사결정 전략을 개발할 수 있습니다
- 새로운 용어: 기능, 레이블, 활성화 기능, 대상, 편향, 지도/비지도 학습…
전통적 통계와 머신러닝을 간단히 비교하면 다음과 같습니다.
머신러닝의 형태와 응용
머신러닝의 형태는 다음과 같은 것들이 있습니다.
- 비지도 학습(패턴 찾기)
- 지도학습(수치 또는 분류 예측)
- 준지도 학습(데이터의 일부에만 대상에 대한 값 또는 분류 값이 있음)
- 강화학습(다단계 의사결정)
머신러닝은 다양한 분야에서 응용되고 있는데 다음과 같은 것을 꼽을 수 있습니다.
- 여신결정: 고객을 보다 잘 분류하고 이해합니다
- 포트폴리오 관리
- 사모
- 언어번역
- 음성인식
- 생체 인식
- 기타