만들면서 배우는 기계 학습
1장 기계 학습이란
1.1 기계 학습의 역사
기계 학습 : 컴퓨터나 로봇처럼 생물이 아닌것이 하는 학습
학습 : 어떤 과정으로 내부상태를 변화시키는 행동
주어진 조건을 일반화 하거나 구체적인 사례에서 법칙을 끄집어내 내부상태를 변경하는 학습
데이터 마이닝 : 인터넷 등에 축적된 대용량 데이터 를 해석하여 규칙성과 법칙을 찾아내는 기법
기계 학습 시스템의 역사 :
1. 기계 학습 연구 시작 (1950년~)
– 주로 게임을 연구대상(체커, 채스, 장기등)
– 파라미터 조정에 기초한 기계학습방법 -> 평가함수
2. 기계 학습 연구 발전 (1970년)
– 수치로 표현할수 없는 지식을 획득하는 방법 연구 -> 귀납학습
3. 진화 연산 방법에 기초한 기계 학습 제안 (1970년~)
– 유전자 알고리즘 : 생물의 진화를 모델화 한 기계학습 ->환경과 상호작용하면서 더 적합한 개체의 형질이 집단속에서 유전
– 유전자 알고리즘의 일반적인 추리 순서 : 유전자 집단의 초기화 -> 교차 -> 돌연변이 -> 선택 -> 교차 -> 돌연변이 -> 선택….
– 유전자 알고리즘은 확율적 검색 알고리즘. 최적의 지식을 학습하는 것은 어렵지만 긑사적인 최선의 답을 구하는 방법
4. 강화학습 (1990년~)
– 강화학습 : 생물개체가 환경과의 상호작용에 의해 지식을 습득하는 것을 모델
– 생물의 행동이 환경에 더 적합하면 보상 -> 잘되면 더 그 방향으로 사용 하도록.
5. 데이터 마이닝 (1990년말~)
– 데이터 마이닝 : 대용량 데이터 에 기초해 어떤 특정한 경향과 규칙을 자동으로 찾아줌
– 과거의 데이터를 이용해 규칙성을 자동으로 발견하거나 장래의 경향을 예측하고 데이터를 자동으로 분류하는 처리 -> 통계학, 확율이론
6. 신경망 (1940년~)
– (인공)신경망 : 생물의 신경조직 움직음을 모델
– 다층 신경망(퍼셉트론) : 1960년대 로젠블라트에 의해 만들어짐. 자극층(입력층) -> 연상층(중간층) -> 응답층(출력층)
– 자극층과 연상층 간의 결합은 셀간의 결합 강도를 나타내는 연결강도와 어느정도의 입력이 주어지면 다음셀에 정보를 전달하는 임계치가 랜덤으로 주어김
– 퍼셉트론은 1968년 민스키와 패퍼트에 의해 한계가 드러남
1.2 기계 학습 종류
이 책에서 다루는 기계 학습 종류
– 파라미터 조정, 귀납학습, 감독학습, 규칙학습, 신경망
기계 학습 프로그램 구현 방법 : Cygwin 또는 Linux으로 C 소스로 개발