주요글: 도커 시작하기

파이썬 머신러닝 완벽 가이드 책 스터디 자료

 

2장 : 사이킷런 소개

* 프로세스 기초 / 사이킷런 프레임워크 기초 / 교차 검증: KFold, Stratified

* 데이터 전처리: null 값 처리, 인코딩, 표준화, 정규화

 

파이선 ML - 2장 사이킷런.pdf
0.14MB

3장 : 평가

* 성능 지표: 정확도, 오차행렬(confusion matrix), 정밀도, 재현율, 분류 결정 임곗값

* ROC / ROC-AUC 

파이선 ML - 3장 평가.pdf
0.88MB

4장 : 분류

* 결정 트리(Decision Tree)

* 앙상블 학습 / 보팅, 배깅, 부스팅  / 하드 보팅, 소프트 보팅

* 랜덤 포레스트 / GBM / XGBoost / LightGBM

파이선 ML - 4장 분류.pdf
0.46MB

5장 : 회귀

* 선형 회귀, 다항 회귀, 규제 선형 모델(릿지, 라쏘, 엘라스틱넷)

* 로지스틱 회귀

* 회귀 트리

파이썬 ML - 5장 회귀.pdf
0.42MB

머신 러닝 인 액션 책의 4장 내용을 정리했습니다. 4장에서는 나이브 베이스 확률을 이용해서 분류하는 방법에 대해 다룹니다. 참고로, 집단 지성 프로그래밍 책의 문서 필터링 http://javacan.tistory.com/entry/Programming-CI-Study-ch6-DocumentFiltering 에서도 이 내용을 다룹니다. 둘을 비교해보면 더 도움이 될 것 같네요.











+ Recent posts