1. 광고배너
  2. 광고배너
/ 이전버튼 다음버튼
2
미리보기

머신 러닝과 통계-파이썬과 R로 배우는 머신 러닝
저자 : 프라탑단게티 ㅣ 출판사 : 에이콘출판 ㅣ 역자 : 이병욱

2018.02.28 ㅣ 496p ㅣ ISBN-13 : 9791161751191

정가35,000
판매가33,250(5% 할인)
적립금 1,400원 (4%)
배송일정 05월 02일 출고 가능
주문 수량 변경시 안내 배송안내
쿠폰 및 결제혜택 확인하기

크기 기타 규격
제품구성 단행본
이용약관 청약철회
국내도서 > 컴퓨터 > 시스템공학 > 데이타베이스/자료구...
통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있도록 돕는다. 또한 지도학습, 비지도학습, 강화학습에 이르기까지 머신 러닝에서 주로 사용되는 대부분의 기법에 대해 파이썬과 R 예제를 제공한다.
책의 초반에 통계와 머신 러닝의 전반적인 관계에 대해 설명한 다음, 지도학습, 비지도학습, 강화학습 순으로 각각의 기법에서 통계적 방법과 머신 러닝 기법을 비교하며 설명한다. 거의 대부분의 예제에 대해서 파이썬과 R 코드를 같이 제공하기 때문에 코드를 직접 실행해 가면서 책을 읽을 수 있다.
펼쳐보기

[목 차]

1장. 통계학에서 머신 러닝으로의 여행

__모델 구축과 검증을 위한 통계 용어
____머신 러닝
____통계 모델링과 머신 러닝의 주요 차이점
____머신 러닝 모델 개발과 배치를 위한 단계
____통계학 기초 및 모델 구축과 검증에 관련된 용어
____편향과 분산의 트레이드 오프
____훈련 데이터와 테스트 데이터
__모델 구축과 검증을 위한 머신 러닝 용어
____선형 회귀 vs 기울기 하강법
____머신 러닝 손실
____머신 러닝 모델 튜닝을 멈추는 시점
____훈련, 검증, 테스트 데이터
____교차 검증
____그리드 검색
__머신 러닝 모델 개관
__요약


2장. 통계학과 머신 러닝의 유사점

__회귀와 머신 러닝 모델의 비교
__머신 러닝 모델의 보상 요인들
____선형 회귀의 가정들
____선형 회귀 모델링에 적용된 단계들
____기본 원리로 해결하는 간단한 선형 회귀 예제
____와인 품질 데이터를 이용한 단순 선형 회귀 예제
____다중 선형 회귀 예제 - 모델 구축을 위한 단계별 기법
________후진 제거법과 전진 선택법
__머신 러닝 모델 - 리지와 라소 회귀
____리지 회귀 분석 머신 러닝 예
____라소 회귀 분석 머신 러닝 모델
____선형 회귀와 리지/라소 회귀의 매개변수 정규화
__요약


3장. 로지스틱 회귀 vs 랜덤 포레스트

__최대 우도 추정
__로지스틱 회귀 - 소개 및 장점
____로지스틱 회귀에서 사용되는 용어
____로지스틱 회귀 모델링의 적용 단계
____독일 신용 데이터를 이용한 로지스틱 회귀 예
__랜덤 포레스트
____독일 신용 데이터를 이용한 랜덤 포레스트 예
________랜덤 포레스트에서의 그리드 검색
__변수 중요도 그래프
__로지스틱 회귀와 랜덤 포레스트 비교
__요약


4장. 트리 기반 머신 러닝 모델
__결정 트리 분류기 소개
____결정 트리에 사용되는 용어들
____기본 원리로 본 결정 트리의 작동 원리
__로지스틱 회귀와 결정 트리 비교
__다양한 모델 형식 간의 오차항 비교
__이상적인 영역으로 가는 개선책
__HR 퇴직율 데이터 예제
__의사결정 트리(DT) 분류기
__트리 분류기의 가중값 튜닝
__배깅 분류기
__랜덤 포레스트 분류기
__랜덤 포레스트 - 그리드 검색
__에이다 부스트 분류기
__기울기 부스팅 분류기
__에이다 부스팅과 기울기 부스팅의 비교
__극단 기울기 부스팅 - XG 부스트 분류기
__앙상블들의 앙상블 - 모델 스태킹
__서로 다른 분류기 형태 간의 앙상블들의 앙상블
__동일 형식 분류기를 사용한 부트스트랩 표본을 통한 앙상블들의 앙상블
__요약


5장. K-최근접 이웃과 나이브 베이즈

__K-최근접 이웃
____KNN투표 예제
____차원의 저주
________차원의 저주 1차, 2차, 3차원 예제
__위스콘신 유방암 진단 데이터를 이용한 KNN 분류기
__KNN분류기에서 K 값 튜닝
__나이브 베이즈
__확률 기초
____결합 확률
__조건부 확률과 베이즈 정리의 이해
__나이브 베이즈 분류기
__라플라스 계산
__나이브 베이즈 SMS 스팸 분류 예
__요약


6장. 서포트 벡터 머신과 신경망

__SVM 동작 원리
____최대 마진 분류기
____서포트 벡터 분류기
____서포트 벡터 머신
__커널 함수
__SVM 다중 레이블 분류기를 사용한 문자 인식 예제
____최대 마진 분류기 - 선형 커널
____다항 커널
____RBF 커널
__인공 신경망
__활성 함수
__순전파와 역전파
__신경망의 최적화
____확률 경사 하강법(SGD)
____모멘텀
____NAG
____에이다 그래드
____에이다 델타
____RMS프랍
____적응 모멘트 계산 - Adam
____L-BFGS 최적화 알고리즘
__신경망에서의 드롭아웃
__scikit-learn을 사용해 필기체 숫자 인식에 적용한 ANN 분류기
__딥러닝 소개
____해결 기법
____딥러닝 소프트웨어
____필기체 숫자 인식을 위해 케라스를 사용한 딥 신경망 분류기
__요약


7장. 추천 엔진

__내용 기반 필터링
____코사인 유사도
__협업 필터링
____내용 기반 필터링 대비 협업 필터링의 장점
____협업 필터링을 위한 교대 최소 자승법에 의한 행렬 인수 분해
__추천 엔진 모델의 평가
____그리드 검색을 사용한 추천 엔진의 초매개변수 선택
____무비렌즈 데이터에 적용한 추천 엔진
________사용자-사용자 유사도 행렬
________영화-영화 유사도 행렬
________ALS를 사용한 협업 필터링
________협업 필터링에서의 그리드 검색
__요약


8장. 비지도학습

__K-평균 군집화
____K-평균 군집화 기본 작동 원리362
____최적 클러스터 개수와 클러스터 평가
________엘보 기법
____붓꽃 데이터 예제를 이용한 K-평균 군집화
__주성분 분석 - PCA
____기본 원리로 본 PCA작동 기법
____scikit-learn를 활용한 필기체 숫자 인식에 PCA적용
__특이점 분해 - SVD
________scikit-learn를 사용한 필기체 숫자에 SVD적용
__딥 오토 인코더
__인코더-디코더 구조를 이용한 모델 구축 기법
__케라스를 이용한 필기체 숫자 인식에 딥 오토 인코더 적용
__요약


9장. 강화학습

__강화학습 소개
__지도•비지도•강화학습의 상세 비교
__강화학습의 특성
__강화학습 기초
____범주 1 - 가치 기반
____범주 2 - 정책 기반
____범주 3 - 액터 크리틱
____범주 4 - 비모델 기반
____범주 5 - 모델 기반
____순차적 의사결정의 기본 범주
__마르코프 결정 프로세스와 벨만 방정식
__동적 프로그래밍
____동적 프로그래밍으로 최적 정책을 계산하는 알고리즘
__파이썬으로 격자 세상에 가치와 정책 반복 알고리즘 구현
__몬테카를로 기법
____동적 프로그래밍과 몬테카를로 기법의 비교
____DP기법 대비 MC기법의 핵심 우위점
____몬테카를로 예측
____그리드 문제에 적용한 몬테카를로 예측의 적합성
____파이썬을 사용해 블랙잭 게임을 몬테카를로 기법으로 모델링
__시간차 학습
____몬테카를로 기법과 시간차 학습의 비교
____TD 예측
____TD 학습을 위한 회사까지 운전 예제
____SARSA 온-폴리시 TD 제어
__Q-러닝 오프-폴리시 TD 제어
__절벽 걷기 예제에 적용한 온-폴리시와 오프-폴리시 TD 제어
__머신 러닝과 딥러닝을 통합한 강화학습의 응용
____자율 운행 제어 - 자율 주행 차량
____구글 딥마인드의 알파고
____로봇 축구
__참고문헌
__요약

펼쳐보기
★ 이 책에서 다루는 내용 ★

■ 모델 구축에 필요한 머신 러닝과 통계학 기초 이해
■ 문제 해결을 위한 통계적 방식과 머신 러닝 방식 사이의 차이점 및 유사점 이해
■ 데이터를 준비하는 방법 및 준비된 데이터로 R과 파이썬 패키지의 머신 러닝 알고리즘을 사용해 모델을 직접 구축하는 방법
■ 결과를 분석하고 목적에 맞게끔 모델을 튜닝하는 방법
■ 머신 러닝을 위해 필요한 통계학 개념 이해
■ 지도학습과 딥러닝 비지도학습 모델에 필요한 필수 기초 지식
■ 강화학습과 인공지능 응용분야

★ 이 책의 대상 독자 ★

이 책은 머신 러닝을 시스템에 구현하려는 사람이라면 통계학 지식의 유무와 상관없이 읽을 수 있다. R과 파이썬 프로그래밍에 관한 사전 지식은 많은 도움이 된다.

★ 이 책의 구성 ★

1장, ‘통계로부터 머신 러닝으로의 여행’에서는 통계와 머신 러닝의 기초 및 기본 요소를 소개한다. 모든 기초 지식은 전체 장에 걸쳐 파이썬과 R 코드를 통해 설명한다.
2장, ‘통계학과 머신 러닝의 유사점’에서는 선형 회귀와 라소/리지 회귀 예제를 통해 통계 모델링과 머신 러닝 사이의 차이점과 유사점을 비교해본다.
3장, ‘로지스틱 회귀와 랜덤 포레스트’에서는 분류 예제를 통해 로지스틱 회귀와 랜덤 포레스트의 세부 단계를 상세히 설명하면서 비교한다. 이 장이 끝날 때쯤에는 통계학과 머신 러닝 두 주류 학문에 관한 큰 그림을 그릴 수 있을 것이다.
4장, ‘트리 기반 머신 러닝 모델’에서는 실제 현업에서 많이 사용되고 있는 다양한 트리 기반 머신 러닝 모델을 알아본다. HR 퇴사자 데이터 예제를 통해 의사결정 트리(decision trees), 배깅(bagging), 랜덤 포레스트(random forest), 에이다 부스트(AdaBoost), 기울기 부스팅(gradient boosting), XG부스트X(GBoost)를 파이썬과 R 언어를 사용해 배운다.
5장, ‘K-최근접 이웃과 나이브 베이즈’에서는 간단한 머신 러닝 기법인 k-최근접 이웃을 유방암 데이터와 함께 설명한다. 나이브 베이즈 모델은 다양한 자연어 전처리 기술, 메시지 분류 예제와 함께 설명한다.
6장, ‘서포트 벡터 머신과 신경망’에서는 서포트 벡터 머신과 관련한 다양한 기능에 관해 기술하고 커널 함수 사용법을 알아본다. 그런 다음, 신경망을 소개하고 딥러닝의 기초에 관한 모든 것을 다룬다.
7장, ‘추천 엔진’에서는 사용자-사용자 유사도 행렬로부터 찾아낸 ‘유사한 사람’의 정보에서 ‘유사한 영화’를 찾는 방법을 알아본다. 두 번째 절에서는 코사인 유사도(cosine similarity)를 계산한 후 영화-영화 유사도 행렬을 구성해 추천 시스템을 직접 만들어본다. 마지막으로 최종 추천을 위해 사용자와 영화 간에 교대 최소 자승법을 활용한 협업 필터링(collaborative filtering) 기술을 사용한다.
8장, ‘비지도학습’에서는 K-평균 군집화(k-means clustering), 주성분 분석(principal component analysis), 특이값 분해(singular value decomposition), 딥러닝 기반의 딥 오토 인코더(deep auto encoders) 같은 다양한 기술을 소개한다. 마지막 부분에서는 딥 오토 인코더가 전통적인 PCA기법과 비교했을 때 갖고 있는 장점을 알아본다.
9장, ‘강화학습’에서는 에피소드 상태를 통해 최적 경로를 학습하는 마르코프 결정 프로세스 (Markov decision process), 동적 프로그래밍(dynamic programming), 몬테카를로 기법(Monte Carlo methods), 시간차 학습(temporal difference learning)과 같은 완전 탐색 기법(exhaustive techniques)에 관해 알아본다.
마지막에는 머신 러닝과 강화학습을 사용한 좋은 응용 사례 몇 가지를 소개한다.

★ 지은이의 말 ★

개발자들에게 있어 머신 러닝의 복잡한 통계학은 골칫거리다. 주어진 문제를 최적화하는 머신 러닝 모델을 구축하려면 통계 지식이 필요하다. 어떤 머신 러닝 전문가라도 통계와 수학에 관한 해박한 지식을 갖고 있어야만 머신 러닝 문제를 효율적으로 파악하고 해결할 수 있다. 이 책은 통계와 머신 러닝의 기본을 살펴봄으로써 머신 러닝으로 문제를 해결할 때 전체적인 시각을 가질 수 있게 해준다. 책에서는 다양한 분야에 걸쳐 빈번하게 사용되는 알고리즘을 살펴보고, 이를 위해 R과 파이썬 프로그래밍으로 scikit-learn, e1071, randomForest, c50, xgboost 같은 라이브러리를 다룬다. 또한 케라스 소프트웨어를 활용해 딥러닝의 기초를 알아보고 순수 파이썬 언어를 사용해 강화학습을 개괄적으로 알아본다.



★ 옮긴이의 말 ★

통계학을 모르고서는 머신 러닝을 이해할 수 없다. 이 책은 파이썬과 R을 이용해 다양한 예제와 함께 다양한 머신 러닝을 설명하는 것과 함께 통계적 기법과의 연계성을 설명함으로써 각각의 기법이 문제를 해결하는 방식과 목표에 대해 알려준다. 단 한 권의 책에 완전한 내용을 다 담을 수는 없지만 이 책을 통해 통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있다. 또 머신 러닝에서 주로 사용되는 거의 대부분의 기법에 대해 파이썬과 R 예제를 직접 제공함으로써 현업의 적용에 있어서도 많은 도움이 되리라 생각한다.
풍부한 실전 예제와 소스코드를 꼼꼼히 따라가다 보면 머신 러닝에서 사용되고 있는 거의 모든 기법을 익히게 될 것이다.



펼쳐보기
프라탑단게티
방갈로 TCS 혁신 연구소의 ‘분석과 통찰’ 부서에서 구조화 이미지 및 텍스트 솔루션 개발과 관련된 머신 러닝과 딥러닝 솔루션을 개발하고 있다. 분석학과 데이터 과학 분야에 폭넓은 경험을 갖고 있으며, 봄베이 IIT에서 산업공학과 오퍼레이션 리서치로 석사 학위를 받았다. 인공지능에 큰 관심을 갖고 있으며, 쉬는 날에는 차세대 기술과 혁신적 기법과 관련된 책을 즐겨 읽는다.
옮긴이 이병욱
한국과학기술원(KAIST) 전산학과 계산이론 연구실에서 학사 및 석사 학위를 취득했다. 공학을 전공한 금융 전문가로서 '최초'라는 수식어가 따라다닌다.
LG전자 연구원 시절 미국 마이크로소프트 본사에서 세계 최초의 핸드헬드-PC(Handheld-PC) 개발에 참여하며 최초의 한글 Windows CE 1.0과 2.0을 공동 개발했다. 1999년에는 국내 최초로 전 보험사 자동차 보험료의 실시간 비교 서비스를 제공하는 ㈜보험넷을 창업해 업계에 큰 반향을 불러일으켰다. 이후, 삼성생명을 비롯한 생명 보험사와 손해 보험사에서 마케팅과 영업 분야의 팀장, CMO(마케팅 총괄 상무), CSMO(영업 및 마케팅 총괄 전무)로서 혁신적인 상품과 서비스를 개발하고 총괄했다.
세계 최초로 파생 상품 ELS를 기초자산으로 하는 변액 보험을 개발해 단일 보험 상품으로 5,000억 원 이상 판매되는 돌풍을 일으켰고, 국내 최초의 사용자 맞춤형 정기보험 상품을 개발했으며, 매일 분산 투자하는 일 분산 투자(daily averaging) 변액 보험을 세계 최초로 개발해 상품 판매 독점권을 획득했다. 최근에는 머신 러닝 기반의 인공지능 금융 분석과 블록체인에 관심을 갖고 다양한 활동을 하고 있다.



펼쳐보기

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.
도서평점
내용
등록하기
0/2000자
교환/반품 방법
  • 마이페이지 > 주문관리 > 주문/배송조회 > 주문조회 후  [1:1상담신청]  또는 고객센터 (1544-9020)
  • ※ 오픈마켓, 해외배송 주문상품 문의 시 [1:1상담신청] 또는 고객센터 (1544-9020)
교환/반품 가능기간
  • 변심반품의 경우 수령 후 7일 이내
  • 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
교환/반품 비용
  • 단순변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 해외직배송 도서 구매 후 단순변심에 의한 취소 및 반품 시 도서판매가의 20% 수수료 부과
교환/반품 불가사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 만화, 잡지, 수험서 및 문제집류
  • 복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
상품 품절
  • 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기 >

    이 분야의 신간

    더보기 >
      맨위로가기

      영풍문고 로고

      • 회사명 : (주)영풍문고
      • 대표이사 : 김경환
      • 소재지 : 서울특별시 종로구 청계천로 41 (우)03188
      • 사업자 등록번호 : 773-86-01800 ㅣ 통신판매업 신고번호 : 2023-서울종로-0130 [ 사업자정보확인 ]
      • 개인정보관리 책임자 : 조순제 ㅣ customer@ypbooks.co.kr ㅣ 대량주문 : webmaster@ypbooks.co.kr
      COPYRIGHT © YOUNGPOONG BOOKSTORE INC. ALL RIGHTS RESERVED.
      영풍문고 네이버블로그 영풍문고 인스타그램
      맨위로가기