2
미리보기
통계의 아름다움-인공지능 시대에 필요한 과학적 사고
저자 : 리찌엔,하이언 ㅣ 출판사 : 제이펍(주) ㅣ 역자 : 김슬기

2020.11.09 ㅣ 372p ㅣ ISBN-13 : 9791190665438

정가19,800
판매가17,820(10% 할인)
적립금 990원 (5%)
배송일정 2일 이내 출고 예정  
주문 수량 변경시 안내 배송안내
쿠폰 및 결제혜택 확인하기

결제혜택

닫기

크기 기타 규격
제품구성 단행본
이용약관 청약철회
국내도서 > 컴퓨터 > 컴퓨터일반 > 전산통계/전산회계/...
재미와 지혜로 가득찬 96가지의 통계 이야기!
중국에서 가장 많이 판매되는 통계/인공지능 교양 서적!


이 책은 통계학부터 시작하여 데이터와 수학, 그리고 데이터 시각화까지 논의한다. 당연히 통계 모델과 방법뿐만 아니라 빅데이터 기술과 데이터의 함정에 관해 기술하는 것도 잊지 않고 있다. 각 장마다 포함하고 있는 의미는 매우 독특하며, 현존하는 그 어떤 전문 서적이나 교재와는 차원이 다르다. 책의 구조 설계는 휘황찬란하고, 토론하는 문제는 심오하고도 소박하며, 내용은 과거부터 미래까지 모두 아울렀다. 각 장 말미에는 짧고 간결하며 고전적이면서도 심오한 이야기와 사례가 담겨 있다. 이야기에는 통계학의 지혜와 지식이 넘쳐난다. 이런 간결하고 고전적인 이야기를 통해 사람들은 비로서 통계의 아름다움을 느낄 수 있을 것이다.

펼쳐보기

[목 차]

1장 통계와 과학 1
1.1 스토캐스틱 세상 4
1.1.1 포켓볼 치는 물리학자 4
1.1.2 신은 주사위를 던지는가? 7
1.1.3 연쇄살인범의 체포 11
1.1.4 동전을 던지는 수학자들 14


1.2 확률의 이해 18
1.2.1 게임 상금의 배분 18
1.2.2 6연속 숫자와 14연속 숫자 22
1.2.3 사회자 뒤의 염소 25
1.2.4 실종된 잠수함을 찾아라 29
1.3 통계적 사고와 모델 32
1.3.1 차를 맛보는 여인 32
1.3.2 ‘쓰레기 같은 남자’ 꺼져 37
1.3.3 식스시그마의 기적 40
1.3.4 뉴턴의 사과 43
1.4 통계와 과학 45
1.4.1 지다성과 신기군사 45
1.4.2 딥블루와 알파고 48
1.4.3 중약과 양약 51
1.4.4 모든 모델은 잘못되었다 55

2장 데이터와 수학 59
2.1 데이터와 공간 62
2.1.1 다차원 세계의 벌레 62
2.1.2 매트릭스와 트랜스포머 66
2.1.3 구장산술과 선형방정식 71
2.1.4 이십팔수와 황도십이궁 74
2.2 확률변수와 분포 79
2.2.1 베르누이의 동전 79
2.2.2 몇 번의 만남과 신기한 37 83
2.2.3 드무아브르의 정규분포 86
2.2.4 술고래의 걸음걸이 89
2.3 데이터 알아가기 91
2.3.1 테세우스의 배 91
2.3.2 성별부터 체중까지 93
2.3.3 만 나이와 일반 나이 96
2.3.4 신체검사 기록표 100
2.4 수리통계의 기초 102
2.4.1 관중규표와 일엽지추 102
2.4.2 악질 도박꾼의 계략 105
2.4.3 평균화된 급여 108
2.4.4 소이비도와 공작 깃 112

3장 데이터 시각화 117
3.1 역사 속 통계 그래프 120
3.1.1 하도와 낙서 120
3.1.2 런던 콜레라 방역 121
3.1.3 나이팅게일의 장미 123
3.1.4 나폴레옹 원정 126
3.2 데이터와 시각화 129
3.2.1 여왕의 드레스 129
3.2.2 캔버스와 화선지 131
3.2.3 심수 왕자와 다래끼 화가 134
3.2.4 우주왕복선 ‘챌린저호’ 137
3.3 기초 통계 그래프 140
3.3.1 올드 페이스풀 간헐천의 비밀 140
3.3.2 통계 그래프의 창시자 142
3.3.3 오래된 국가의 시운 145
3.3.4 비상하는 모션 차트 148
3.4 데이터 간의 관계 150
3.4.1 포리마의 궤도 150
3.4.2 50개 주의 최고봉 153
3.4.3 타이타닉호의 생존자 156
3.4.4 체르노프의 얼굴 158

4장 모델과 방법 161
4.1 자주 쓰는 통계 모델 164
4.1.1 천양과 사조 164
4.1.2 차원축소 공격 168
4.1.3 고객은 왕 173
4.1.4 주식의 동향 177
4.2 머신러닝 181
4.2.1 맥주와 기저귀의 전설 181
4.2.2 ‘엄친딸’ 찾기 185
4.2.3 차라리 잘못 죽이는 것과 절대 놓치지 않는 것 188
4.2.4 나무와 숲 194
4.3 인공지능 201
4.3.1 인공지능의 2전 3기 201
4.3.2 딥러닝의 전생과 현재 204
4.3.3 신비로운 신경 207
4.3.4 아름다운 필터 212
4.4 그 외의 분석 방법 217
4.4.1 차, 술, 펩시콜라 217
4.4.2 몬테카를로와 원자폭탄 222
4.4.3 의사의 필적 224
4.4.4 사막의 나비 229

5장 빅데이터 시대 233
5.1 기술의 변천사 236
5.1.1 통계학의 기원 236
5.1.2 정보 시대의 도래 238
5.1.3 데이터 마이닝과 비즈니스 인텔리전스 241
5.1.4 빅데이터 시대의 신기원 243
5.2 분석 도구 247
5.2.1 누가 풋내기는 데이터 분석을 할 줄 모른다고 했는가? 247
5.2.2 자웅을 겨루는 분석 소프트웨어 250
5.2.3 풀스택 개발자의 최애 254
5.2.4 필자가 가장 사랑하는 R 256
5.3 컴퓨팅 프레임워크 260
5.3.1 냉장고 속 코끼리 260
5.3.2 병사 지휘와 장수 지휘 263
5.3.3 전기 호랑이와 전기 개미 266
5.3.4 무어의 법칙의 미래 270
5.4 빅데이터 업계의 응용 274
5.4.1 인터넷의 부흥 274
5.4.2 트래픽의 시작점 276
5.4.3 소득의 출처 278
5.4.4 좋아할 만한 상품과 비위 맞추기 282

6장 데이터의 함정 287
6.1 나뭇잎에 가려 숲을 보지 못하다 290
6.1.1 신기한 전갈자리 290
6.1.2 승자의 저주 292
6.1.3 비행기를 격추하는 유가 295
6.1.4 여신과의 인연 297
6.2 상관과 인과 300
6.2.1 방화와 뜨거운 음료 300
6.2.2 인기 게시물의 비밀 302
6.2.3 눈과 불의 도시 303
6.2.4 이름이 그렇게 중요한가? 305
6.3 표본과 조사 308
6.3.1 예측할 수 없는 미국 대선 308
6.3.2 비대칭 듀렉스 데이터 311
6.3.3 행운아의 전설 313
6.3.4 하버드 총장의 해고 316
6.4 도형의 오도 318
6.4.1 소득의 변화 318
6.4.2 톨게이트와 정류장 320
6.4.3 동관의 도주 322
6.4.4 독이 있는 피팅 326

참고문헌 331
찾아보기 335


[본 문]

책은 독자가 중학교 수학 정도의 기초를 가지고 있다는 가정하에 작성되었다. 만약 책에서 소개하는 확률의 각도에서 통계의 기본 방법에 대해 이해하려 한다면 본 책은 통계학의 입문 참고서 역할을 할 수 있을 것이다. 그 외에도 필자가 업계에서 얻은 경험과 융합하여 통계적 사고방식과 빅데이터 응용 실무의 소개에 좀 더 초점을 두었다. 책에서 소개된 모든 공식을 배제한다고 하더라도 책을 읽는 데 큰 영향은 없으며, 빅데이터나 인공지능 시대의 통계학 자료로 사용해도 손색이 없을 것이다. _xix쪽



식스시그마는 본질적으로 봤을 때 한 세트의 관리 체계다. 핵심은 생산 프로세스 개선과 품질 결점 제거에 있으며, 품질 제어와 관련된 다수의 통계 방법을 포함하고 있다. 여기서 우리는 식스시그마의 응용 방법과 관리학적 의미를 살펴볼 것이다. ‘식스시그마’에 내포된 통계적 사고에 초점을 두고 토론할 텐데, 이는 소확률(smallprobability)의 개념이라는 것을 염두에 두자. _40쪽



이번에 행렬에 관한 기본 개념과 계산 방법에 대해 설명했다. 비록 수학 지식에 속하지만 주로 계산에 집중하고 증명은 하지 않았기에 연습이나 컴퓨터를 활용해 더 심도 있게 이해할 수 있을 것이다. 5.2.4절 ‘필자가 가장 사랑하는 R’에서 R 언어에 대해 소개하는데, R 언어는 간단한 수학/과학 분야 프로그래밍 언어다. 특히, 행렬 계산에 익숙하다면 R 언어의 함수를 활용해 이번에 소개한 행렬의 기본 조작을 검증할 수 있을 것이다. _70쪽



거의 모든 통계 프로그램이 히스토그램 기능을 포함하고 있으며, 우리가 손수 가로축의 구간과 계산 개수를 나눌 필요가 없다. 그저 막대의 개수(너무 밀집되어 있거나 널찍하면 미관상 좋지 못하다)만 정하면 자동으로 히스토그램이 완성된다. 우리는 아주 편리하게 히스토그램으로 데이터의 분포 특징을 관찰하면 된다. 예를 들어, 그림 3.13에서처럼 분출 지속 시간과 시간 간격이 쌍봉 분포를 이룬다는 것을 확연하게 알 수 있다. 다시 말해, 2개의 중심점을 기준으로 파동친다는 의미다. _141쪽



이상으로 다차원 데이터(10개의 스포츠 항목, 10차원)의 주성분분석 사례를 소개했다. 분석 관점은 주로 변수 간의 관계에 대해 해석하는 것이었으며, 이 역시 주성분분석의 주요 응용 중 하나다. 이런 방법의 응용 범위는 당연히 이보다 많으며 클러스터링 분석이나 모델링 지수 등에도 활용할 수 있다. 구체적인 응용과 수학 원리에 대해 알고 싶다면 PCA 방법에 대한 전문적인 자료를 살펴보기 바란다. _172쪽



현재 인공지능의 주요 기술은 뉴럴 네트워크 모델의 연장선인 딥러닝(deep learning)이다. 솔직히 말해 딥러닝은 머신러닝의 한 종류이며, 하나의 분류 방법이다. 의사결정 나무, 서포트 벡터 머신 등의 방법과 같다고 보면 된다. 그러나 딥러닝의 구조는 사람의 신경 계통을 모방하여 만들었기에 많은 인지 문제에서 탁월한 효과를 발휘한다. 그리고 GPU를 통해 매우 쉽게 병렬 컴퓨팅이 가능하기 때문에 하나의 큰 분석 영역으로 자주 인식되고 있다. _204쪽
펼쳐보기
재미와 지혜로 가득찬 96가지의 통계 이야기!
중국에서 가장 많이 판매되는 통계/인공지능 교양 서적!

이 책은 통계학의 고전부터 최신까지 거시적 이론 프레임에 대한 이해도가 높은 저자가 통계학 이론 발전의 주요 이야기, 사례, 역사적 사건을 96가지의 재미난 이야기로 풀어내고 있다.

문자와 수학 공식이 아름답게 조화를 이루고 있는 이 책은 통계학부터 시작하여 데이터와 수학, 그리고 데이터 시각화까지 논의한다. 당연히 통계 모델과 방법뿐만 아니라 빅데이터 기술과 데이터의 함정에 관해 기술하는 것도 잊지 않고 있다. 각 장마다 포함하고 있는 의미는 매우 독특하며, 현존하는 그 어떤 전문 서적이나 교재와는 차원이 다르다. 책의 구조 설계는 휘황찬란하고, 토론하는 문제는 심오하고도 소박하며, 내용은 과거부터 미래까지 모두 아울렀다. 각 장 말미에는 짧고 간결하며 고전적이면서도 심오한 이야기와 사례가 담겨 있다. 이야기에는 통계학의 지혜와 지식이 넘쳐난다. 이런 간결하고 고전적인 이야기를 통해 사람들은 비로서 통계의 아름다움을 느낄 수 있을 것이다.




이 책의 대상 독자
 중학교 수학과 확률론 정도의 배경지식을 갖춘 분


 통계적 사고방식과 빅데이터 실무를 갖추고 싶은 분
 인공지능 시대의 통계 개념을 좀 더 쉽게 이해하고자 하는 분
 머신러닝에 관심이 많은 프로그래머나 통계 관련 업계에 종사하는 분

추천사

오늘날과 같이 데이터가 풍부한 시대에서의 좋은 책은 지식을 체계적으로 구성해야 할 뿐만 아니라 지식의 즐거움과 아름다움을 이끌어내는 것이 중요하다. 독자들에게 학습에 대한 흥미를 제공하는 동시에 동기부여가 되어야 하는데, 이 책은 이러한 조건을 훌륭하게 채웠다.
신뢰할 만한 자료를 인용하여 주장하는 바를 증명하였고, 데이터 사이언스에 관한 다양한 예제를 포함하였다. 역사적으로 유명한 이야기, 일상생활에서의 재밌는 이야기, 인터넷에서 화제가 되었던 주제, 그리고 SF와 무협 소설의 장면은 모두 저자가 통계학 개념과 방법을 설명하는 데 더할 나위 없이 좋은 예제가 되었다.
심혈을 기울여 선정한 재밌는 문제를 중심으로 분석과 토론을 진행하고 해결 방법을 제시함과 동시에 통계학의 중요한 개념과 방법을 도출했다. 이 책을 다 읽고 나면 일상 속에서 통계학이 어떻게 응용되는지를 깊게 느낄 수 있을 것이다.
― 진쯔후이(Rick Jin), 훠광야오예(Flickering.ai) 대표

수학이라는 가면을 쓴 통계 교과서의 작가들이 이 책의 스타일을 조금이나마 따라 했다면, 분명 더 많은 젊은이가 데이터 사이언스 관련 일을 할
수 있었을 것이다.
_ 우시즈(吴喜之), 중국인민대학교 교수

이 책은 우아한 글로 곳곳에 숨겨져 있는 질서와 깊은 아름다움을 어떻게 정량적 시각으로 이해해야 하는지 알려주었다. 빅데이터와 인공지능 시대에 조화롭게 어울리고 싶다면 이 책을 놓치면 안 된다.
_ 저우타오(周涛), 전자과학대학교 교수

이 책은 교과서 스타일을 빌린 뛰어난 통계학 서적이다. 꾸밈없는 글과 상세하면서도 재치 넘치는 예제로 통계학의 실용적 가치와 매력적인 부분을 설명하였다. 통계학은 하나의 기술일 뿐만 아니라 우리가 알아가고 이해해야 하는 이 세상의 ‘이치’다.
_ 떵이쒀(邓一硕), 란터우즈(Lazy Investment) CFO이자 ‘통찌즈두(통계의 도시)’ 회원

견고한 이론, 독특한 사고방식, 재밌는 응용 분야, 여기에 생동감 넘치는 이야기가 에피타이저처럼 더해져 독자들에게 성대한 통계학 만찬을 선물한다.
_ 츄이쉬엔(邱怡轩), 퍼듀대학교 통계학 박사이자 ‘통찌즈두(통계의 도시)’ 회원


이 책에 수록된 96가지의 통계 이야기는 하나같이 재밌고, 흥미진진하며, 지혜가 넘친다. 글을 읽노라면 마치 봄바람을 맞으며 향긋한 술을 넘기는 듯하다.
_ 웨이타이윈(魏太云), 바이풘디엔(Percent) 데이터 모델링 부서 책임자이자 ‘통찌즈두(통계의 도시)’ 회원

펼쳐보기
리찌엔(李舰)
통계학 학사, 소프트웨어 공학 석사, 상업학 박사
데이터 사이언스 분야에서 다년간 근무하였다. 통계학이 냉대받던 시절부터 인기 과목이 된 현재까지의 산 증인인 ‘통계의 도시(https://cosx.org/)’ 핵심 회원 중 한 명이다. 오픈소스 커뮤니티에서도 활발하게 활동하고 있으며, 데이터 사이언스가 업계에서 제대로 응용될 수 있도록 힘쓰고 있다.

하이언(海恩)
실리콘밸리에 있는 유명 인터넷 업체에서 데이터 분석 업무를 맡고 있다. 시간이 날 때는 각종 데이터를 모아 재미있는 분석을 하며 지낸다.



옮긴이 김슬기
현재 LG CNS 스마트팩토리사업부에서 스마트물류 구축 프로젝트를 하고 있다. 북경대학교를 졸업하고 바이탈힌트 차이나에서 정량 마케팅 업무를 하며 데이터 분석을 시작했다. 약 15년간 중국에서 거주하였고, 다양한 분야에서 수년간 통역 및 번역 일도 하였다.


펼쳐보기

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.
도서평점
내용
등록하기
0/2000자
맨위로가기


영풍문고 로고

  • 회사명 : (주)영풍문고
  • 대표이사 : 최영일
  • 소재지 : 서울특별시 강남구 강남대로 542번지 (우)06110
  • 사업자 등록번호 : 773-86-01800 ㅣ 통신판매업 신고번호 : 2020-서울강남-01007 [ 사업자정보확인 ]
  • 개인정보관리 책임자 : 조순제 ㅣ E-mail : customer@ypbooks.co.kr ㅣ 대량주문 : 02-519-2860
COPYRIGHT © YOUNGPOONG BOOKSTORE INC. ALL RIGHTS RESERVED.
맨위로가기