1. 광고배너
  2. 광고배너
/ 이전버튼 다음버튼
2
미리보기

파이썬과 자연어 처리-파이썬과 함께하는 NLP 애플리케이션 만들기(ACORN+PACKT TECHNICAL BOOK)
저자 : 딥티초프라,니쉬트조쉬,이티마투르 ㅣ 출판사 : 에이콘출판 ㅣ 역자 : 유연재

2017.07.25 ㅣ 320p ㅣ ISBN-13 : 9791161750255

정가28,000
판매가25,200(10% 할인)
적립금 1,400원 (5%)
배송일정 05월 02일 출고 가능
주문 수량 변경시 안내 배송안내
쿠폰 및 결제혜택 확인하기

크기 기타 규격
제품구성 단행본
이용약관 청약철회
국내도서 > 컴퓨터 > 인터넷 > 웹프로그래밍(웹디자...
자연어 처리는 인간과 컴퓨터 간의 상호 작용에 관련된 인공지능(AI) 분야의 하나다. 이 책은 파이썬을 이용해 자연어 처리 애플리케이션을 개발하는 데 필요한 기술을 배우고, 이를 실제로 활용할 수 있도록 하는 지침서다. 자연 언어에 대한 기본 개념과 문자열 매칭, 스테머, 파싱, 의미 분석, 감정 분석, 정보 검색 등의 활용 예제를 살펴보며 독자들이 파이썬을 통해 자연어 처리를 빠르게 학습할 수 있도록 도와줄 것이다.
펼쳐보기

[목 차]

1장. 문자열을 사용한 작업
__토큰화
____텍스트를 문장으로 토큰화
____다양한 언어의 텍스트 토큰화
____문장을 단어로 토큰화
____TreebankWordTokenizer를 사용한 토큰화
____정규 표현식을 사용한 토큰화
__정규화
____문장 부호 제거
____소문자와 대문자로 변환
____불용어 처리
____영어의 불용어 계산
__토큰의 대체 및 수정
____정규 표현식을 사용한 단어 대체
____텍스트를 다른 텍스트로 대체하는 예제
____토큰화 전에 대체 수행
____반복되는 문자 처리
____반복 문자를 삭제하는 예제
____단어를 동의어로 대체
____단어를 동의어로 대체하는 예제
__텍스트에 지프의 법칙 적용
__유사 척도
____편집 거리 알고리즘을 사용한 유사 척도
____자카드 계수를 사용한 유사 척도
____스미스 워터맨 거리를 사용한 유사 척도 적용
____그 외 문자열 유사도 메트릭
__요약

2장. 통계 언어 모델링
__단어 빈도 이해
____주어진 텍스트의 MLE 개발
____은닉 마르코프 모델 추정
__MLE 모델의 스무딩 적용
____에드온 스무딩
____Good Turing
____크네저 네이 추정
____위튼 벨 추정
__MLE의 백-오프 메커니즘 개발
__믹스 앤 매치를 얻기 위한 데이터 보간법 적용
__혼잡도를 통한 언어 모델 평가
__모델링 언어에서 메트로폴리스 헤이스팅스 적용
__언어 처리에서 깁스 샘플링 적용
__요약

3장. 형태학 ? 시작하기
__형태학 소개
__스테머 이해
__원형복원 이해
__비영어 언어의 스테머 개발
__형태소 분석기
__형태소 생성기
__검색 엔진
__요약

4장. 품사 태깅 - 단어 식별
__품사 태깅 소개
____기본 태깅
__POS-tagged corpora 생성
__기계 학습 알고리즘 선택
__n-gram 접근법과 관련된 통계 모델링
__pos-tagged data를 사용한 청커 개발
__요약

5장. 파싱 - 훈련 데이터 분석
__파싱 소개
__트리뱅크 구성
__트리뱅크의 문맥 자유 문법 규칙 추출
__CFG에서 확률적 문맥 자유 문법 생성
__CYK 차트 파싱 알고리즘
__Earley 차트 파싱 알고리즘
__요약

6장. 의미 분석 - 본질 표현
__의미 분석 소개
____NER 소개
____은닉 마르코프 모델을 사용한 NER 시스템
____기계 학습 툴킷을 사용한 NER 훈련
____POS 태깅을 사용한 NER
__Wordnet의 synset id 생성
__Wordnet을 사용한 의미 판별
__요약

7장. 감정 분석 - 나는 행복하다.
__감정 분석 소개
____NER를 사용한 감정 분석
____기계 학습을 사용한 감정 분석
____NER 시스템의 평가
__요약

8장. 정보 검색 - 정보 접속
__정보 검색 소개
____불용어 제거
____벡터 공간 모델을 사용한 정보 검색
__벡터 공간 스코링 및 질의 연산자 상호 작용
__잠재 의미 색인을 이용한 IR 시스템 개발
__텍스트 요약
__질의 응답 시스템
__요약

9장. 담화 분석 - 아는 것은 믿는 것이다.
__담화 분석 소개
____중심화 이론을 사용한 담화 분석
____대용어복원
__요약

10장. NLP 시스템의 평가 - 성능 분석
__NLP 시스템 평가의 필요성
____NLP 도구(POS 태거, 스테머, 형태소 분석기) 평가
____골드 데이터를 사용한 파서 평가
__IR 시스템의 평가
__오류 식별 메트릭
__어휘 매칭 기반 메트릭
__구문 매칭 기반 메트릭
__얕은 의미 매칭을 사용한 메트릭
__요약
펼쳐보기
★ 이 책에서 다루는 내용 ★
■ 문자열 매칭 알고리즘 및 정규화 기술 구현
■ 통계 언어 모델링 기법 구현
■ 스테머, 원형화기, 형태소 생성기 개발에 대한 통찰력 습득
■ 검색 엔진 개발, n-gram 접근법과 관련된 POS 태깅 개념 및 통계 모델링 개념 구현
■ 트리뱅크(Treebank) 구조, CFG 생성, CYK 차트 파싱 알고리즘 및 Earley 차트 파싱 알고리즘 개념 습득
■ NER 기반 시스템 개발과 감정 분석의 개념 이해 및 적용
■ 정보 검색 및 텍스트 요약의 개념 이해 및 구현
■ 담화 분석 시스템 및 대용어 복원(anaphora resolution) 기반 시스템 개발

★ 이 책의 대상 독자 ★
합리적인 지식 수준과 파이썬에 대한 이해를 바탕으로 NLP 중급 개발자를 대상으로 한다.

★ 이 책의 구성 ★
1장, ‘문자열을 사용한 작업’에서는 토큰화와 정규화 같은 텍스트에 대한 사전 처리 작업을 수행하는 방법과 다양한 문자열 매칭 방법을 설명한다.
2장, ‘통계 언어 모델링’에서는 단어 빈도를 계산하고 다양한 언어 모델링 기법을 수행하는 방법을 다룬다.
3장, ‘형태학 ? 시작하다’에서는 스테머, 형태소 분석기 및 형태소 생성기 개발 방법을 다룬다.
4장, ‘품사 태깅 - 단어 식별’에서는 품사 태깅 및 n-gram 접근법을 포함한 통계 모델링을 다룬다.
5장, ‘파싱 - 훈련 데이터 분석’에서는 트리 뱅크 구성, CFG 구성, CYK 알고리즘, 차트 파싱 알고리즘 및 음역의 개념에 대한 정보를 살펴본다.
6장, ‘의미 분석 ? 본질 표현’에서는 얕은 의미 분석과 WordNet을 사용하는 WSD의 개념과 애플리케이션에 대해 살펴본다.
7장, ‘감정 분석 ? 나는 행복하다’에서는 감정 분석의 개념을 이해하고 적용하는 데 도움이 되는 정보를 제공한다.
8장, ‘정보 검색 - 정보 접속’에서는 정보 검색 및 텍스트 요약의 개념을 이해하고 적용한다.
9장, ‘담화 분석 - 아는 것은 믿는 것이다’에서는 담화 분석 시스템과 대용어 복원 기반 시스템을 개발한다.
10장, ‘NLP 시스템의 평가 - 성능 분석’에서는 NLP 시스템을 평가하는 개념을 이해하고 적용하는 방법에 대해 살펴본다.

★ 옮긴이의 말 ★
파이썬은 네덜란드 개발자 귀도 반 로섬(Guido van Rossum)이 만든 프로그래밍 언어 중 하나다. 파이썬은 문법이 복잡하지 않고 쉬워서 초보자들도 쉽게 다가갈 수 있는 인터프리터 프로그래밍 언어다. 하지만 우리나라의 경우 C, JAVA 중심의 프로그래밍 환경이 대중적이라서 파이썬 같은 그 외의 프로그래밍 언어는 접해볼 수 있는 기회가 적다. 심지어 10년 넘게 프로그래머 개발자로 근무한 나의 경우에도 파이썬을 접한 것은 불과 수 년 전이었다.
파이썬은 미국에서 교육용 프로그래밍 언어로 사용하면서 점차 세계적으로 인기를 얻기 시작했고 파이썬을 사용하는 기업과 프로그래머도 증가했다. 이제 국내 대학에서도 교양 수업으로 파이썬을 채택하고 있다. 또한 수많은 라이브러리의 제공으로 자연어 처리, 머신 러닝 등의 분야에서 파이썬을 사용하고 있다.
이 책은 파이썬을 이용한 자연어 처리(NLP)를 다룬다. 자연 언어는 최근에 새롭게 등장한 개념이 아니다. 예전부터 연구됐던 인공지능의 한 분야다. 자연 언어라는 개념이 생소한 독자들은 내용을 이해하는 데 약간의 어려움도 있을 것이다. 개인적으로는 이 책을 살펴보기 전에 학창 시절 배웠던 문장 및 언어의 기본 구조를 살펴보는 것을 추천한다. 이 책을 이해하는 데 많은 도움이 될 것이다. 또한 파이썬 기본서가 아니기에 파이썬에 대한 기본 지식이 있는 독자를 대상으로 한다. 독자들은 이 책으로 문자열 매칭, 알고리즘 및 정규화 기술 구현, 스테머, 검색 엔진 개발, 담화 분석 등을 다양한 예제와 함께 살펴보면서 점점 능숙하게 자연 언어를 처리하는 자신을 발견할 수 있을 것이다.
펼쳐보기
딥티 초프라(Deepti Chopra)
바나스탈리 대학(Banasthali University)의 조교수다. 주요 연구 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회에서도 활동하고 있다.

니쉬트 조쉬(Nisheeth Joshi)
바나스탈리 대학(Banasthali University)의 부교수다. 관심 분야는 전산 언어학, 자연어 처리 및 인공지능이다. 인도에서 언어 기술 기금 및 연구(Language Technology Funding and Research)를 총괄하는 최상위 기관인 인도 정부(Govt) 정보 기술부(Department of Information Technology)에서 TDIL 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로도 활동한다.

이티 마투르(Iti Mathur)
바나스탈리 대학(Banasthali University)의 조교수다. 관심 분야는 전산 의미론 및 온톨로지 공학(ontological engineering)이다. 인도 정부(Govt)의 전자 정보 기술부(Department of Electronics and Information Technology,DeitY TDIL) 프로그램의 배심 전문가로도 활동하고 있다. 여러 저널 및 컨퍼런스에서 간행물을 발간했으며 관련 프로그램 위원회 및 편집 위원으로 활동한다.



옮긴이 유연재
동국대학교 재학 중이던 2002년부터 여러 회사에서 개발 업무로 경력을 쌓아 왔다. 현재는 더케이손해보험에서 일반보험시스템 개발 업무를 담당하고 있다. IT에 관해서는 편식하지 않고 다양한 분야에서 멀티플레이어가 되려고 노력하는 프로그래머다. 옮긴 책으로는 에이콘출판사에서 출간한 『자바 네트워크 프로그래밍』(2016)이 있다.
펼쳐보기

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.
도서평점
내용
등록하기
0/2000자
교환/반품 방법
  • 마이페이지 > 주문관리 > 주문/배송조회 > 주문조회 후  [1:1상담신청]  또는 고객센터 (1544-9020)
  • ※ 오픈마켓, 해외배송 주문상품 문의 시 [1:1상담신청] 또는 고객센터 (1544-9020)
교환/반품 가능기간
  • 변심반품의 경우 수령 후 7일 이내
  • 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
교환/반품 비용
  • 단순변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 해외직배송 도서 구매 후 단순변심에 의한 취소 및 반품 시 도서판매가의 20% 수수료 부과
교환/반품 불가사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 만화, 잡지, 수험서 및 문제집류
  • 복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
상품 품절
  • 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기 >

    이 분야의 신간

    더보기 >
      맨위로가기

      영풍문고 로고

      • 회사명 : (주)영풍문고
      • 대표이사 : 김경환
      • 소재지 : 서울특별시 종로구 청계천로 41 (우)03188
      • 사업자 등록번호 : 773-86-01800 ㅣ 통신판매업 신고번호 : 2023-서울종로-0130 [ 사업자정보확인 ]
      • 개인정보관리 책임자 : 조순제 ㅣ customer@ypbooks.co.kr ㅣ 대량주문 : webmaster@ypbooks.co.kr
      COPYRIGHT © YOUNGPOONG BOOKSTORE INC. ALL RIGHTS RESERVED.
      영풍문고 네이버블로그 영풍문고 인스타그램
      맨위로가기