1. 광고배너
  2. 광고배너
/ 이전버튼 다음버튼
2
미리보기

실무 예제로 끝내는 R 데이터 분석
저자 : 정준영 ㅣ 출판사 : 비제이퍼블릭

2021.09.07 ㅣ 344p ㅣ ISBN-13 : 9791165920883

정가22,000
판매가19,800(10% 할인)
적립금 1,100원 (5%)
배송일정 05월 08일 출고 가능
주문 수량 변경시 안내 배송안내
쿠폰 및 결제혜택 확인하기

크기 규격 외(248mm X 176mm, 크라운판)
제품구성 단행본
이용약관 청약철회
국내도서 > 컴퓨터 > 시스템공학 > 데이타베이스/자료구...
현장의 데이터 분석 프로젝트 전 과정 수록!
‘데이터를 어떻게 구해와서 어떤 프로세스로 분석해야 하는가?’에 대한
명확한 해답을 제시한다!

데이터에 숨겨진 ‘보물’을 발굴하기 위한 보물찾기 도구와 그 도구를 다루는 요령을 설명한다. 이 책을 통해 데이터 수집, 정제, 분석, 시각화까지 실제 현업에서 데이터 분석 프로젝트를 진행하는 모든 과정을 경험할 수 있고, 정형 데이터와 비정형 데이터를 활용한 단계별 데이터 분석 프로세스를 학습할 수 있다.


업무에 바로 적용 가능한 실무 예제와 프로젝트!

이 책은 실습 중심의 책이다. YouTube 채널 정보 및 댓글 감성 분석, KOSPI 지수 예측 및 회귀 모델링, 광고 효과 검증, 카페 매출 분석, OPEN API를 활용한 뉴스 키워드 분석과 같은 실무 예제를 다룬다. 특히 마지막 챕터에서는 데이터 분석 기획부터 시각화까지 수행하는 실무 프로젝트를 진행하여, 이를 통해 현장 감각을 익히고 업무에 바로 써먹는 실전 데이터 활용법을 마스터할 수 있다.

펼쳐보기

[목 차]

l Chapter 01 l 현장의 데이터 분석 과정 이해하기

1장. 왜 분석을 하는가?
1.1 데이터 이야기
1.2 문제 정의 육하원칙
1.3 데이터 분석에 필요한 기술
1.4 데이터 분석 적용 사례

2장. 분석 주제에 맞는 데이터 가져오기
2.1 데이터 수집이란?
2.2 데이터 전처리(Data Pre-processing)란?
2.3 데이터 확인하기
2.4 결측치 처리하기
____ 2.4.1 결측치 확인하기
____ 2.4.2 결측치 제거하기
____ 2.4.3 결측치 대체하기
2.5 이상치 처리하기
____ 2.5.1 논리적으로 존재할 수 없는 이상치 처리하기
____ 2.5.1 논리적으로 존재할 수 있는 이상치 처리하기
2.6 피처 엔지니어링(Feature Engineering)

3장. 분석 주제 구체화하기
3.1 탐색적 데이터 분석(Exploratory Data Analysis)이란?
3.2 탐색적 데이터 분석 프로세스

4장. 데이터 분석 수행하기
4.1 통계적 가설 검정(Statistical Hypothesis Testing)
4.2 기계 학습(Machine Learning)
4.3 시각화(Visualization)
4.4 결론 도출


l Chapter 02 l 데이터 분석 프로젝트(1) - 정형 데이터에서 보물 찾기

5장. 지난 1년간 카페에는 어떤 일이 있었을까?
5.1 readxl 패키지를 이용하여 엑셀 데이터 불러오기
5.2 카페에서 가장 많이 판매한 메뉴 확인하기
5.3 요일별로 판매한 메뉴 확인하기
5.4 계절별로 판매한 메뉴 확인하기
5.5 R에서 시각화하기
____ 5.5.1 R 그래프, 무엇이 있는가?
____ 5.5.2 R 시각화 대표 패키지 ggplot2
____ 5.5.3 ggplot2 패키지를 이용한 시각화 예시
5.6 매출 현황 그래프로 분석하기
____ 5.6.1 카테고리별 판매 건수 시각화하기
____ 5.6.2 월별 판매 건수 시각화하기
____ 5.6.3 요일별 판매 건수 시각화하기

6장. 광고, 정말 효과가 있을까?
6.1 엑셀 데이터 불러오기
6.2 광고 효과 분석을 위한 목표 설정하기
6.3 raster 패키지를 이용하여 대한민국 지도 그리기
6.4 stats 패키지 기반 통계적 검정하기
6.5 ggplot1 패키지를 이용하여 광고 효과가 없는 지역 표현하기

7장. KOSPI 예측이 가능할까?
7.1 KOSPI 데이터 불러오기
7.2 ggplot2 패키지를 이용하여 KOSPI 지수 시각화하기
7.3 시계열 데이터 이해하기
____ 7.3.1 시계열 데이터 분석을 위한 예측 변수
____ 7.3.2 시계열의 구성 요소
____ 7.3.3 시도표 이해하기
7.4 stats 패키지로 KOSPI 지수 분해하기
7.5 forecast 패키지로 시계열 회귀 모형 만들기
____ 7.5.1 단순 선형 회귀
____ 7.5.2 다중 선형 회귀
____ 7.5.3 적절한 독립 변수
7.6 auto.arima를 이용하여 KOSPI 지수 예측하기
____ 7.6.1 정상성과 차분
____ 7.6.2 auto.arima 활용하기


l Chapter 03 l 데이터 분석 프로젝트(2) ? 비정형 데이터에서 보물 찾기

8장. 오늘의 뉴스 키워드 분석하기
8.1 뉴스 데이터를 수집하기 위한 네이버 검색 API 준비하기
8.2 httr 패키지를 이용하여 뉴스 데이터 수집하기
8.3 자연어 처리 이해하기
8.4 KoNLP 패키지를 이용하여 한글 자연어 처리하기
____ 8.4.1 KoNLP 패키지 설치하기
____ 8.4.2 전기자동차 관련 뉴스 수집하기
____ 8.4.3 뉴스 데이터 분석하기
8.5 wordcloud 패키지를 이용한 워드클라우드
____ 8.5.1 wordcloud 패키지를 이용한 시각화
____ 8.5.2 wordcloud2 패키지를 이용한 시각화
8.6 오늘의 뉴스 그래프로 분석하기

9장. YouTube 댓글 키워드를 활용하여 감성 분석하기
9.1 YouTube 댓글을 수집하기 위한 YouTube API 준비하기
____ 9.1.1 구글 API 프로젝트 생성하기
____ 9.1.2 구글 OAuth 동의 화면 활성화하기
____ 9.1.3 YouTube Data API 사용 신청하기
9.2 YouTube 댓글 수집하기
____ 9.2.1 OAuth 권한 연동하기
____ 9.2.2 YouTube 채널 및 영상 통계 정보 수집·분석하기
____ 9.2.3 YouTube 채널 및 영상 댓글 수집하기
9.3 RcppMeCap 패키지를 이용하여 한글 자연어 처리하기
____ 9.3.1 RcppMeCap 패키지 설치하기
____ 9.3.2 RcppMeCap 패키지를 이용하여 형태소 분석하기
9.4 긍·부정 사전 구축하기
9.5 긍·부정 사전을 이용하여 감성 분석하기


l Chapter 04 l 데이터 분석 기획부터 시각화까지

10장. R 패키지를 활용한 논문 분석 시스템 구축하기
10.1 분석 서비스 기획하기
10.2 논문 분석 시스템 설계하기
10.3 공공 API를 이용하여 학위 논문 수집하기
_____ 10.3.1 공공 데이터 API 인증키 발급하기
_____ 10.3.2 오픈 API 호출하기
_____ 10.3.3 오픈 API 호출 결과 파싱하기
10.4 논문 정형 데이터 분석하기
_____ 10.4.1 자료 구분별 논문 데이터 분석하기
_____ 10.4.2 학술 출판사에 따라 논문 데이터 분석하기
_____ 10.4.3 정규 표현식을 이용한 정형 데이터 분석
10.5 논문 비정형 데이터 분석하기
_____ 10.5.1 논문 제목 분석하기
_____ 10.5.2 논문 초록 분석하기
10.6 tm 패키지를 이용하여 Term Document Matrix 생성하기
_____ 10.6.1 Bag-of-words
_____ 10.6.2 문서 단어 행렬(Document-Term Matrix)
_____ 10.6.3 TF-IDF(Term Frequency-Inverse Document Frequency)
10.7 LDA Topic modeling을 이용하여 논문 주제 도출하기
10.8 shiny 패키지를 이용하여 논문 분석 시스템 웹 화면 구축하기
_____ 10.8.1 shiny란
_____ 10.8.2 논문 분석 시스템 구축하기


[본 문]

데이터란 다양한 상황에서 남겨진 흔적과 같습니다. 데이터 분석을 통해 그 흔적을 추적하여 당시 어떤 상황이었는지 판단하기도 하며, 추측한 상황이 닥칠 경우에 어떠한 조치를 취해야 하는지 미리 의사결정을 해 두는 역할을 하기도 합니다. 이처럼 데이터 분석가는 데이터 속에 숨겨진 ‘보물’을 찾기 위해 다양한 기법을 익히고 데이터 분석 과정을 수행합니다.

이 책에는 데이터 분석가에게 꼭 필요한 5가지 실무 예제와 필자가 데이터 분석 프로젝트를 수행하며 사용했던 기술과 노하우가 담겨 있습니다. R을 배웠으나 프로젝트를 당장 수행하기에 막막함을 느끼고 프로젝트 과정을 궁금해하는 분을 위해 데이터 분석 프로젝트에 대한 전반을 소개하였으며, 독자 여러분이 이를 현장에서 바로 적용할 수 있을 것으로 기대합니다.
- 서문 중에서

펼쳐보기
빅데이터 시대의 핵심 인재,
‘데이터 사이언티스트’가 되려는 당신에게 꼭 필요한 책!

R은 통계에 최적화된 프로그래밍 언어이자, 성공적인 데이터 분석을 위한 오픈소스 프로그램이다. 데이터 분석이 시대의 키워드이자 흐름인 만큼 많은 패키지와 테스트 셋을 제공하는 R의 인기가 갈수록 높아지고 있다.

현업에서는 R을 활용한 데이터 분석 업무 수행 시 프로세스 자체를 이해하는 것이 중요한데, 이 책은 데이터 분석 프로젝트가 진행되는 전반적인 과정에서 실제 수행하는 액션(Action)에 초점을 맞추었기 때문에 실전 프로젝트에 적용 가능한 스킬을 익히고자 하는 데이터 분석가(Data Analyst)에게 많은 도움이 될 것이다. 이 책을 통해 데이터로부터 숨겨진 보물을 발굴하는 것을 넘어, 데이터 분석을 통해 인사이트까지 도출해내는 실전형 데이터 사이언티스트(Data Scientist)로 거듭나길 바란다.

소스코드 다운로드: https://github.com/bjpublic/R_data



추천사

이 책은 R을 선택한 초심자에게 아주 친절하게 다가옵니다. 명령어 한 줄 한 줄 실행했을 때 느낄 수 있는 불안감을 친근한 말투로 감싸줍니다. 데이터 전처리를 통해 몸에 물을 적시어 준비운동을 하고, 정형 데이터로 EDA, 통계검정, 시계열예측을 통해 몸풀기를 시켜줍니다. 마지막으로 뉴스 키워드와 YouTube 댓글이라는 결코 쉽지만은 않은 데이터를 수집하고 분석하는 과정까지 함께함으로써 자신감을 심어줍니다. 이 책을 발판으로 조금 더 어려운 문제와 공모전에 도전하며 스스로 실력을 향상할 자신감을 키울 수 있을 것입니다.
- 이제현(한국에너지기술연구원)

폭발하는 데이터 홍수 속에서 우리에게 필요한 정보를 만들어 내는 비장의 무기는 ‘R’ 언어입니다. 이 책은 데이터를 취득하고 가공하며 의미 있는 정보를 추출하여 인상적인 그래프를 그릴 수 있는 일련의 데이터 분석 과정을 구체적인 예제를 통해 알기 쉽게 표현하고 있습니다. 이 책은 자영업자에게는 ‘영업 실적 분석’, 학생에게는 ‘논문 자료 분석’, 유튜버에게는 ’댓글 분석’, 투자자에게는 ’증권 데이터 분석’과 같은 소중한 정보 분석 방법을 구체적인 데이터와 함께 제시합니다. R과 함께 데이터 분석의 전문가가 되고자 하는 사람들에게 추천합니다.
- 박정규(한양대학교 공대 겸임교수)

슈카월드 등 유명 YouTube 구독 정보 및 댓글 감성 분석, KOSPI 지수 회귀 모델링, 광고 효과 검증, 네이버 API를 활용한 뉴스 키워드 분석 등 사이드 잡 혹은 일상에 유용하게 활용할 수 있는 재미있는 예제들을 통해 R, 시각화, 시계열, 모델링, 검정, NLP 등을 쉽게 익힐 수 있습니다. 특히, AI 연구 결과가 폭주하는 요즘 개인적으로 논문을 수집 및 요약하는 일이 고된 과업이었는데 ‘10장 R 패키지를 활용한 논문 분석 시스템 구축하기’ 덕분에 시간을 절약하는 데 큰 도움이 되었습니다. R과 통계의 입문에서 중급으로 넘어가는 분들께 특히 추천하고 싶습니다.
- 허 민(한국외국어대학교 데이터 분석가)

펼쳐보기
정준영
국민대학교 비즈니스IT전문대학원에서 비즈니스IT를 전공하고 경영정보학 석사 학위를 받았다. 금융, 제조, 정유, 미디어 등의 SI 프로젝트에 참여하며 IT 생태계를 경험했다. 현재는 RTDataLab에서 AI를 이용한 차량 내 공기질 진단 솔루션을 연구하고 있으며 관련 특허도 출원했다. 솔루션 R의 활용도를 검증하기 위해 R을 이용하여 다른 언어로 구성된 프로그램을 재현해왔고, R과 태블로를 이용한 프로젝트 결과를 기록한 블로그를 운영 중이다.

현) 알티데이터랩 차량 내 공기질 진단 솔루션 기술 연구
- 국내외 빅데이터 관련 우수 학회 및 저널 다수 등재
- 알티캐스트 혁신 사업 실시간 로그 분석 시스템 개발
- 알티캐스트 데이터 사업 텍스트 기반 반도체 Tech Sensing 시스템 개발
- 알티캐스트 데이터 사업 공유 주방 AI 서비스 및 모니터링 시스템 개발
- 알티캐스트 데이터 사업 Smart Marketing Platform 개발

블로그 https://jaydata.tistory.com/


펼쳐보기

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.
도서평점
내용
등록하기
0/2000자
교환/반품 방법
  • 마이페이지 > 주문관리 > 주문/배송조회 > 주문조회 후  [1:1상담신청]  또는 고객센터 (1544-9020)
  • ※ 오픈마켓, 해외배송 주문상품 문의 시 [1:1상담신청] 또는 고객센터 (1544-9020)
교환/반품 가능기간
  • 변심반품의 경우 수령 후 7일 이내
  • 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
교환/반품 비용
  • 단순변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 해외직배송 도서 구매 후 단순변심에 의한 취소 및 반품 시 도서판매가의 20% 수수료 부과
교환/반품 불가사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 만화, 잡지, 수험서 및 문제집류
  • 복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
상품 품절
  • 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기 >

    이 분야의 신간

    더보기 >
      맨위로가기

      영풍문고 로고

      • 회사명 : (주)영풍문고
      • 대표이사 : 김경환
      • 소재지 : 서울특별시 종로구 청계천로 41 (우)03188
      • 사업자 등록번호 : 773-86-01800 ㅣ 통신판매업 신고번호 : 2023-서울종로-0130 [ 사업자정보확인 ]
      • 개인정보관리 책임자 : 조순제 ㅣ customer@ypbooks.co.kr ㅣ 대량주문 : webmaster@ypbooks.co.kr
      COPYRIGHT © YOUNGPOONG BOOKSTORE INC. ALL RIGHTS RESERVED.
      영풍문고 네이버블로그 영풍문고 인스타그램
      맨위로가기