1. 광고배너
  2. 광고배너
/ 이전버튼 다음버튼
2
미리보기

클라우드 API를 활용한 빅데이터 분석
저자 : 공용준 ㅣ 출판사 : 에이콘출판

2015.03.31 ㅣ 337p ㅣ ISBN-13 : 9788960776883

정가30,000
판매가27,000(10% 할인)
적립금 1,500원 (5%)
배송일정 04월 29일 출고 가능
주문 수량 변경시 안내 배송안내
쿠폰 및 결제혜택 확인하기

크기 기타 규격
제품구성 단행본
이용약관 청약철회
국내도서 > 컴퓨터 > 시스템공학 > 아키텍처/시스템프로...

[목 차]

1부 빅데이터와 클라우드
1장 클라우드 서비스 프로바이더의 종류와 특징
1.1 소개
1.2 퍼블릭 IaaS 서비스의 최강자 아마존 웹 서비스(AWS)
1.2.1 S3(Simple Storage Service)
1.2.2 EC2(Elastic Compute Cloud)
1.2.3 EMR(Elastic MapReduce)
1.3 퍼블릭 PAAS 서비스의 선두주자 구글
1.3.1 구글 앱엔진
1.3.2 구글 빅쿼리
1.3.3 구글 컴퓨트 엔진
1.4 윈도우 진영의 클라우드 서비스, 애저(Azure)
1.4.1 윈도우 애저 웹사이트
1.4.2 가상 머신 서비스
1.4.3 빅데이터 서비스
1.5 정리

2장 빅데이터 분석의 종류와 특징
2.1 소개
2.2 데이터 분석 프로세스
2.2.1 목적 정의
2.2.2 데이터 준비
2.2.3 탐색적 자료 분석
2.2.4 데이터 분석 목표 구체화 및 모델링
2.2.5 데이터 분석 검증
2.2.6 모델링 작업 현업 적용
2.3 기계 학습 패키지 소개
2.3.1 기계 학습이란?
2.4 상용 기계 학습 알고리즘 패키지
2.4.1 스카이트리
2.4.2 시스템엠엘
2.5 정리

2부 구글 클라우드를 사용한 빅데이터 분석
3장 구글 빅쿼리를 사용한 데이터 분석
3.1 소개
3.1.1 특징
3.1.2 드레멜과 빅쿼리
3.1.3 빅테이블 서비스 가격
3.2 구글 빅쿼리 서비스 시작하기
3.2.1 구글 API 사이트 접근
3.2.2 구글 빅쿼리 프로젝트 생성
3.3 구글 빅쿼리 브라우저 툴
3.3.1 쿼리 수행해보기
3.4 구글 빅쿼리 CLI 사용하기
3.4.1 커맨드라인 툴 설치
3.4.2 커맨드라인 툴 인증
3.4.3 커맨드라인 툴 테스트
3.5 구글 빅쿼리 API 사용
3.5.1 인증 코드 생성
3.5.2 메이븐 프로젝트 설정
3.5.3 계정 정보 파일 추가
3.5.4 빅쿼리 자바 클라이언트 사용법
3.5.5 데이터 셋 리스팅 샘플 전체
3.6 정리

4장 구글 빅쿼리 활용
4.1 소개
4.2 앱엔진 엑셀 커넥터를 사용한 데이터 분석
4.2.1 엑셀 커넥터 인증
4.2.2 엑셀 커넥터 다운로드
4.2.3 엑셀 커넥터 사용
4.2.4 엑셀 차트를 통한 데이터 표현
4.3 구글 앱엔진과 빅쿼리 연동
4.3.1 이클립스용 구글 플러그인 설치
4.3.2 배포용 구글 앱엔진 애플리케이션 생성
4.3.3 사용자 인증 코드 생성
4.3.4 앱엔진 샘플 코드 실행
4.3.5 샘플 코드 구조
4.3.6 코드 수정
4.3.7 구글 앱엔진으로 배포
4.4 정리

5장 구글 프레딕션 API
5.1 소개
5.2 구글 프레딕션 API 사용
5.2.1 구글 프레딕션 API 가격
5.2.2 구글 프레딕션 API 사용 준비
5.3 프레딕션 API 사용 샘플
5.3.1 데이터 업로드
5.3.2 시스템 훈련
5.4 커맨드라인 툴을 이용한 프레딕션 API 사용
5.4.1 oacurl 사용
5.4.2 모델 훈련
5.4.3 질문 수행
5.5 정리

6장 구글 프레딕션 API 활용
6.1 소개
6.2 프레딕션 API를 사용한 영화 추천 서비스 개발
6.2.1 추천용 데이터 모델
6.2.2 데이터 준비
6.2.3 영화 추천용 예측 모델 훈련
6.3 영화 추천 사이트 구축
6.3.1 사이트 시나리오
6.3.2 코드 개발
6.3.3 이클립스 프로젝트 구성
6.3.4 코드 수정
6.3.5 코드 실행
6.4 영화 추천 사이트 개선
6.4.1 사용자 인터페이스 개선
6.4.2 추천 알고리즘 개선
6.4.3 추천 알고리즘 2차 개선
6.5 정리

3부 아마존 웹 서비스를 활용한 빅데이터 분석
7장 빅데이터 분석 커널 하둡
7.1 소개
7.2 하둡이란 무엇인가?
7.2.1 하둡 파일 시스템
7.2.2 맵리듀스 컴퓨팅 플랫폼
7.3 맵리듀스 프로그래밍
7.4 맵리듀스 개발 패턴
7.4.1 맵리듀스 유닛 테스트
7.4.2 맵 유닛 테스트 작성과 테스트
7.4.3 리듀스 유닛 테스트 작성
7.4.4 맵리듀스 유닛 테스트 작성
7.4.5 대규모 데이터에서 돌리기
7.5 정리

8장 하둡 온디맨드 프레임워크
8.1 소개
8.2 1세대 하둡 온디맨드 플랫폼: 하둡 온디맨드(HOD)
8.2.1 하둡 온디맨드 구조
8.2.2 토크 설치
8.2.3 HOD 설치
8.2.4 HOD와 관련된 그 밖의 사항
8.3 2세대 하둡 온디맨드: 아마존 웹 서비스 EC2 사용
8.3.1 아마존 웹 서비스 환경 설정
8.3.2 hadoop-ec2 설정
8.3.3 하둡 클러스터 생성
8.3.4 하둡 EC2 디버깅
8.4 3세대 하둡 온디맨드: AWS의 EMR
8.5 정리

9장 AWS EMR 사용
9.1 소개
9.2 AWS EMR 소개
9.3 AWS EMR 웹 콘솔 사용
9.3.1 AWS EMR 콘솔 접근
9.3.2 신규 샘플 작업 흐름 생성
9.3.3 신규 작업 정의
9.3.4 변수 정의
9.3.5 EC2 인스턴스 종류 정의
9.3.6 추가 옵션 선택
9.3.7 부트스트랩 옵션 정의
9.3.8 리뷰
9.4 AWS EMR API 사용
9.4.1 루비 설치
9.4.2 EMR 클라이언트 설치
9.4.3 계정 정보 설정
9.4.4 S3 생성
9.4.5 EMR 설정 확인
9.5 EMR을 사용한 워드 카운트 샘플
9.5.1 워크 플로우 생성
9.5.2 EMR 로그인
9.5.3 웹 브라우저를 통한 EMR 원격 모니터링
9.5.4 워드 카운트 스텝 추가
9.5.5 워크 플로우 종료
9.6 정리

10장 머하웃과 하둡을 활용한 데이터 분석
10.1 소개
10.2 머하웃이란?
10.2.1 기계 학습이란?
10.2.2 머하웃과 기계 학습
10.3 머하웃의 추천 알고리즘
10.4 머하웃을 사용한 추천 알고리즘 예제
10.5 정리

11장 아마존 클라우드 서비스를 활용한 추천 서비스 개발
11.1 소개
11.2 EMR에서 사용할 추천 데이터 준비
11.3 EMR과 머하웃의 연동
11.4 작업 결과 확인
11.5 구글 클라우드 SQL과 연결
11.5.1 클라우드 SQL API 활성화
11.5.2 앱엔진 소스 수정
11.5.3 개발용 마이시퀄 서버 준비
11.5.4 클라우드 SQL 데이터 로드
11.6 정리

12장 클라우드 서비스와 BI 툴 연동
12.1 소개
12.2 비즈니스 인텔리전스 2.0 시대
12.3 엑셀과 하둡의 연동
12.3.1 하둡 플랫폼 설치
12.3.2 하둡 플랫폼을 이용한 맵리듀스 수행
12.3.3 하이브 작업 수행
12.3.4 엑셀과의 연동
12.4 키마스피어 BI와 EMR 연동
12.4.1 카마스피어 설치
12.4.2 데이터 준비
12.4.3 카마스피어와 EMR 연동 작업
12.4.4 카마스피어용 하이브 테이블 생성
12.4.5 테이블에 데이터 로드
12.4.6 데이터 분석
12.4.7 결과 확인과 차트 생성
12.5 정리


펼쳐보기
퍼블릭 클라우드의 대표인 아마존 AWS와 구글 클라우드 API를 사용하여 빅데이터 분석을 수행하고 실제 서비스까지 올리는 방법에 대해 설명한다. 단순한 맵리듀스는 물론, 고 수준의 데이터 분석이 필요한 추천 서비스까지 클라우드를 사용해서 해결하는 방법에 대해서 설명한다.

이 책은 크게 3부로 구성된다. 1부인 1장과 2장에서는 데이터 분석 일반에 대해 설명하고 데이터 분석 기법 중 탐험적 데이터 분석EDA의 목적과 여기에 사용되는 분석 기법을 설명한다. 2부인 3장에서 6장까지는 구글 클라우드를 사용해 데이터 분석을 수행하는 방법에 대해 설명한다. 구글의 경우 데이터 분석 서비스 API를 제공하기 때문에 이 서비스에 대한 소개와 사용 방법을 설명하고 최종적으로 구글 클라우드에 웹 서비스를 올리는 방법을 알아본다. 마지막 3부인 7장에서 12장까지에서는 아마존 AWS를 사용한 빅데이터 분석 방법을 설명한다. 아마존 API를 사용해 하둡을 생성하고 맵리듀스를 수행해 필요한 분석을 하고, 아마존 클라우드에 웹 서비스를 올리는 방법에 대해 설명한다.

각 장에서 다루는 내용은 다음과 같다.
1장, '클라우드 서비스 프로바이더 종류와 특징'에서는 3대 클라우드 서비스인 아마존 AWS, 구글 앱엔진, 윈도우 애저의 특징을 설명한다.
2장, '빅데이터 분석의 종류와 특징'에서는 빅데이터 분석 시에 사용하는 분석 단계와 여기서 사용되는 알고리즘을 간단히 설명한다. 상용 알고리즘 패키지에 대해서도 알아본다.
3장, '구글 빅쿼리를 사용한 데이터 분석'에서는 구글의 데이터 분석 API 중에서 빅쿼리 서비스에 대해 알아본다. 빅쿼리의 구조를 설명하고, 샘플 데이터를 사용해 커맨드라인이나 자바를 통해 분석하는 방법을 설명한다.
4장, '구글 빅쿼리 활용'에서는 구글 빅쿼리를 엑셀과 연결해 분석하는 방법을 설명한다. 그리고 구글 앱엔진에서 빅쿼리를 사용해 데이터 분석 결과를 사용하는 방법도 알아본다.
5장, '구글 프레딕션 API'에서는 구글 프레딕션 API에 대한 기초적인 설명과 모델을 만들고 데이터를 통해 훈련시키는 방법을 설명한다. 그리고 간단하게 커맨드라인에서 사용하는 방법을 알아본다.
6장, '구글 프레딕션 API 활용'에서는 프레딕션 API를 사용해 영화 추천 서비스를 만들어본다. 데이터 모델을 만들고 훈련시키고 개선하고, 추천 서비스를 위한 사이트를 만드는 방법을 설명한다.
7장, '빅데이터 분석 커널 하둡'에서는 하둡 파일 시스템과 맵리듀스를 간단히 설명하고, 맵리듀스 개발 패턴에 대해 설명한다. 맵리듀스의 유닛 테스트부터 대규모 배포까지의 과정을 알아본다.
8장, '하둡 온디맨드 프레임워크'에서는 HOD라는 하둡 온디맨드 프레임워크에 대해 알아보고, 이것을 설치해 운영하는 방법을 설명한다. 그리고 AWS와 EMR에 대해 간단히 설명한다.
9장, 'AWS EMR 사용'에서는 아마존의 맵리듀스 서비스인 EMR에 대해 알아본다. EMR의 사용법과 테스트 데이터를 사용해 데이터를 분석하는 방법을 설명하고, 커맨드라인을 통해 EMR API를 사용하는 방법에 대해서도 설명한다.
10장, '머하웃과 하둡을 활용한 데이터 분석'에서는 하둡의 기계 학습 분석용 패키지인 머하웃에 대해 설명한다. 머하웃에 들어가 있는 기계 학습 알고리즘을 간단히 알아보고, 추천 알고리즘을 사용하는 방법을 설명한다.
11장, '아마존 클라우드 서비스를 활용한 추천 서비스 개발'에서는 EMR과 머하웃을 사용한 데이터 분석 방법을 설명하고, 6장에서 만든 분석용 서비스와 연결하는 방법도 알아본다.

펼쳐보기

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.

독자서평 쓰기 로그인을 하시면 독자서평을 쓰실 수 있습니다.
도서평점
내용
등록하기
0/2000자
교환/반품 방법
  • 마이페이지 > 주문관리 > 주문/배송조회 > 주문조회 후  [1:1상담신청]  또는 고객센터 (1544-9020)
  • ※ 오픈마켓, 해외배송 주문상품 문의 시 [1:1상담신청] 또는 고객센터 (1544-9020)
교환/반품 가능기간
  • 변심반품의 경우 수령 후 7일 이내
  • 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
교환/반품 비용
  • 단순변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
  • 해외직배송 도서 구매 후 단순변심에 의한 취소 및 반품 시 도서판매가의 20% 수수료 부과
교환/반품 불가사유
  • 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  • 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 만화, 잡지, 수험서 및 문제집류
  • 복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
  • 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  • 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  • 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  • 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
상품 품절
  • 공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
소비자 피해보상
환불지연에 따른 배상
  • 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁 해결 기준 (공정거래위원회 고시)에 준하여 처리됨
  • 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

이 분야의 베스트

더보기 >

    이 분야의 신간

    더보기 >
      맨위로가기

      영풍문고 로고

      • 회사명 : (주)영풍문고
      • 대표이사 : 김경환
      • 소재지 : 서울특별시 종로구 청계천로 41 (우)03188
      • 사업자 등록번호 : 773-86-01800 ㅣ 통신판매업 신고번호 : 2023-서울종로-0130 [ 사업자정보확인 ]
      • 개인정보관리 책임자 : 조순제 ㅣ customer@ypbooks.co.kr ㅣ 대량주문 : webmaster@ypbooks.co.kr
      COPYRIGHT © YOUNGPOONG BOOKSTORE INC. ALL RIGHTS RESERVED.
      영풍문고 네이버블로그 영풍문고 인스타그램
      맨위로가기