책소개
※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※<br><br>4년간 R 데이터 분야 1위 도서 저자의 후속작 ‘텍스트 마이닝’ 도서 출간!<br>형태소 분석, 긍정·부정 분위기 분석, 연관 단어 분석, 시각화 모두 내 손으로! <br>봉준호 감독의 영화 <기생충>이 오스카상 4관왕을 수상한 사실은 이제 모두가 알고 있다! 그런데 온라인 댓글 분위기는 천차만별이었네? 이 영화가 대체 어땠길래? 당시 분위기를 분석하고 돌아볼 수는 없을까? 영화 평가가 긍정·부정적이었는지, 영화 자체의 평이 많은지 아니면 영화 외적 요소의 평이 많은지 궁금하다. 이제 김영우 선생님과 함께 R로 텍스트 마이닝을 해보자! <br>이 책은 직장인, 대학생, 연구자 누구나 쉽게 텍스트 분석을 할 수 있다. 한글 텍스트 분석은 물론 30종 넘는 다양한 그래프까지! 보고서에 바로 사용할 수 있는 다양한 결과물을 내 손으로 직접 만들 수 있다.
저자소개
데이터로 세상을 이해하는 일을 하는 데이터 분석가. 기업, 대학, 연구 기관, 시민 단체 등 다양한 조직의 데이터 분석 프로젝트를 진행하고 있다. 측정, 실험, 데이터를 좋아하고 혈액형 성격론, 타로 카드, 자기 계발서를 싫어한다. 데이터에 기반을 둔 대화를 추구하므로 지인들로부터 신뢰할 만하다는 평을 듣지만 친구는 별로 없다. 초보자도 어깨춤을 추며 데이터를 분석하게 만드는 강의를 진행하고 있다. SKT, KT, 엔씨소프트, 삼성금융연수원, LG 인화원, 멀티캠퍼스, 패스트캠퍼스 등에서 강의했다. 데이터 저널리스트로 활동하며 데이터 저널(datajournal.kr)을 운영하고 있으며, 데이터 전문 팟캐스트 <데이터 홀릭>을 진행하고 있다. 현재 레어템을 좋아하는 여인에게 수집돼 함께 살고 있으며, 가장 효율적으로 아무것도 안 하는 고양이 두 마리를 모시고 있다.
목차
__1장 단어 빈도 분석: 무엇을 강조했을까?<br>_01-1 텍스트 전처리<br>_01-2 토큰화하기<br>_01-3 단어 빈도 분석하기<br><br>__2장 형태소 분석기를 이용한 단어 빈도 분석<br>_02-1 형태소 분석<br>_02-2 명사 빈도 분석하기<br>_02-3 특정 단어가 사용된 문장 살펴보기<br><br>__3장 비교 분석: 무엇이 다를까?<br>_03-1 단어 빈도 비교하기 <br>_03-2 오즈비 — 상대적으로 중요한 단어 비교하기 <br>_03-3 로그 오즈비로 단어 비교하기 <br>_03-4 TF-IDF — 여러 텍스트의 단어 비교하기 <br><br>__4장 감정 분석: 어떤 마음으로 글을 썼을까?<br>_04-1 감정 사전 활용하기 <br>_04-2 댓글 감정 분석하기 <br>_04-3 감정 범주별 주요 단어 살펴보기 <br>_04-4 감정 사전 수정하기 <br><br>__5장 의미망 분석: 어떤 맥락에서 단어를 썼을까?<br>_05-1 동시 출현 단어 분석 — Co-occurrence analysis <br>_05-2 동시 출현 네트워크 — Co-occurrence network <br>_05-3 단어 간 상관 분석 — Phi coefficient <br>_05-4 연이어 사용된 단어쌍 분석 — n-gram <br><br>__6장 토픽 모델링: 어떤 주제로 글을 썼을까?<br>_06-1 토픽 모델링 개념 알아보기 <br>_06-2 LDA 모델 만들기<br>_06-3 토픽별 주요 단어 살펴보기 <br>_06-4 문서를 토픽별로 분류하기 <br>_06-5 토픽 이름 짓기<br>_06-6 최적의 토픽 수 정하기 <br><br>__7장 텍스트 마이닝 프로젝트: 타다 금지법 기사 댓글 분석<br>_07-1 주요 단어 살펴보기 <br>_07-2 공감, 비공감 댓글 비교하기<br>_07-3 관심 댓글 비교하기<br>_07-4 단어 간 관계 살펴보기 <br>_07-5 토픽 모델링<br><br>__8장 텍스트 마이닝 프로젝트: 차기 대선 주자 SNS 여론 분석<br>_08-1 SNS 언급량 추이 살펴보기<br>_08-2 SNS 이슈 살펴보기<br>_08-3 감정 단어 살펴보기<br>_08-4 감정 경향 살펴보기<br>_08-5 감정 추이 살펴보기<br>_08-6 긍정, 부정 트윗 단어 비교하기<br><br>__9장 텍스트를 효율적으로 분석하는 방법<br>_09-1 텍스트 데이터 수집하기<br>_09-2 텍스트 분석 품질 높이기<br>_09-3 완전 유용한 꿀팁