아카이브/우리 이야기, 일상

[리뷰] 파이썬 라이브러리를 활용한 텍스트 분석

될성부른떡잎 2022. 11. 26. 18:39

 

번역, 검색, 추천등 우리 주변의 많은 서비스에서 자연어 처리가 활용되고 있습니다.

세상에는 다양한 언어가 있고 사람마다 표현 방식이 다르기 때문에 자연어를 분석해 원하는 결과를 얻어내는건 아직도 매우 어려운 일입니다.

 

이 책에서는 “영어 텍스트”를 분석하는 방법을 중점적으로 설명합니다.

텍스트 데이터를 가져와 어떤 성격인지 살펴보고 원하는 목표에 맞는 알고리즘을 적용해 결과를 추출하는 전반적인 과정을 체험할 수 있습니다.

여러 주제로 챕터를 나눠 실습을 할 수 있게 구성된 점이 참 좋았습니다.

 

실제 프로젝트에서는 정제되지 않은 데이터를 가져와(ex. 크롤링) 전처리해 사용해야 하는 경우가 많이 있습니다.

잘 정제된 데이터셋만 사용하는게 아니라 API나 웹페이지 크롤링을 통해 데이터를 가져와 전처리 하는 과정들도 잘 설명되어 있어 좋았습니다.

 

어느분야나 마찬가지지만 한권의 책으로 모든 내용을 학습할 수는 없습니다.

이 책은 제목처럼 “파이썬 라이브러리를 활용한 텍스트 분석”을 체험하고 자연어 처리를 맛볼 수 있는 최적의 도서라고 생각합니다.

 

머신러닝을 학습하고 있는, 자연어 처리를 맛보고 싶은 분들에게 이 책을 추천합니다.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."