아카이브/우리 이야기, 일상

[리뷰] 스파크를 이용한 자연어 처리

될성부른떡잎 2021. 9. 23. 02:45

현업에서 Spark를 사용해 빅데이터 분석을 하고 있지만, 자연어 처리에 대한 경험은 없어서 공부를 위해 이 책을 보게 되었습니다.

Spark 설치로 이 책의 자연어 처리 실습들을 진행 할 수 있어서, 흥미를 잃지 않고 빠르게 진행할 수 있었습니다.

Spark는 빅데이터 분석 플랫폼입니다. 큰 데이터도 별도 구현없이 분할해서 빠르게 분석 할 수 있습니다.

그리고 Spark의 ML 라이브러리로 간단하게 머신러닝/딥러닝을 활용할 수 있습니다.

이 책을 보면서, Spark가 머신러닝/딥러닝 분석을 시작하는 분들에게 가장 좋은 환경을 만들어 주는 플랫폼이라는 생각이 들었습니다.

 

Chapter 2에서 자연어처리/딥러닝 기초에 대한 내용을 설명하고, 이 후에 텍스트 전처리, 언어 모델, 표현 등의 일련의 과정들을 구현해 볼 수 있게 되어 있습니다.

영화 리뷰 분석, 검색 엔진, 챗봇 및 이미지에서 텍스트 추출 등 여러 애플리케이션을 개발할 수 있는 예제도 있어서 자연어 처리를 경험하기에는 좋은 구성이였습니다.

 

자연어 처리에 대한 이해가 있다면, 여러 재밌는 데이터 분석들을 할 수 있습니다.

자연어 처리를 시작하려는 분들에게 책을 추천합니다.