스파크는 빅데이터 분석 분야에서 독보적인 위치에 있습니다.
스트리밍 프로세싱에 있어 Flink라는 강력한 경쟁자가 있지만, 배치와 스트리밍을 모두 같은 플랫폼을 사용할 수 있다는 점에서 스파크는 널리 사용되고 있습니다.
스파크 공식 문서를 통해 스파크 스트리밍을 사용하다가 해당 도서가 출판된 것을 보고 매우 기뻤습니다.
이 책에는 스트리밍의 개념부터 활용 예제까지 많은 내용이 담겨있습니다.
스파크를 처음 사용하시는 분은 먼저 공식 문서나 스파크 완벽 가이드를 통해 학습하시고 이 책을 보시길 추천드립니다.
(이 책을 보시는 분들은 본인의 스파크 실행 환경을 가지고 계시겠지만, 책에서도 스파크를 사용할 수 있는 노트북 환경을 제공합니다.)
소스, 처리, 싱크를 순서에 맞게 설명하고 있으며, 시간 처리와 상태를 정기적으로 저장할 수 있는 체크포인팅까지 코드와 함께 잘 설명하고 있습니다.
스트리밍 애플리케이션을 만드실 때 참고하기 좋은 도서라고 생각합니다.
다만, 번역 부분이 매끄럽지 않아서 잘 읽히지 않는 것이 아쉬웠습니다.
한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
'아카이브 > 우리 이야기, 일상' 카테고리의 다른 글
[리뷰] 데이터 스토리 (0) | 2021.07.25 |
---|---|
데이터가 뛰어노는 AI 놀이터, 캐글 리뷰 (0) | 2021.06.21 |
이것이 데이터 분석이다 with 파이썬 리뷰 (0) | 2021.04.19 |
[리뷰] 처음 배우는 쉘 스크립트 (0) | 2021.03.21 |
[리뷰] 진지한 파이썬 (0) | 2021.02.21 |