아카이브/우리 이야기, 일상 36

이것이 데이터 분석이다 with 파이썬 리뷰

데이터 분석을 시작하려는 분에게 정말 좋은 입문서입니다. 데이터 분석을 하려면 우선 사용할 데이터셋이 필요하고 목적에 맞게 전처리 과정이 필요합니다. 이 과정에 시간이 많이 소요되고 귀찮기 때문에 데이터 분석을 해보고 싶은 분들이 많이 포기하게 됩니다. 하지만 이 책에서는 가격 예측이나 구매 데이터 분석을 통한 상품 추천등 많은 분들이 흥미를 느낄 수 있는 주제로 데이터 분석을 쉽게 시작할 수 있도록 많은 내용들을 제공하고 있습니다. 데이터 셋 전처리, 분석, 시각화까지 데이터 분석을 위한 일련의 과정을 모두 체험할 수 있습니다. 또한 데이터 셋을 보고 분석 방향을 생각을 해야 하는데, 이러한 과정들도 경험해 볼 수 있습니다. 재밌고 쉽게 데이터 분석을 시작해 볼 수 있다는게 이 책의 가장 큰 장점입니다..

[리뷰] 처음 배우는 쉘 스크립트

현재 우리가 사용하는 많은 서비스들은 리눅스 위에서 동작하고 있습니다. 웹서버를 올리거나 데이터 학습을 위한 모델을 만들 때 또는 서버나 애플리케이션 모니터링에도, 우리는 리눅스 서버에서 쉘 스크립트를 이용해 우리가 원하는 작업을 수행합니다. 쉘 스크립트는 특정 개발 분야에서만 사용하는 것이 아니라 거의 모든 개발자가 사용하고 있거나 사용하게 될 것입니다. 보통 목적에 맞게 반복적으로 사용하는 경우가 많아서 제대로 학습하고 사용하지 않게 되는 것 같기도 합니다. 쉘의 경우는 오래전부터 사용해 왔기 때문에 좋은 자료들과 사례들이 많이 있습니다. 하지만 보통 쉘 스크립트 문법과 리눅스 명령어를 조합해 사용하기 때문에, 막상 시작하려면 어디서부터 해야 하는지 어려울 때가 있을 것 입니다. “처음 배우는 쉘 스..

[리뷰] 진지한 파이썬

파이썬의 기본적인 내용만 학습한 상태에서 프로젝트를 진행하게 되면, 유지보수나 문서화 등 많은 부분에서 어려움을 겪게 됩니다. 더 좋은 코드를 만들고 협업을 잘 하기 위해서는 한 단계 더 학습이 필요합니다. "진지한 파이썬"에서는 문서화, 테스트, 메소드 그리고 성능&최적화 등 초급 프로그래머 들이 알아야 하는 내용들이 압축되어 잘 들어있습니다. 페이지 수가 많지는 않지만 많은 내용들을 담고 있습니다. 그래서 내용들이 자세하고 깊게 설명되어 있지는 않습니다. 파이썬 프로그래머들이 꼭 알고 있어야 하는 내용들이 많이 수록되어 있다는 점이 이 책을 읽기에 충분한 이유가 된다고 생각합니다. 초급 파이썬 프로그래머 분들에게 이 책을 추천합니다.

[리뷰] 처음 배우는 딥러닝 챗봇

플랫폼 모니터링 자동화를 위한 챗봇을 개발하기 위해 이 책을 선택하게 되었습니다. 빠르게 챗봇의 구조와 동작 원리를 파악하고 만들어 볼 수 있었습니다. 파이썬을 사용해 챗봇을 개발하는데 파이썬이 익숙하지 않으신 분들이라도 초반부에 파이썬 문법이 간단하게 설명되어 있어 누구든지 쉽게 챗봇을 만들어 볼 수 있습니다. 자연어 처리나 딥러닝 모델들이 어렵게 느껴질 수는 있지만 가볍게 보고 만들어 본다는 느낌으로 진행하시면 쉽고 재밌게 만들어 보실 수 있을 것으로 생각합니다. 챗봇을 처음 만들어보시거나 간단한 딥러닝 프로젝트를 진행해 보고 싶은 분들에게 이 책을 추천드립니다.

[리뷰] 스파크 완벽 가이드

Spark 완벽 가이드는 Spark 창시자인 마테이 자하리아가 저자로 참여하였고, 국내 스파크 모임에서 번역서가 나오기 전에도 교재로 많이 사용했던 책입니다. 거의 800페이지에 달하는 분량이지만 핵심을 간단하고 명확하게 설명하고 있어 부담없이 읽을 수 있었습니다. 제일 좋았던 부분은 실습 환경을 Docker 이미지로 제공하는 것 이였습니다. 빅데이터 관련 도서를 볼 때 항상 실습을 위한 환경 구축에서 많은 시간을 소요했는데 이번에는 10분 정도 만에 실습을 시작할 수 있었습니다. 3장(약 100페이지 분량)까지는 스파크 아키텍쳐와 기능에 대한 간단하게 소개를 하고 4장 부터는 스파크에 대해 자세히 설명하고 있습니다. 개념 및 실습을 간단하게 살펴보고 세부 내용으로 진행하게 되어 있어 흥미를 잃지 않고 ..

[리뷰] 쉽게 배워 바로 써먹는 디자인 패턴

이 책은 다양한 디자인 패턴들의 개념과 예제를 통해 쉽게 설명하고 있습니다. 세 파트에 걸쳐서 24개의 패턴을 설명하고 있습니다. PART 1 생성 패턴 - 추상화를 통해 객체 생성하기 PART 2 구조 패턴 - 상속과 합성을 사용해 객체 확장하기 PART 3 행동 패턴 - 복합 구조로 객체의 책임 분산하기 소스 코드가 PHP로 되어 있어 처음엔 낮설게 느껴졌지만 이해하기 어렵지는 않았습니다. 소프트웨어 공학 관련 도서는 경험치에 따라 느끼는게 달라져서 일정 주기로 반복해서 봐야 한다고 생각합니다. 패턴들을 외워서 과하게 사용하려고 하기 보다, 자연스럽게 사용할 수 있도록 많은 사용 사례들을 봐야 한다고 생각합니다. 디자인 패턴을 처음 접하시거나 익숙하지 않으신 분들에게 이 책을 추천합니다.

[리뷰] 퀀트 전략을 위한 인공지능 트레이딩

주식 투자에서 미래의 주가를 정확하게 예측하는 것은 불가능한 일로 생각되고 있고, 많은 사람들이 방법을 찾으려 연구를 하고 있습니다. 다양한 수치를 이용해 주가 예측 모델을 학습하고 예측 정보를 제공하면서 투자자들은 결정에 도움을 줄 수 있는 도구로 활용하고 있습니다. 퀀트를 이용해 투자하는 방식이 정답은 아니며 일정 수익을 보장하지도 않습니다. 오히려 큰 손실을 볼 수도 있습니다. 주식 투자에 있어서 책임은 투자자에 있기에 본인이 잘 판단해서 확신이 있을 때 사용해야 합니다. 하지만 본인의 퀀트 전략을 잘 세우고 활용할 수 있다면, 투자에 큰 도움이 되는 건 확실합니다. 이 책에서는 머신러닝/딥러닝을 기반으로 예측 모델을 만들어보고 전략을 세울 수 있는 기본적인 정보들을 제공합니다. 파이썬을 활용할 수..

[리뷰] 파이썬으로 배우는 통계학 교과서

데이터 분석 업무를 하면서 데이터의 특성을 파악하기 위해 사용하는 알고리즘들을 이해하고 잘 표현하기 위해, 최근 통계학 학습의 필요성을 느끼고 있었습니다. 이 책은 기초 통계를 파이썬 코드를 통해 학습할 수 있다는 점이 큰 장점입니다. 책의 내용을 따라 학습하다 보면 빠르게 기초 통계를 습득하고 사용할 수 있을 것 입니다. 다만, 통계와 파이썬을 사용해 보지 않은 사람을 대상으로 쓰여진 것 같아 내용의 깊이가 아쉬웠습니다. 통계학을 전혀 공부해 보지 않았고 파이썬도 익숙하지 않지만 통계학 공부를 시작해 보려 하시는 분들에게 추천드립니다.

[리뷰] 핸즈온 머신러닝 2판

핸즈온 머신러닝 1판으로 머신러닝 공부를 시작해서, 2판이 나왔을 때 매우 반가운 마음이 들었습니다. 전면 컬러판으로 개정되어 그림들이 매우 보기 편해졌으며, 여러 주제들도 추가되어 1판이 있더라도 2판을 구매할 충분한 이유가 있다고 생각됩니다. 머신러닝을 처음 시작하는 사람도 쉽게 따라올 수 있도록 순차적으로 구성이 잘 되어 있습니다. 머신러닝을 사용해야 하는 이유, 적용 사례 그리고 주요 개념들을 첫 장에서 친절하게 설명하고 있습니다. 또한 두번째 장에서 캘리포니아 주택 가격 데이터셋을 이용해 머신러닝 프로젝트를 간단하게 진행합니다. 본격적으로 시작하기 전 머신러닝에 대해 살펴보고 프로젝트가 어떻게 진행되는지 간단하게 체험해 볼 수 있습니다. 그 다음 장부터는 모델링의 전반적인 과정과 여러 머신러닝 ..

[리뷰] 배워서 바로 쓰는 스프링 부트 2

스프링 부트는 복잡한 과정 없이 스프링 어플리케이션을 구동할 수 있어 많은 프로젝트에서 사용되고 있습니다. 스프링 프레임워크를 이용해 빠르게 원하는 어플리케이션을 만들어 볼 수 있다는 점은 매우 큰 장점입니다. 하지만 스프링 부트를 사용해 보지 않았다면, 바로 어플리케이션 개발을 시작하기에는 어려움이 있을 수 있습니다. 그럴 때 이 책을 참고하여 스프링 부트를 시작한다면 큰 도움이 될 수 있을거라 생각합니다. 주제/기능 단위로 각 장을 구성해서 필요할 때마다 찾아 볼 수 있게 구성이 잘 되어 있습니다. 운영 및 배포에 관련된 내용들도 담고 있어 전반적인 어플리케이션 개발 과정을 경험해 볼 수 있습니다. 빠르게 스프링 부트 어플리케이션을 만들어 보고 싶은 분들에게 추천합니다.