아카이브/우리 이야기, 일상 36

[리뷰] 데이터 과학 레벨 업 with 로드맵

데이터 과학 분야를 공부할 때 캐글 참여는 필수적입니다. 케글에는 실생활에서 해결하고자 하는 많은 문제들이 데이터셋과 함께 있고, 여러 사람과 경쟁 및 토론하며 최적의 답을 찾아갈 수 있게 잘 만들어진 플랫폼입니다. 캐글을 시작하게 되면 몇가지 문제에 부딪히게 됩니다. 모델을 만들기 위한 학습과정에서 사용할 리소스의 문제, 그리고 최적의 답을 찾아가기 위해 모델을 선택하는 의사결정 과정입니다. 이 책에서는 최적의 답을 찾아갈 수 있도록 일련의 로드맵을 제공합니다. 데이터를 살펴보고 모델을 만들어 평가해 볼 수 있는 공간인 노트북을 사용하는 방법부터, 모델을 선택하는데 사용할 수 있는 여러 테크닉들을 상세하게 설명하고 있습니다. 이런 부류의 책들은 정해진 몇개의 문제만을 대상으로 한정된 풀이법만 제공하는데..

[리뷰] 혼자 공부하는 머신러닝+딥러닝

혼공 도서는 헤드퍼스트 시리즈처럼 내용과 편집, 구성의 조합이 완벽하다고 생각합니다. ML/DL 관련 도서는 많지만 이렇게 초보자에게 친절하게 설명하는 책은 없었던 것 같습니다. 다른 책에서 당연하게 진행하는 과정들을 왜 이렇게 해야하는지 독자가 생각하고 이해할 수 있게 만들어 주는게 이 책의 가장 큰 장점인거 같습니다. 책의 내용을 따라만 하는게 아니라 스스로 생각하고 이해할 수 있게 구성이 되어 있어 끝까지 재밌게 공부할 수 있었습니다. 다양한 사례와 실습으로 구성되어 있어 누구든 쉽게 ML/DL을 시작할 수 있을 것 같습니다. 감히 제가 생각하기에 ML/DL 입문서로는 제일 좋은 것 같습니다. 입문서로 많이 추천하는 "핸즈온 머신러닝" 책이 처음 봤을 때 어려운 느낌을 받았었는데, 이 책을 보고 본..

[리뷰] 파이썬 기반 금융 인공지능

우선 이 책은 여러 방법론과 이론 그리고 머신러닝 실습들을 담고 있어서 관련 지식이 없다면 읽기 쉽지 않습니다. 금융 분야는 복합계로 예측이 상당히 어렵습니다. 따라서 머신러닝이나 딥러닝 적용도 복잡하고 까다로울 수 밖에 없습니다. 금융의 많은 분야에서 인공지능이 사용되고 있지만, 아마 가장 관심이 많은 부분이 주식 시장 예측일 거라고 생각합니다. 과거 데이터를 통해 잘 작동하는 모델을 만들고 백테스팅을 통해 검증을 했더라도, 시장의 흐름이 과거와 완전히 달라질 수 있기 때문에 완전히 Fit 한 모델은 찾을 수 없습니다. 그럼에도 불구하고 이런 시도가 의미 있는데, 어느 정도 수익률을 가져다 주는 모델을 만드는건 가능하다는 점입니다. 높은 수익률을 무조건 보장하는 모델은 만들기 매우 어렵습니다. 하지만 ..

[리뷰] 러닝 타입스크립트

타입스크립트는 JS 생태계에서 필수가 됐지만, 이전에 개발된 방대한 자바스크립트 코드들로 적용되지 않은 곳들도 많이 있습니다. 아직 타입스크립트가 어색한 개발자들은 타입스크립트를 적용해야 한다는 건 알고 있지만, 레거시 코드들을 전환하는건 많은 시간이 필요한 일이기에 적용을 미루고 있었을 것입니다. 타입스크립트 적용은 미룰 수 없는 일이 됐고, 이 책으로 타입스크립트에 입문해 봤으면 좋겠습니다. 이 책은 타입스크립트의 문법들에 대해 다루고 있습니다. ECMAScript 문법은 어느정도 학습하고 이 책을 봐야 합니다. 타입스크립트는 자바스크립트의 자율성을 제한해 자바스크립트의 많은 문제들을 해결했습니다. 자바스크립트에 대한 기본기가 충분히 갖춰져야 타입스크립트의 목적을 이해하고 효율적으로 사용할 수 있습니..

[리뷰] 파이썬 라이브러리를 활용한 텍스트 분석

번역, 검색, 추천등 우리 주변의 많은 서비스에서 자연어 처리가 활용되고 있습니다. 세상에는 다양한 언어가 있고 사람마다 표현 방식이 다르기 때문에 자연어를 분석해 원하는 결과를 얻어내는건 아직도 매우 어려운 일입니다. 이 책에서는 “영어 텍스트”를 분석하는 방법을 중점적으로 설명합니다. 텍스트 데이터를 가져와 어떤 성격인지 살펴보고 원하는 목표에 맞는 알고리즘을 적용해 결과를 추출하는 전반적인 과정을 체험할 수 있습니다. 여러 주제로 챕터를 나눠 실습을 할 수 있게 구성된 점이 참 좋았습니다. 실제 프로젝트에서는 정제되지 않은 데이터를 가져와(ex. 크롤링) 전처리해 사용해야 하는 경우가 많이 있습니다. 잘 정제된 데이터셋만 사용하는게 아니라 API나 웹페이지 크롤링을 통해 데이터를 가져와 전처리 하는..

[리뷰] 어쩌다 데이터 분석 with 파이썬

데이터 분석 과정에 대해 자세하고 쉽게 설명하고 있는 책입니다. 데이터를 분석하기 위해서는 먼저 데이터의 특성을 파악하고 가공하는 과정이 필요합니다. (내 마음에 맞게 예쁘게 다듬어진 데이터를 만나는 일은 매우 드문 일 입니다.) 데이터를 살펴보고 내가 원하는 모양으로 만들기 위해서 넘파이, 판다스 등 파이썬 모듈을 주로 사용합니다. 판다스, 넘파이 등을 익숙하게 다룰 수 있어야 쉽게 내가 원하는 대로 데이터를 가공해 볼 수 있습니다. 이 책에서는 데이터 로드, 전처리, 집계, 시각화까지 일련의 과정을 정말 친절하게 설명하고 있습니다. 데이터 분석을 시작하거나 판다스, 넘파이 등이 손에 익지 않으신 분들에게는 정말 좋은 도서라고 생각합니다. 마지막 부분에 EDA 실습이 있었는데 내용이 조금 짧아서 아쉬웠..

[리뷰] 이것이 자바다

개정판으로 출간된 ‘이것이 자바다’를 만날 수 있어서 기쁩니다. 잘 만들어진 기본서에 자바의 최신 버전 내용까지 반영해 출간된거라 자바를 시작 하시는 분들에게는 가장 좋은 선택이 될 거라고 생각합니다. 자바 프로젝트에서 계속해서 최신 버전을 적용하고 언어의 신규 기능을 적용하는 경우는 많지 않지만, 주기적으로는 업그레이드가 필요하기 때문에 최신 버전의 변경점은 파악하고 알고 있어야 합니다. 기본서들의 경우 최신 버전의 내용들이 없는 경우가 많아, 이 후 변경 사항들을 따로 찾아봐야 했지만 ‘이것이 자바다’ 개정판에서는 한번에 살펴 볼 수 있어서 좋았습니다. 코드 예제가 많아서 실습을 통해 빠르게 개념을 이해할 수 있는게 이 책의 큰 장점 중 하나인데, 컬러 인쇄로 신택스 구분이 쉬워져서 코드를 이해하는데..

[리뷰] 혼자 공부하는 컴퓨터 구조+운영체제

‘컴퓨터 구조’와 ‘운영체제’는 CS에서 가장 중요한 과목 중 하나이지만, 전공 서적들은 두껍고 친절하지 않아서 공부하기 쉽지 않은 과목 중 하나이기도 합니다. C, C++ 처럼 하드웨어에 가까운 언어를 사용하지 않더라도, 성능을 높이고 효율적으로 코드를 최적화 하다 보면 언젠가 ‘컴퓨터 구조’와 ‘운영체제’라는 벽에 부딪히게 됩니다. 반드시 알고 있어야 하지만 친절하지 않은 교재들 탓에 공부하기 쉽지 않은 과목들이였지만, ‘혼자 공부하는 컴퓨터 구조+운영체제’ 덕분에 많은 사람들이 쉽게 공부할 수 있을 거라고 생각합니다. 교재 이름처럼 혼자 공부해도 충분할 정도로 다양한 비유와 그림들로 핵심 개념들을 친절하게 설명하고 있습니다. 물론 이 책에서 모든 걸 설명하고 있진 않습니다. 유명 전공 서적(ex. ..

[리뷰] 비즈니스 데이터 과학

데이터를 기반으로 의사 결정을 하는 과정을 자세히 설명하고 있는 책입니다. 데이터 과학을 공부하다 보면 학습한 기법들을 어느 상황에 적용해야 하는지 쉽게 감이 잡히지 않는데, 저자의 경험으로 상황에 맞게 문제를 해결하는 방법을 설명하고 있어 데이터 과학을 공부하고 계신 분들이라면 많은 도움이 될 거라 생각합니다. 특히 이 책이 흥미로웠던건 비즈니스 의사결정이 필요한 상황(사용자 분류, AB 테스트 등)을 먼저 제시하고 데이터를 분석하는 과정을 소개하고 있다는 점이였습니다. 보통의 데이터 과학 책들은 분석 알고리즘에 초첨을 두고 있는데, 이 책은 데이터 분석의 목적에 중점을 두고 있어 데이터를 여러 관점으로 바라보고 분석 기법을 선택하는 힘을 기를 수 있게 도와줍니다. 다만, 일정 수준 이상의 수학적 지식..

[도서] 똑똑한 코드 작성을 위한 실전 알고리즘

자료구조, 알고리즘 기초를 알고 계신 분들이 다시 개념을 살펴볼 때 좋은 책이라고 생각됩니다. 책의 두께에 비해 상당히 많은 주제들이 정리되어 있으며, 수도 코드와 그림을 사용해 순차적으로 알고리즘이 실행되는 과정을 논리적으로 설명하는 스타일입니다. 책의 내용을 바탕으로 개념을 이해하고 스스로 구현해 본다면 많은 도움이 될 거라고 생각됩니다. (스스로 구현해 본 후 꼭 저자의 깃헙에 있는 잘 작성된 코드와 비교해 보세요) 특히 자료구조와 알고리즘은 워낙 내용이 방대해, 책의 두께나 복잡한 구성에 질려서 중간에 포기하는 경우가 많았는데 이 책은 간결하게 주요 내용만 정리가 되어 있어 좋았습니다. 자료구조, 알고리즘을 다시 공부해 보려고 하는 모든 개발자 분들에게 추천드립니다. "한빛미디어 활동을 위해서 책..