12月ですね。
毎年クリスマスが近づくこの時期は、世間の浮ついた空気に反して
データサイエンティスト諸君は、年末進行に冷汗を流していることと思います。
また、冬休みとは名ばかりの少しばかりの休息期間は、
オフ返上で年明けのプロジェクトに備えて、新しい知識を仕入れていることでしょう。
ええ、私達の聖書は、オライリー本ですし、
賛美歌は、日々マントラのように唱えるSQL文であるはずです。

 

本エントリーでは、データサイエンティストの私が、
データサイエンティストのみなさま、
あるいは、今後データ分析のお仕事に関わることを考えている皆様、
あるいは、広くマーケティングに関わるみなさまに向けて、
データ分析関連を中心に、最近読んで面白かった本を広くご紹介しようと思います。
※なお、最近の本に限らず、昔の本も含まれております。

(1) データ分析・プログラミング関連(新たにデータ分析に携わる方向け)
(2) サイエンス関連(データサイエンティストに限らず、広くデータに携わる方向け)
(3) マーケティング関連(データに限らず、マーケティングに携わる方向け)
(4) 科学・歴史書関連(githubやkaggleのkernelの最新情報に惑わされず中長期的な視点を持ちたい方向け)
(5) 小説・漫画(コーディングに疲れてメンタルダウンしそうなときに自分を奮い立たせたい方向け)




| (1) データ分析・プログラミング関連(新たにデータ分析に携わる方向け)



Pythonによるデータサイエンス入門本。
この2冊を読めば、ほぼ最近の機械学習手法およびデータ分析フロー、実装方法が、概ね網羅できる。
※ただし、XgBoost、LightGBMなどのBoostingアルゴリズムや自己組織化マップなどは、別途学習の必要あり。


昔は、統計はR、機械学習はPython、といった使い分けがよく聞かれましたが、
近年、Pythonのライブラリが日々充実してきております。
Python(とHadoop)で仕事が完結する、という方も多いと思います。
(一部、私は、まだ目的に応じてRを使用しておりますが)
統計もPythonでまかないたい、と思った方にオススメです。統計の復習にもなります。


データ分析をしていると、これは因果があるのか相関があるだけなのか、
どちらが原因でどちらが結果なのか、などの問題に直面することが多々あると思います。
そのような因果関係を明らかにするための学術的解説本。
このジャンルの本は、いろいろあるけれど、なんとなくこの本が読みやすかった。


AIがゲームを自動で攻略していく動画を見たことがある方は多々いらっしゃると思いますが、
たとえば、ブロック崩しゲームを、どのように深層強化学習で、自動でクリアするAIをつくるか、
などを学ぶことができる本です。
私は、マーケティング界隈のデータサイエンスの仕事をしているため、
業務では、なかなか深層強化学習を用いるシーンはないのですが、
趣味でなにかおもしろいことができないかなと思ったときに読みました。


| (2) サイエンス関連(データサイエンティストに限らず、広くデータに携わる方向け)


“数字は発明なのか、発見なのか”という主題を軸に、数という概念自体を考える本。
もし人類が滅亡して、別の人類の文明が発展しても、今と同じような数字の概念が、
“発明”されるのか、”発見”されるのか、などを、
数学上の様々なエピソードを交えて語られる。
データを扱う上で、そのデータの定義を考えるときなどに深みがでます。


いわゆる、思考のバイアスを様々なエピソードを交えて解説される。
マーケティング、データ分析をするときに、気をつけたいこと、が盛りだくさん。
内容はしっかりしていながら、割とさくさく読めるはず。


人は、”何を”・”どのように”やるかを重視しがちだが、
実は”いつ”やるか、がもっとも重要だ、ということを様々なデータを用いて解説した本。
直近で寄稿したスプラトゥーン2の分析記事でも、一部引用。


様々な有名な物理方程式の解説はもとより、「何故そのような法則を発見するにいたったか」の
ヒューマンドラマの連なりに主眼が置かれている本。池井戸小説のような読み応え。
“どの方程式も起源は人間にある。ある時ある場所にいて、その必要性を感じ、
物事の意味を理解したい、あるいは、絶望的なまでに複雑に見えるものを少しでもわかりやすくしたい”
という願望から、物理方程式は生み出される、という冒頭の文章がもう、エモい。


| (3) マーケティング関連(データに限らず、マーケティングに携わる方向け)


いわゆる、リッツ・カールトンや、ディズニーの、最高のおもてなし、がもてはやされる昨今、
人は本当は過剰なサービスはもとめておらず、純粋に求められていることを
ちゃんとやってくれることを求めている、ということを解説した本。
世論への逆張り、だけではなく、インフラとしての機能を果たした上で、ではどうするか、
ということにも言及。


20年ほど前の本ですが、さすがのドラッカーとも言える内容で今読んでも面白い。
昔の本だからこそ、この20年間を振り返りながら読めるため、むしろ今読むことで視野が広がる。
「今日のCEOにもっとも必要とされるものが情報責任にある。”どのような情報が必要か。どのような形で必要か”を考えることである。
(中略)重要なのは、”いつ必要か。誰から得るか。そして自分はどのような情報を出さなければならないか”」といった、
情報に関する論点は、そのままでも、情報をデータと読み替えても、今なお重要なことのように思う。


| (4) 科学・歴史書関連(githubやkaggleのkernelの最新情報に惑わされず中長期的な視点を持ちたい方向け)


ノーベル賞の利根川さんと立花隆の対談本。
ノーベル賞選考委員の一人が「100年に1度の大研究」と称した、利根川さんの研究自体がとてもおもしろい。
かつ、サイエンティストとしての利根川さんの心構えが、データ分析全般を扱うひとにとって、
大いに刺激になる。


世界中でベストセラーになった『サピエンス全史』のハラリの新刊。
『銃・病原菌・鉄』とかが好きならオススメ。
人類史の様々なトピックを紐解きながら、今後の人類の行く末を解説。
純粋に知的好奇心が充たされる本。


タイトルからすると、コミュニケーション論のライトな本に思えるが、実は、
“自分は、細胞学的にどこまでが自分と言えるのか”、ということなどを含めて、
“自己存在”を人文学や脳科学など多岐なジャンルを横断して、科学者同士が対談する理系の書。
ひとつひとつのエピソードがすごい面白い。
※たとえば、つばや、糞尿は体の中にあるときは気にならないのに、
 体の外に出た瞬間、もはや触れたくもないものになる。
 では、自分という境界線はどこにあるのか、などを様々な科学ジャンルを横断しながら語られる。


| (5) 小説・漫画(コーディングに疲れてメンタルダウンしそうなときに自分を奮い立たせたい方向け)


あるピアノコンテストに参加するピアニストたちの群像劇。
天才少女や夢を諦められないサラリーマンなどが、
葛藤の中から、自分たちの最高のプレイを見出していくストーリー。
毎日、出社中の電車の中で、嗚咽して泣きながら読んでた。
『ちはやふる』とか『ピンポン』とか、そういう系が好きならオススメ。


社交ダンスをテーマにした漫画。いわゆる学生の青春もの。
ひょんなことから、社交ダンスをやることになった気弱な主人公が、
社交ダンスをやりながら、人間的にも成長していくヒューマンドラマ。


最初は、箱庭的学園ものかと思いきや、
2話目くらいから、急激な展開を見せて、一気にストーリーが加速。
設定の独特な視点も、駆け引きも面白く、続きが気になる。


さくらももこさん的なエッセイマンガが好きならオススメ。
日常のやさしいユーモラスなやりとりだけではなく、
おもわず、ぽろっとくることもあり。


みなさま、良い本とともに、良い年末年始をお過ごしくださいませ。