進捗
本を読みながら、サンプルコードを実行してみて動作を確認しています。
ただ、それだと本通りの結果が出るだけで、正直あんまりおもしろくない。
ふ〜んって感じ。
この本には様々な機械学習(教師あり、なし)、前処理の例が載っていて、とても勉強になります。
特に理論ではなく、Pythonで書く場合にどうすれば良いかが示されているのが良い(笑)
例えば主成分分析(PCA)や非負値行列因子分解(NMF)などについて、数式で説明するのではなく、こんな感じの処理でこういう結果が得られるよって文章で説明された後に、Pythonで書くとこうという感じという具合の内容になっています。良く言えば非常に実践的な内容です。
数式アレルギーの人にオススメ。
ただ4章あたりから急に難しくなってきます。(個人的に)
というのも以前仕事で多変量解析を少しかじったことがあるので、3章までで説明される各種処理についてはある程度聞いたことがありました。
しかし4章「データの表現と特徴量エンジニアリング」から様子が変わります。
おそらく昨今のデータマイニングとやらはこの辺の知識のことなのでしょう。
もうちょっと勉強して何か解析結果を記事にしてみたいものです。
結局のところ、株は予測できるのかな。今大暴落中だけど。