Chainerと読む「深層学習」-vol.1
「深層学習 (機械学習プロフェッショナルシリーズ) 」をChainerのコードと交えて読み進めようという趣旨。
こんにちは。最近DeepLearningの学習環境が整ってきていますね。
先日「機械学習(DeepLearing)の本と実際のコードを交えた資料があるとわかりやすい」という声を聞いたので、"Chainerと読む「深層学習」"をやってみたいと思います。
手探りで試行錯誤しながらなので、何か質問や意見があればコメントをください。
今回は導入として内容は2つです。
- 環境設定
- 深層学習の概要
では、よろしくお願いします。
Chapter0 事前準備
僕の機械学習環境を紹介します。
この記事を読むにあたって、必要なものは随時用意しましょう。
- 深層学習 (機械学習プロフェッショナルシリーズ)
- MacBookPro(OSX Yosemite, CPU:corei7 2.7Ghz, メモリ:8GB)*1
- DesktopPC(Ubuntu14.04, CPU:xeon E5-1620v3 x8, メモリ:64GB, GPU:GTX TITAN X)*2
- Python2.7 (python.jp)
- Chainer (Chainer: A flexible framework of neural networks)*3
- その他、Python周辺のパッケージ*4
PythonやChainerのインストールはQiitaや個人ブログにたくさんあるので、適宜参考してください。
import chainer
が成功すれば準備は完了です。
Chapter1 はじめに
1.1 本書の紹介
本書「深層学習 (機械学習プロフェッショナルシリーズ) 」は【機械学習プロフェッショナルシリーズ】の一つで初めてDeepLearningを学ぶ人にオススメです。
QiitaやSlideShareにもDeepLearningを紹介するものがたくさんあるのですが、
簡略化されている部分が多いので、きちんと理解したい人は本書をどうぞ。
本書の目次は以下のとおり
第1章 はじめに
第2章 順伝播型ネットワーク
第3章 確率的勾配降下法
第4章 誤差逆伝播法
第5章 自己符号化器
第6章 畳込みニューラルネット
第7章 再帰型ニューラルネット
第8章 ボルツマンマシン
DeepLearningの基礎となる情報が揃っていますね。これを一通り学べば最近の研究内容も理解しやすいでしょう。ちなみに第5, 7, 8章は自分自身もまだ詳しくないので勉強しておきます。
1.2 DeepLearningの歴史
第1章はコード化する部分がないので要約だけ。
- 1940, 90年代: 多層NNの研究はあったが学習がうまくいかなかった。*5
- 2000年代: 事前学習によって初期値をうまく設定すると学習がうまくいった。
- 2010年代: 画像認識や音声認識の分野で大きな成果を残した。*6
- 現在: 様々なタスクで成果を収める。とても流行する。
- 理論だけでなく分散処理, GPU計算など計算能力の向上もDeepLearningが成功した大きな要因。
最近はトヨタも人工知能に投資していて、本当に流行っているんだなあとしみじみ。
過度な期待をされていて、いつかバブルが崩壊するのではと危惧しています...。けれども、しばらくは様々な分野に応用できる素晴らしい技術なのは確実。このビックウェーブを逃さず、しっかり知識をつけましょう。