木曜日 3:25 p.m.–4:10 p.m.
Room 203 #pyconjp_203PythonではじめるOpenAI Gymトレーニング
Takahiro Kubo(icoxfog417)
- 対象レベル:
- 中級
- カテゴリ:
- Big Data
- スライド:
- http://www.slideshare.net/takahirokubo7792/python-openai-gym
- ビデオ:
- https://youtu.be/u6hkBaWlHxg?list=PLMkWB0UjwFGlYvIcvKsGhJ7SJIODj_zJZ
説明
OpenAI Gymをご存知でしょうか。これは名前の通り"AI"をトレーニングするためのジムで、様々なゲームなどで自分の開発したAIを"トレーニング(学習)"させることができます。
本セッションでは、強化学習を用いたAIの開発方法と、OpenAI Gymを用いたトレーニングのさせ方について解説します。
概要
※基本的な流れは、Qiitaに掲載済みのこちらの記事に沿って行います
http://qiita.com/icoxfog417/items/242439ecd1a477ece312
ロボットから自動運転車、はては囲碁・将棋といったゲームまで、昨今多くの「AI」が世間をにぎわせています。
その中のキーワードとして、「強化学習」というものがあります。そうした意味では、数ある機械学習の手法の中で最も注目されている(そして誇張されている・・・)手法ともいえるかもしれません。
本発表では、その強化学習という手法について、基礎から最近目覚ましい精度を出しているDeep Q-learningまで、その発展の流れと仕組みについて解説をしていきたいと思います。そして、最終的にはPythonでそのアルゴリズムを実装し、OpenAIという強化学習のトレーニング用ライブラリを用いて学習させてみたいと思います。
**発表アウトライン**
* 強化学習の特性
* 強化学習のモデル化(Markov Decision Process)
* モデルの学習方法
* Value Iteration/Policy Iteration
* Q-learning
* Deep Q-learning
* 実践
* Deep Q-learningの実装
* OpenAI Gymを用いた実践