応募トーク

これは応募されたトークです。聞きたいと思うトークをSNSで拡散しましょう。選考時に参考にさせていただきます。

talk

PythonではじめるOpenAI Gymトレーニング(ja)

スピーカー

Takahiro Kubo(icoxfog417)

対象レベル:

中級

カテゴリ:

Big Data

説明

OpenAI Gymをご存知でしょうか。これは名前の通り"AI"をトレーニングするためのジムで、様々なゲームなどで自分の開発したAIを"トレーニング(学習)"させることができます。 本セッションでは、強化学習を用いたAIの開発方法と、OpenAI Gymを用いたトレーニングのさせ方について解説します。

目的

* 強化学習の理論的な内容 * Pythonを用いた強化学習の実装方法 * OpenAIを用いたトレーニングの実施方法

概要

※基本的な流れは、Qiitaに掲載済みのこちらの記事に沿って行います http://qiita.com/icoxfog417/items/242439ecd1a477ece312

ロボットから自動運転車、はては囲碁・将棋といったゲームまで、昨今多くの「AI」が世間をにぎわせています。 その中のキーワードとして、「強化学習」というものがあります。そうした意味では、数ある機械学習の手法の中で最も注目されている(そして誇張されている・・・)手法ともいえるかもしれません。

本発表では、その強化学習という手法について、基礎から最近目覚ましい精度を出しているDeep Q-learningまで、その発展の流れと仕組みについて解説をしていきたいと思います。そして、最終的にはPythonでそのアルゴリズムを実装し、OpenAIという強化学習のトレーニング用ライブラリを用いて学習させてみたいと思います。

発表アウトライン

  • 強化学習の特性
  • 強化学習のモデル化(Markov Decision Process)
  • モデルの学習方法
    • Value Iteration/Policy Iteration
    • Q-learning
  • Deep Q-learning
  • 実践
    • Deep Q-learningの実装
    • OpenAI Gymを用いた実践
フィードバックを入力してください。