Talk Submission

If you are interested in attending this talk at PyCon JP 2016, please use the social media share buttons below. We will consider the popularity of the proposals when making our selection.

talk

PythonではじめるOpenAI Gymトレーニング(ja)

Speakers

Takahiro Kubo(icoxfog417)

Audience level:

Intermediate

Category:

Big Data

Description

OpenAI Gymをご存知でしょうか。これは名前の通り"AI"をトレーニングするためのジムで、様々なゲームなどで自分の開発したAIを"トレーニング(学習)"させることができます。 本セッションでは、強化学習を用いたAIの開発方法と、OpenAI Gymを用いたトレーニングのさせ方について解説します。

Objectives

* 強化学習の理論的な内容 * Pythonを用いた強化学習の実装方法 * OpenAIを用いたトレーニングの実施方法

Abstract

※基本的な流れは、Qiitaに掲載済みのこちらの記事に沿って行います http://qiita.com/icoxfog417/items/242439ecd1a477ece312 ロボットから自動運転車、はては囲碁・将棋といったゲームまで、昨今多くの「AI」が世間をにぎわせています。 その中のキーワードとして、「強化学習」というものがあります。そうした意味では、数ある機械学習の手法の中で最も注目されている(そして誇張されている・・・)手法ともいえるかもしれません。 本発表では、その強化学習という手法について、基礎から最近目覚ましい精度を出しているDeep Q-learningまで、その発展の流れと仕組みについて解説をしていきたいと思います。そして、最終的にはPythonでそのアルゴリズムを実装し、OpenAIという強化学習のトレーニング用ライブラリを用いて学習させてみたいと思います。 **発表アウトライン** * 強化学習の特性 * 強化学習のモデル化(Markov Decision Process) * モデルの学習方法 * Value Iteration/Policy Iteration * Q-learning * Deep Q-learning * 実践 * Deep Q-learningの実装 * OpenAI Gymを用いた実践
  • このエントリーをはてなブックマークに追加