Talk Submission

If you are interested in attending this talk at PyCon JP 2016, please use the social media share buttons below. We will consider the popularity of the proposals when making our selection.

talk

競馬の順位予測モデルの構築から学ぶ Pythonによる機械学習の基礎(ja)

Speakers

Mitsuki Sugiya

Audience level:

Novice

Category:

Other

Description

競馬という題材をもとに, Pythonと周辺ライブラリを用いた競馬の順位予測モデル構築の流れおよび機械学習の基礎, ライブラリの解説をします.

Objectives

Webスクレイピング技術, Pythonと周辺ライブラリを用いたデータクレンジング処理・チューニング・学習アルゴリズムの作成, モデル構築の流れ, 機械学習および競馬の基礎知識

Abstract

最近Python界隈でも盛り上がりをみせる機械学習. とはいっても, 具体的に何をどう使うの?方法は?という人は多いかと思います. 本talkでは, 競馬の順位を予測するという題材をもとに, * 機械学習の基本知識 * データの選定, データクレンジング * 予測モデル構築の流れ, チューニング * 予測モデルの評価方法 * Python周辺の機械学習ライブラリの紹介と使用例 * pandas * scikit-learn を解説していきます. また, 競馬の順位予想をする際に大変重要となるデータ(血統, 馬体, 調教など)や, 既に存在する競馬の予測法についても触れます. 2016年6月時点の私が作成したアルゴリズムでは予測率は7割程度で, プロの予測にはまだまだ負けてしまいますが, PyConJP2016当日までに9割以上に引上げるべく日々パラメータ調整との戦いをしています. (機械学習はデータのクレンジングとこのパラメータ調整がほとんど!!) よく機械学習の作業過程は地味だと言われるのですが, データ同士の関連性に新しい発見を見たときの驚きや, 予測率が上がったときの喜びは, 人生に地味とは程遠い色を与えてくれるものです. みなさんもぜひ, 機械学習について学び自分だけの予測モデルを作成して, あなたと競馬, 今すぐ億万長者!を目指しましょう.
  • このエントリーをはてなブックマークに追加