応募トーク
これは応募されたトークです。聞きたいと思うトークをSNSで拡散しましょう。選考時に参考にさせていただきます。
talk
競馬の順位予測モデルの構築から学ぶ Pythonによる機械学習の基礎(ja)
スピーカー
Mitsuki Sugiya
対象レベル:
初級
カテゴリ:
Other
説明
競馬という題材をもとに, Pythonと周辺ライブラリを用いた競馬の順位予測モデル構築の流れおよび機械学習の基礎, ライブラリの解説をします.
目的
Webスクレイピング技術, Pythonと周辺ライブラリを用いたデータクレンジング処理・チューニング・学習アルゴリズムの作成, モデル構築の流れ, 機械学習および競馬の基礎知識
概要
最近Python界隈でも盛り上がりをみせる機械学習. とはいっても, 具体的に何をどう使うの?方法は?という人は多いかと思います.
本talkでは, 競馬の順位を予測するという題材をもとに,
* 機械学習の基本知識
* データの選定, データクレンジング
* 予測モデル構築の流れ, チューニング
* 予測モデルの評価方法
* Python周辺の機械学習ライブラリの紹介と使用例
* pandas
* scikit-learn
を解説していきます.
また, 競馬の順位予想をする際に大変重要となるデータ(血統, 馬体, 調教など)や, 既に存在する競馬の予測法についても触れます.
2016年6月時点の私が作成したアルゴリズムでは予測率は7割程度で, プロの予測にはまだまだ負けてしまいますが, PyConJP2016当日までに9割以上に引上げるべく日々パラメータ調整との戦いをしています.
(機械学習はデータのクレンジングとこのパラメータ調整がほとんど!!)
よく機械学習の作業過程は地味だと言われるのですが, データ同士の関連性に新しい発見を見たときの驚きや, 予測率が上がったときの喜びは, 人生に地味とは程遠い色を与えてくれるものです.
みなさんもぜひ, 機械学習について学び自分だけの予測モデルを作成して, あなたと競馬, 今すぐ億万長者!を目指しましょう.