メジャーリーグの一球速報データとPythonを用いた野球Hack〜選手の調子と未来を可視化
Shinichi Nakagawa
- 対象レベル:
- 初級
- カテゴリ:
- Big Data
説明
TV中継およびネット速報でお馴染みの「野球の一球速報」.
メジャーリーグでは日本プロ野球の一球速報以上に細かいデータ(球速・球種・ボール回転数・落下位置etc...)を用いてより詳細な一球速報「At Bat」を運用しており、更にAt Batのデータは公開されておりHackすることが可能です(一部ライセンスに制限あり)
当ポスターセッションではAt Batのデータの読み方を解説しつつ、Python(Jupyter, pandasなど)を用いた「選手の好不調と未来」の可視化および、これらのデータを何に使えるか?をディスカッションできればと思っています.
概要
# メジャーリーグの一球速報データとPythonを用いた野球Hack〜選手の調子と未来を可視化
## 背景
TVやネットの中継で用いられる野球の実況データはスピードガンおよび、専門のスコアラー(大抵の場合はデータ分析会社のアルバイト)が記録したデータを配信し用いています.
これらのデータは基本的にクローズドで一般のユーザー(特に開発者)が触れるものではありませんが、スポーツのデータ分析が発達しているアメリカでは、
* Pitch f/x, StatsCastといった画像分析ベースでのデータ取得&リアルタイム配信が発達
* 全米(+世界中の野球ファン)が今までに無いデータ(打球の速度や落下点など)で野球を楽しめる
* データが一部公開されており、これらをhackするための環境とノウハウが揃いつつある
と、日本では考えられないぐらい進化しています.
これらの背景を解説した上で、利用例や活かし方について幅広くディスカッションできればと思っています.
## 展示(アウトライン)
* MLBとNPBのデータの違い
* Pitch f/xとStatsCast
* Pitch f/xを用いた選手の好不調および未来の予測(例)
これらの解説ポスターを元に、実践例や出来ることについて、参加者の皆様から幅広く意見をいただければと思っています.
## 参考
まだ試作品ですがいくつか紹介しています.
* [岩隈久志(SEA)のナイスピッチングをPythonで可視化(Jupyter,seaborn,pitchpx)](http://qiita.com/shinyorke/items/2c2e2c3976fc2d1ed051)
* [自分で作ったPythonの野球ライブラリをパッケージング&PyPIに公開してみた](http://qiita.com/shinyorke/items/79379c1a7e1107c3a188)
また、データのライセンスについては以下に従っています.
* [copyright(MLB)](http://gd2.mlb.com/components/copyright.txt)
* [MLBの野球データのライセンスについて(MLBAM) ※私の解釈です](http://qiita.com/shinyorke/items/566f1b7e7687492a0c7f)