木曜日 1:30 p.m.–2 p.m.
Room 202 #pyconjp_202ビッグデータとPythonではじめる野球の統計分析
Shinichi Nakagawa, Ai Makabi
- 対象レベル:
- 中級
- カテゴリ:
- Big Data
- スライド:
- http://www.slideshare.net/shinyorke/python-pyconjp-66286163
- ビデオ:
- https://youtu.be/QtnoK16yPNk?list=PLMkWB0UjwFGlYvIcvKsGhJ7SJIODj_zJZ
説明
野球統計学「セイバーメトリクス」および、高性能スピードガン「PITCHf/x」の登場で近年最高の盛り上がりをみせている野球のビッグデータを用いたデータ分析・可視化をPythonとその周辺技術(OSSなど)を用いて行う実践例を紹介します.
概要
# ビッグデータとPythonではじめる野球の統計分析〜Analyzing Baseball Data With Python
## あらすじ
メジャーリーグをはじめとして、日本プロ野球や他の球技において、競技データの収集、分析、可視化が盛んに行われています。日本でも少しずつではありますが、野球統計学「セイバーメトリクス」が市民権を得始め、「打率より出塁率」「勝利よりQS(Quality Start)」といった議論ができるようになってきました.
一方、野球データ分析の最先端を行くメジャーリーグでは、スコアデータを元にした従来のセイバーメトリクスは過去のモノになりつつあり、
* 外野手の肩や足は守備にどれだけ影響をあたえるのか?
* 先発投手の健康状態や疲労はデータで分析できるのではないか?
* 捕手によってストライクかボールが変動するのでは?
といった仮説の元、選手の「投げる」「打つ」「走る」「守る」をより詳細なデータで可視化・分析を行うのがトレンドとなっています。
そんな最先端の野球をメジャーリーグのビックデータとPythonで楽しんでみませんか?
## Keyword
### Python
* Beautifulsoup
* Jupyter(IPython notebook)
* Pandas
* pitchpx(PITCHf/x dataset library) ※Speaker(@shinyorke)が独自に開発・OSS化
### 野球
* セイバーメトリクス(野球統計学)
* PITCHf/x
* Stats Cast
* ビッグデータベースボール