Talk Submission
If you are interested in attending this talk at PyCon JP 2016, please use the social media share buttons below. We will consider the popularity of the proposals when making our selection.
talk
ビッグデータとPythonではじめる野球の統計分析(ja)
Speakers
Shinichi Nakagawa , Ai Makabi
Audience level:
Intermediate
Category:
Big Data
Description
野球統計学「セイバーメトリクス」および、高性能スピードガン「PITCHf/x」の登場で近年最高の盛り上がりをみせている野球のビッグデータを用いたデータ分析・可視化をPythonとその周辺技術(OSSなど)を用いて行う実践例を紹介します.
Objectives
Beautifulsoupを用いたWebサイトのスクレイピングとそのノウハウ, Pythonを用いたデータの前処理・クレンジング(pandas他), PyData環境(Jupyter他)を使ったデータ分析と可視化の実践例, 野球統計学「セイバーメトリクス」の基礎と応用, メジャーリーグの一球速報データ「PITCHf/x」を用いた野球データの分析と可視化...以上の知見・ノウハウをお持ち帰りいただけるとありがたいです.
Abstract
# ビッグデータとPythonではじめる野球の統計分析〜Analyzing Baseball Data With Python
## あらすじ
メジャーリーグをはじめとして、日本プロ野球や他の球技において、競技データの収集、分析、可視化が盛んに行われています。日本でも少しずつではありますが、野球統計学「セイバーメトリクス」が市民権を得始め、「打率より出塁率」「勝利よりQS(Quality Start)」といった議論ができるようになってきました.
一方、野球データ分析の最先端を行くメジャーリーグでは、スコアデータを元にした従来のセイバーメトリクスは過去のモノになりつつあり、
* 外野手の肩や足は守備にどれだけ影響をあたえるのか?
* 先発投手の健康状態や疲労はデータで分析できるのではないか?
* 捕手によってストライクかボールが変動するのでは?
といった仮説の元、選手の「投げる」「打つ」「走る」「守る」をより詳細なデータで可視化・分析を行うのがトレンドとなっています。
そんな最先端の野球をメジャーリーグのビックデータとPythonで楽しんでみませんか?
## Keyword
### Python
* Beautifulsoup
* Jupyter(IPython notebook)
* Pandas
* pitchpx(PITCHf/x dataset library) ※Speaker(@shinyorke)が独自に開発・OSS化
### 野球
* セイバーメトリクス(野球統計学)
* PITCHf/x
* Stats Cast
* ビッグデータベースボール