応募トーク

これは応募されたトークです。聞きたいと思うトークをSNSで拡散しましょう。選考時に参考にさせていただきます。

talk

ビッグデータとPythonではじめる野球の統計分析(ja)

スピーカー

Shinichi Nakagawa , Ai Makabi

対象レベル:

中級

カテゴリ:

Big Data

説明

野球統計学「セイバーメトリクス」および、高性能スピードガン「PITCHf/x」の登場で近年最高の盛り上がりをみせている野球のビッグデータを用いたデータ分析・可視化をPythonとその周辺技術(OSSなど)を用いて行う実践例を紹介します.

目的

Beautifulsoupを用いたWebサイトのスクレイピングとそのノウハウ, Pythonを用いたデータの前処理・クレンジング(pandas他), PyData環境(Jupyter他)を使ったデータ分析と可視化の実践例, 野球統計学「セイバーメトリクス」の基礎と応用, メジャーリーグの一球速報データ「PITCHf/x」を用いた野球データの分析と可視化...以上の知見・ノウハウをお持ち帰りいただけるとありがたいです.

概要

# ビッグデータとPythonではじめる野球の統計分析〜Analyzing Baseball Data With Python ## あらすじ メジャーリーグをはじめとして、日本プロ野球や他の球技において、競技データの収集、分析、可視化が盛んに行われています。日本でも少しずつではありますが、野球統計学「セイバーメトリクス」が市民権を得始め、「打率より出塁率」「勝利よりQS(Quality Start)」といった議論ができるようになってきました. 一方、野球データ分析の最先端を行くメジャーリーグでは、スコアデータを元にした従来のセイバーメトリクスは過去のモノになりつつあり、 * 外野手の肩や足は守備にどれだけ影響をあたえるのか? * 先発投手の健康状態や疲労はデータで分析できるのではないか? * 捕手によってストライクかボールが変動するのでは? といった仮説の元、選手の「投げる」「打つ」「走る」「守る」をより詳細なデータで可視化・分析を行うのがトレンドとなっています。 そんな最先端の野球をメジャーリーグのビックデータとPythonで楽しんでみませんか? ## Keyword ### Python * Beautifulsoup * Jupyter(IPython notebook) * Pandas * pitchpx(PITCHf/x dataset library) ※Speaker(@shinyorke)が独自に開発・OSS化 ### 野球 * セイバーメトリクス(野球統計学) * PITCHf/x * Stats Cast * ビッグデータベースボール
  • このエントリーをはてなブックマークに追加