Python を用いたデータ分析入門
概要
何らかの意思決定を行う際の強い味方「データ分析」。
今回のチュートリアルでは新たにデータ分析の世界に入門してみたい方向けに Python とその便利なライブラリ Pandas + scikit-learn を用い、統計学の様々な手法を利用してデータを解釈するための方法、可視化、そのための前処理などについてのハンズオンを行います。
身につく内容
- ビジネスにおけるデータ分析の流れ
- データの可視化(グラフの作成)
- 基礎統計量による分析(平均・分散など)
- データの相関と回帰(重回帰分析)
- データの分類(決定木分析)
対象者
- Python もしくはデータ分析に興味のあるかた。
- 高校数学の基礎知識を持っている。
- 何らかの言語によるプログラミング経験があることが望ましい。
用意するもの
以下の環境を導入済みのノートPC。
- Python 3.4.0 以降。
- Pandas + scikit-learn の導入。
- Jupyter Notebook を利用できる環境。
(Anaconda を利用して上記導入する方法を別途記載予定)
CSVデータのダウンロード。(詳細が決まり次第掲載予定)
募集人数
25名