応募トーク

これは応募されたトークです。聞きたいと思うトークをSNSで拡散しましょう。選考時に参考にさせていただきます。

talk

Pythonで始めるデータマネジメント(ja)

スピーカー

Satoshi Nagayasu

対象レベル:

初級

カテゴリ:

Big Data

説明

今回紹介するツール(※5~6月頃公開予定、名称未定)はデータマネジメントのためのOSSのツールです。 このツールを使うことでデータ管理業務のタスクを容易に実施することができるようになります。 この発表では、なぜこのツールが必要だったのか、どのように実現したのか、どのように使っているかについて紹介します。

目的

データ分析業務で必要とされるデータマネジメントのタスクを理解できる。 ツールを使ってデータマネジメントを実施することができるようになる。

概要

Pythonがデータ分析と相性がいいのは皆さんご存知の通りですが、実際のデータ分析の現場では、データ分析以外にもデータの調査、チェック、共有など、さまざまなデータマネジメント(管理)業務が発生します。この業務は、大量かつ多様なデータを扱わなければならないビッグデータの環境では非常に大きな負荷になります。 また、データの活用のためには、データそのものだけではなく、データや分析に関連するナレッジの共有も必要になってきます。 これらの手間のかかるデータ管理のタスクを省力化・自動化しつつ、分析に必要なナレッジを共有するためのツールをPythonで開発しました。本ツールは近日中にOSSとして公開する予定です(5~6月頃公開予定)。 本セッションでは、なぜDBエンジニアがデータマネジメントツールを開発する必要があったのか、どのようなことができるのか、実際にどのように使われているのか、などについてご紹介します。
  • このエントリーをはてなブックマークに追加
CONTACT