プロポーザル
これは応募されたプロポーザルです。聞きたいと思うプロポーザルを各ページの下部にあるSNSのボタンで拡散しましょう。拡散された投稿をプロポーザルへの投票としてカウントし、選考時に参考にさせていただきます。
talk
Pythonによる文章自動生成入門!Python ✖︎ 自然言語処理 ✖︎ ディープラーニング(ja)
スピーカー
Hiromitsu Ota
対象レベル:
初級
カテゴリ:
Big Data
説明
◇Pythonを用いて、文書を自動生成する主要な3つの方法をお伝えします。
1)マルコフ連鎖、 2)自動要約、 3)ディープラーニング(RNN/ LSTM)
◇特にKeras/ Tensorflowによる文章自動生成はPythonで数行で簡易的に書けます。
◇文章などのデータを非構造化データと呼びますが、身近でデータ収集がしやすく、個人の趣味やちょっとした研究に適しています。
目的
◇ディープラーニングの発展で、画像分類の精度向上が大幅に向上しました。
◇画像分類だけでなく、自然言語や音声にも適用できます。
◇今回は、Pythonを用いて自然言語処理の面からディープラーニングの有用性を検証してみたいと思います。
概要
◇今や非構造化データは溢れていて、最も入手しやすい資源です。これを次の3つの手法で、文章生成し、有用な利用方法を提案して見たいと思います。
1)マルコフ連鎖、 2)自動要約、 3)ディープラーニング(RNN/ LSTM)
◇用途として、例えば、亡くなったおじいちゃん、おばあちゃんの手紙があれば、その文面から、おじいちゃんやおばあちゃんのメールが届くなどの利用が考えられます。つらい時や悲しい時、励ましの文章が届くアプリなどの開発につなげられます!
◇海外ではNatural Language Generation(NLG)として、コンペティションの大会が開催されていて、実はホットなテーマなんです!
ー流れー
◇1)−3)の理論的な説明➡︎コードの説明➡︎実演
◇OUTPUT: 1)マルコフ連鎖 2)自動要約、 3)ディープラーニング(RNN/ LSTM)
◇FOLLOW: ポスターセッション(文章自動生成を体験しよう!知ろう!)でも詳しく説明いたします!
※データ量: どのくらいの文字データがあれば、どのくらいの文章が生成されるのかについてのベンチマーク的な情報もお伝えしたいと思います。