Talk Submission
If you are interested in attending this talk at PyCon JP 2016, please use the social media share buttons below. We will consider the popularity of the proposals when making our selection.
talk
仕事で使うちょっとしたコードをOSSとして開発メンテしていく - Django Redshift Backend の開発(ja)
Speakers
Takayuki Shimizukawa
Audience level:
Intermediate
Category:
Useful libraries
Description
AWSの「Redshift」は、Postgresqlベースで作られたデータウェアハウスです。ポスグレベースなのでpsqlで接続したりPythonのpostgres用ドライバが使えます。Djangoもポスグレ用ドライバで使えます、と思ったら色々問題あった。仕事で必要なんですけど。しょうがないので、Djangoに不慣れな私が手探りでDjangoのバックエンドを作って、公開して、バグレポに対応して、テストを書いて、テスト自動化して。OSS活動の各段階でどうやって進めてきたのか、紹介します。
Objectives
仕事で使うコードをOSSとして公開すること、公開する意義、OSS開発の取り組み方などをみなさんと共有したいと思います。DjangoがどうやってMySQLやPostgresqlなど複数のデータベースを切り換えて使えるようになっているのかにも触れます。
Abstract
手探りでDjangoのバックエンドを作って、公開して、バグレポに対応して、テストを書いて、テスト自動化して。OSS活動の各段階でどうやって進めてきたのか、紹介します。
DjangoのRedshift用データベースバックエンドを実装したのは、仕事で必要だったからです。
最初はSELECTでのみ動作確認していて、使える使える~と思ってたんですが、Django Adminでレコードを追加しようとしたら問題が起きました。Djangoが発行するSQLにRedshiftが対応してなかったんです。もうプロジェクトは進んでいて、そこ確認してなかったのかよ!状態。さてどうする?ということでDjangoのRedshift用バックエンドを実装しました。データベース接続する「ドライバー」はデータベースサーバーと通信しないといけないので実装とか大変そうに見えるんですが、今回作ったのはドライバではなくバックエンド。DjangoのデータベースバックエンドはDjangoのORMのやりたいことをSQLで組み立ててドライバに伝える中間層です。つまり、DjangoのコードどこかにあるSQL組み立て部分をハックして別のSQLを組み立てさせれば良い、ということです。それくらいなら、と思って作ってみたらコメント空白行除いて30行程度でした。しかもほとんど元コードのコピペです。これが django-redshift-backend の最初のバージョンでした。
そういったコードをどうして業務外の時間で実装したのか、どうしてPyPIに公開したのか、どうやって育てていったのか。また、自分が使っていない用途に対する利用者からの要望にどう対応していったのか。OSSコードを書いてメンテナンスしていくモチベーションは何か。Djangoのdatabase backendがどういう仕組みで書かれているのか、Djangoのようなフレームワークの中身のテストの書き方はどう調べたのか。django-redshift-backendの開発を題材に紹介します。
アウトライン
* DjangoとRedshiftの紹介
* Redshiftはポスグレ互換!からの~
* django-redshift-backend 紹介
* 最初の実装、最初のPull Request、PyPIへの公開
* なぜ仕事で使うコードを個人の時間で実装してOSSで公開したの?
* OSS開発とどうやってつきあっていくのか