TableauWorkbookをgit管理しやすくする自作ツールをGitHubに公開した

最近は仕事でTableauDesktopを扱うことが増えた。
そしてTableauDesktopのファイル形式(.twb)は、SCMには全然向いていない感じである。 今こそツールを作成し、GitHubで公開するときである。
同時にブログを書く時である。

ゆえに、作った

はい、作った。GitTableauCleanFilterである。

github.com

TableauのファイルTableauWorkbookは、実際はXMLファイルなのだが、

  • BIツール上のダッシュボードサムネイル画像を内部に保存(いちいち差分で現れる)
  • 外部ファイルは絶対パスで保存

と、SCMで管理するには向いていない問題があった。
とりわけサムネイルはBASE64で記載された画像(PNGBMP)であり、これだけで数百KBあるのはザラである。

このツールをgitのClean filterとして登録すれば、

と、それなりにgitでの実用に耐えるようにする。
XMLエンコーダーの動作により、オリジナルファイルでは10進数表示が16進数に変換されてしまったりするが、実働には問題は見つかっていない。

ちなみに、TableauのPackagedWorkbook(.twbx)は、HyperDBデータなどを含めてzip圧縮されたtwbファイルなので、gitでの管理にはいよいよ向いていない。