記憶力が無い

プログラミングとランニングとカメラと何か

BIツール比較(Metabase・Redash・Superset) データソース偏

最近、本業の方ではBigQuery + RedashによるBI環境構築をやっていたりします。

Redash*1はなかなかよくできたツールですが、 それなりに触ってみるとイケてないところに気が付くこともあります。 Redash以外に使えそうなBIツールがないか探したところ、Metabase*2やSuperset*3が見つかりました。

現時点(2020-03-29)でのGithubリポジトリのスター数は

  • Superset: 28.2k
  • Metabase: 19.9k
  • Redash: 15.7k

となっています。

早速インストールして使い勝手を比較...の前に、先ずはそれぞれが対応しているデータソースの比較をしてみようと思います。

対応データソース比較表

  • 〇 -> 公式に対応
  • △ -> (Metabaseのみ)コミュニティDriverによる対応
データソース Metabase Redash Superset
Amazon Redshift
Apache Druid
Google BigQuery
MySQL
Oracle
PostgreSQL
Presto
Snowflake
SQL Server
SQLite
Vertica
Amazon Athena
ClickHouse
IBM Db2
Apache Hive
Apache Impala
Apache Kylin
Elasticsearch
Google Spreadsheets
Greenplum
Apache Spark SQL
Teradata
Apache Drill
Apache Pinot
Exasol
Hana
Google Analytics
MongoDB
Databricks
Amazon Aurora
Amazon DynamoDB
Axibase TSDB
Azure Data Explorer (Kusto)
Cassandra
CockroachDB
Graphite
InfluxDB
JIRA
JSON
MemSQL
OmniSciDB
Prometheus
Python
Qubole
Rockset
Salesforce
ScyllaDB
Shell Scripts
TreasureData
Yandex AppMetrica
Yandex Metrica
CSV
H2
Cube.js
Datomic
Firebird
Materialize

情報源

github.com

redash.io

superset.apache.org

考察

  • 対応してるデータソースの数的にはRedashが一番多い
    • Graphite、InfluxDB、Prometheusなんかも使えるので、監視システムとしても使えそう
    • PythonやShellも対応してるので、やろうと思えばなんでもできる
  • 職場ではHiveやImpalaなんかも使ってるので、Metabaseだと今後データソースを追加したくなったときに辛いかも
  • ドキュメントに載ってないデータソースも実装されていたりする
  • どれもまだまだ発展途上なので、データソースの対応状況などは今後大きく変わるかも

とりあえず次はSupersetを試してみようかなぁ。

Copyright © 2017 ttk1