目次
鈴木です。
Metabaseというデータ可視化ツールがあります。データをチャートやダッシュボードにして可視化できます。
オープンソースのデータ可視化ツールにはMetabaseのほかにも、Redash、Superset、Kibanaなどいくつかあります。その中でもMetabaseは後発なだけあって、他と比べシンプルで、画面もきれいです。SQLの知識も不要です。使ってみるまでのステップも他のツールに比べ非常に簡単で、Dockerコマンドや、jarファイル1個でのJVM起動のほか、AWSであればElastic Beanstalkでの起動も公式に用意されています。
データソースとしては、PostgreSQL/MySQLやSQL Serverなどのデータベースのほか、AWSのRedshiftやGCPのBigQueryのクラウドサービスにも対応しています。SAPなどの基幹システムに入っているデータも、連携の仕組みを構築すれば、Metabaseで分析することが可能になります。
このようにAWSやGCPといったクラウドとの親和性も高いオープンソースのデータ可視化ツールであるMetabaseの機能をこの記事ではかいつまんでご紹介します。
※細かいご説明は私のブログ等にリンクを貼らせていただいております。ツール比較はデータ可視化ツール(Metabase, Redash, Superset)の比較メモという記事も書かせていただいております。
グラフの種類
Metabaseではグラフやメータなどの可視化ひとつひとつをQuestionと呼びます。データに対して問い合わせ(Question)をすると答え(Answer)を可視化してくれます。
高価な有償ツールには及ばないところもありますが、多くの種類のグラフを作ることができます。
作成できるグラフの種類はQuestionの可視化種類のまとめでもご紹介しています。
グラフではなくレコードをそのまま表示することもできます。
グラフを作成するための元データは接続しているデータベースにあるテーブルです。そのテーブルの内容をソートしたり、特定のフィールドで絞り込んだり、グルーピングしたり、合計や平均などを計算したり、他のテーブルとJOINしたり、多彩な処理がマウスでカチカチするだけで可能です。次の記事でもグラフの作成や編集の方法をご紹介しています。
MetabaseのQuestion画面の使い方
MetabaseのQuestion作成・保存方法
ダッシュボード
ダッシュボードはグラフや表などでの可視化(Question)を1画面に収めて、全体をひと目で把握できるようにしたものです。
マウスでカチカチとかんたんにダッシュボードを構築することができます。次の記事でダッシュボードの画面の使い方をご紹介しています。
MetabaseのDashboard画面の使い方
Automatic exploration
MetabaseにはAutomatic explorationという機能があります。テーブルに入っているデータをさまざまなグラフで自動的に可視化してくれます。レコード数表示、分布状況の棒グラフ、時系列データであればその推移の折れ線グラフなどが並びます。
全自動で作成されたグラフですのでデータの内容を理解していればピント外れに感じるグラフもありますが、初めて見るデータの分析の入り口としては面白いかもしれません。
グラフをクリックするとそのグラフの拡大の画面に移り、グラフの設定を変更したり絞り込みができたりします。
Metabaseの用語
MetabaseにおけるQuestionとCollection、Dashboardの関連を把握しておくと、画面がわかりやすいです。Metabaseの用語のまとめでもご説明しています。
データソース
Metabaseは外部のデータベースを参照してデータを分析します。Metabase自身には分析対象となるデータを保存する機能はありません。
以下の種類のデータベースを参照できます。
BigQuery (GCP)
Druid
Google Analytics
H2
MongoDB
MySQL
PostgreSQL
Presto
Redshift (AWS)
Snowflake
Spark SQL
SQL Server
データがすでにこれらのデータベースに入っていればすぐに始めることができます。なければ分析用のデータベースを立ててデータを連携すればよいです。
アクセス権限管理
Metabaseにはユーザを識別してログインしてから利用することになります。LDAPなどとの連携も可能です。
ユーザをユーザグループに所属させ、利用できるデータベースをユーザグループごとに細かく権限設定できます。
グラフやダッシュボードはPublic Sharingという機能により公開用のURLを発行することができます。公開用URLを使えばログインせずに閲覧することも可能です。Metabaseを社内ネットワークにインストールし、外部からアクセスできないようにすれば、社内全体に共有するということも簡単です。
まとめ
オープンソースのデータ可視化ツールも最近は充実してきており、導入も比較的簡単ですので、BIツールを検討する際には、高価なBIツールのほかに、Metabaseのようなオープンソースのツールも検討に入れてみてはいかがでしょうか。