リレーションシップ (タブロー2020.2.1)

リレーションシップ (タブロー2020.2.1)

商業動態統計調査(オープンデータ)を利用して、タブロー2020.2.1の新機能、データの「リレーションシップ」について解説しています。

データ表を分割します

データ表
データサンプル

<データ出典>
政府統計の総合窓口「e-Stat」(https://www.e-stat.go.jp/)
商業・サービス業>商業動態統計調査>時系列データ>
コンビニエンスストア商品別販売額等及び前年(度、同期、同月)比
家電大型専門店商品別販売額等及び前年(度、同期、同月)比
ドラッグストア商品別販売額等及び前年(度、同期、同月)比
ホームセンター商品別販売額等及び前年(度、同期、同月)比を加工して作成

 データ表は画像のように行が日付です。
・B、C、D、E列がそれぞれ列名に記載されている商品(カテゴリ)ごとの売上高(単位百万円)
・F列がコンビニエンスストアの店舗数になっています。

このデータ表は、
① 月別・商品別売上高のデータ表
② 月別店舗数のデータ表
①と②が合体したクロス集計形式のデータ表です。

 このデータ表を分割します。

<現在のデータ表>
・ディメンション:YYYY/MM/DD
・メジャー:B列からF列までの5種類

トレーニング用データはこちら

分割してデータ形式を変更する
もとデータから①と②を作成します。

トレーニング用データはこちら

①(月別・商品別売上高のデータ表)の商品(カテゴリ)列をピボットして列指向形式へ変換します。
 「業種」の列を追加します。内容はすべて「コンビニエンスストア」です。

エクセルPower Query エディターを使用したピボットはこちらをご参照ください

 これでデータ表①が完成です。
・ディメンション:
 A列=YYYY/MM/DD
 B列=属性(商品)
 D列=業種
・メジャー:
 C列=値(売上高)
 列指向形式へ変換されました。

②(月別店舗数のデータ表)は、BからEの列を削除すれば完成です。
 A列=YYYY/MM/DD
 B列=店舗数

<ポイント> 
 データ表①とデータ表②は「YYYY/MM/DD」をKEYにしてリレーションすることができるようになっています。
 データ表をリレーションするためには、KEYになるフィールド(列)が必要です。

別ブックのデータも同様に編集する
画像はE-Statのページから
ドラッグストアのもとデータです。

 業種が「ドラッグストア」というデータ表が別ブックであります。さらに、「大型家電専門店」と「ホームセンター」の別ブックもあります。

 全部で
・業態=4
・それぞれの業態のメジャー数=2(売上高と店舗数)
 4×2=8データ表になるところを、最終的に2データ表へまとめます。

①、②を作成した手順と同様に③、④を作成します。

 ドラッグストアもコンビニエンスストアと同様に③(月別・商品別売上高のデータ表)を列指向形式へ、③(月別店舗数のデータ表)は店舗数だけをとり出します。

 現在のデータ表数は、
・業態数2×メジャー数2=4表
 ①~④の4表になっています。

最終的には
・業態数4×メジャー数2=8表になりますね。

くっつける

・店舗数データの②(コンビニの店舗数)と④(ドラッグストアの店舗数)を結合します。
・ピボットして列指向形式へ変換します。

A列=YYYY/MM/DD
B列=業態
C列=店舗数

すべてに共通するKEYは「YYYY/MM/DD」です。

・①(コンビニの売上高)と③(ドラッグストアの売上高)をユニオン(縦結合)します。

 これで4表に分かれていたデータが⑤と⑥の2表になりました。

 「大型家電専門店」と「ホームセンター」のデータ表も同様に分解・ピボット・結合します。
 これで、「業態」(ブック・シート)や「商品」(列)はもちろん「YYYY/MM/DD」(行)がどんどん増えたとしてもデータ表の数は常に2表におさまります。。

リレーションシップ(タブロー)

2020.2.1新機能

 データ表は画像のとおりです。(ちょっと整えています)
 データはこの記事の下の方からダウンロードまたはコピーできます。

 まず、タブローから
・データ表⑤(各業態の店舗数)へ接続します。
・データ表⑥(各業態の売上高)をドロップします。

 旧バージョン(2020.1以前)ではデータが「結合」されます。新バージョン(2020.2)では「リレーションシップ」になります。

・関係句?(結合ではないので結合句ではないのだろうと思います)を左右のデータ表から選択します。
・サンプルデータでは「YYYY/MM/DD」です。
・いったん閉じます。同時に複数の句を選択できないみたいです。

・リレーションシップを示す棒線をクリックすると窓が開きます。
・「フィールドをさらに追加」をクリックします。

・両方のデータ表から「業態」を選択し閉じます。

 ここまででデータへの接続は完了です。

フォルダーごとにグループ化します

 旧バージョンとの違いはリレーションシップ(データブレンド)にもかかわらず接続データを切り替える必要がなくなったことです。
 鎖マークもない!結合とも違いデータ表ごとにディメンションとメジャーが表示されています。

・検索窓の横の▼(三角)マークをクリックします。
・「フォルダーごとにグループ化」を選択します。

 ひとつのデータ表へ接続しているのと同じようになります。お~・・・(画像の丸数字はもとデータ表の番号です。)

 ダブっているディメンションを非表示にします。
・データ表⑥の「YYYY/MM/DD」と「業態」を非表示にします。

 もはや複数のデータ表へ接続しているような感じがまったくなくなりました。

リレーションしたときのデータソースの状態

・データソースへ戻り、データ表⑤をクリックします。
 下部のデータフィールドを見ると、元のデータ表⑤のままです。「結合」ではないので、もちろん右側へデータ表⑥のフィールドが追加されることはありません。

・データ表⑥をクリックします。
何かの列がありません!非表示にした「YYYY/MM/DD」と「業態」の列がありません。これでリレーションが成立しているのだから不思議です。

操作性 新旧の違い

新旧バージョンの違いをみてゆきます。 
・計算メジャーをつくります。
・計算式は
 [売上高(百万円)]/[店舗数]

・「売上高(百万円)」はデータ表⑥のメジャー
・「店舗数」はデータ表⑤のメジャーです。

 旧バージョンのように計算式内へデータ表を指定する必要がなく計算メジャーを作成できます。

 いい感じです。

旧バージョンではできなかったこと

・「YYYY/MM/DD」を列シェルフへ投入します。
 これはデータ表⑤の「YYYY/MM/DD」です。
・データ表⑥の「売上高(百万円)」を行シェルフへ入れます。
・データ表⑥の「商品」を色へドロップします。
 完成です。

 旧バージョンでやってみます。
・データ表⑥の「商品」を使用して色分類することができません。
 プライマリーの軸に設定しているデータ表⑤の「YYYY/MM/DD」がデータ表⑥の「商品」と紐づかないからリレーションできません。

その他のリレーション

別のデータですが、画像のようなリレーションが可能です。

 こんなこともできます。
リレーションシップのルールは
・プライマリデータ(親)は1データ表
・セカンダリデータ(子)は複数データ表
・関連句(KEY)は1個以上
 ここまでは、旧バージョンのリレーションシップ(データブレンド)と同じ。

・セカンダリ(子)をプライマリ(親)にしてサード(孫)をリレーションすることができる。

 ファイル形式がハイパー(.hyper)のときは、画像のように「Extract」をドロップします。

 名前を変更しておくと後々に便利です。

データ表⑤

コピーしてご利用ください。データ表⑥は下にあります。

YYYY/MM/DD,業態,店舗数
2019/05/01,コンビニエンスストア,56473
2019/06/01,コンビニエンスストア,56485
2019/07/01,コンビニエンスストア,56552
2019/08/01,コンビニエンスストア,56647
2019/09/01,コンビニエンスストア,56575
2019/10/01,コンビニエンスストア,56575
2019/11/01,コンビニエンスストア,56567
2019/12/01,コンビニエンスストア,56502
2020/01/01,コンビニエンスストア,56500
2020/02/01,コンビニエンスストア,56382
2020/03/01,コンビニエンスストア,56334
2020/04/01,コンビニエンスストア,56382
2019/05/01,ドラッグストア,16019
2019/06/01,ドラッグストア,16042
2019/07/01,ドラッグストア,16104
2019/08/01,ドラッグストア,16144
2019/09/01,ドラッグストア,16169
2019/10/01,ドラッグストア,16241
2019/11/01,ドラッグストア,16346
2019/12/01,ドラッグストア,16422
2020/01/01,ドラッグストア,16444
2020/02/01,ドラッグストア,16456
2020/03/01,ドラッグストア,16511
2020/04/01,ドラッグストア,16550
2019/05/01,ホームセンター,4346
2019/06/01,ホームセンター,4352
2019/07/01,ホームセンター,4353
2019/08/01,ホームセンター,4351
2019/09/01,ホームセンター,4353
2019/10/01,ホームセンター,4356
2019/11/01,ホームセンター,4358
2019/12/01,ホームセンター,4357
2020/01/01,ホームセンター,4352
2020/02/01,ホームセンター,4349
2020/03/01,ホームセンター,4355
2020/04/01,ホームセンター,4362
2019/05/01,大型家電専門店,2501
2019/06/01,大型家電専門店,2511
2019/07/01,大型家電専門店,2511
2019/08/01,大型家電専門店,2516
2019/09/01,大型家電専門店,2515
2019/10/01,大型家電専門店,2520
2019/11/01,大型家電専門店,2540
2019/12/01,大型家電専門店,2547
2020/01/01,大型家電専門店,2538
2020/02/01,大型家電専門店,2540
2020/03/01,大型家電専門店,2546
2020/04/01,大型家電専門店,2551