リレーションシップ (タブロー2020.2.1)
商業動態統計調査(オープンデータ)を利用して、タブロー2020.2.1の新機能、データの「リレーションシップ」について解説しています。
データ表を分割します
データ表
![](https://data-analyzer.net/wp-content/uploads/2020/10/relationship_1-1-e1601535682876.png)
<データ出典>
政府統計の総合窓口「e-Stat」(https://www.e-stat.go.jp/)
商業・サービス業>商業動態統計調査>時系列データ>
コンビニエンスストア商品別販売額等及び前年(度、同期、同月)比
家電大型専門店商品別販売額等及び前年(度、同期、同月)比
ドラッグストア商品別販売額等及び前年(度、同期、同月)比
ホームセンター商品別販売額等及び前年(度、同期、同月)比を加工して作成
データ表は画像のように行が日付です。
・B、C、D、E列がそれぞれ列名に記載されている商品(カテゴリ)ごとの売上高(単位百万円)
・F列がコンビニエンスストアの店舗数になっています。
このデータ表は、
① 月別・商品別売上高のデータ表
② 月別店舗数のデータ表
①と②が合体したクロス集計形式のデータ表です。
このデータ表を分割します。
<現在のデータ表>
・ディメンション:YYYY/MM/DD
・メジャー:B列からF列までの5種類
分割してデータ形式を変更する
![](https://data-analyzer.net/wp-content/uploads/2020/10/relationship_2-1.png)
①(月別・商品別売上高のデータ表)の商品(カテゴリ)列をピボットして列指向形式へ変換します。
「業種」の列を追加します。内容はすべて「コンビニエンスストア」です。
エクセルPower Query エディターを使用したピボットはこちらをご参照ください
これでデータ表①が完成です。
・ディメンション:
A列=YYYY/MM/DD
B列=属性(商品)
D列=業種
・メジャー:
C列=値(売上高)
列指向形式へ変換されました。
②(月別店舗数のデータ表)は、BからEの列を削除すれば完成です。
A列=YYYY/MM/DD
B列=店舗数
<ポイント>
データ表①とデータ表②は「YYYY/MM/DD」をKEYにしてリレーションすることができるようになっています。
データ表をリレーションするためには、KEYになるフィールド(列)が必要です。
別ブックのデータも同様に編集する
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_27-1.png)
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_3-1024x482.png)
業種が「ドラッグストア」というデータ表が別ブックであります。さらに、「大型家電専門店」と「ホームセンター」の別ブックもあります。
全部で
・業態=4
・それぞれの業態のメジャー数=2(売上高と店舗数)
4×2=8データ表になるところを、最終的に2データ表へまとめます。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_4-1024x647.png)
ドラッグストアもコンビニエンスストアと同様に③(月別・商品別売上高のデータ表)を列指向形式へ、③(月別店舗数のデータ表)は店舗数だけをとり出します。
現在のデータ表数は、
・業態数2×メジャー数2=4表
①~④の4表になっています。
最終的には
・業態数4×メジャー数2=8表になりますね。
くっつける
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_6-1024x630.png)
・店舗数データの②(コンビニの店舗数)と④(ドラッグストアの店舗数)を結合します。
・ピボットして列指向形式へ変換します。
A列=YYYY/MM/DD
B列=業態
C列=店舗数
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_7-1024x616.png)
・①(コンビニの売上高)と③(ドラッグストアの売上高)をユニオン(縦結合)します。
これで4表に分かれていたデータが⑤と⑥の2表になりました。
「大型家電専門店」と「ホームセンター」のデータ表も同様に分解・ピボット・結合します。
これで、「業態」(ブック・シート)や「商品」(列)はもちろん「YYYY/MM/DD」(行)がどんどん増えたとしてもデータ表の数は常に2表におさまります。。
リレーションシップ(タブロー)
2020.2.1新機能
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_8-1024x564.png)
データ表は画像のとおりです。(ちょっと整えています)
データはこの記事の下の方からダウンロードまたはコピーできます。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_9-1024x489.png)
まず、タブローから
・データ表⑤(各業態の店舗数)へ接続します。
・データ表⑥(各業態の売上高)をドロップします。
旧バージョン(2020.1以前)ではデータが「結合」されます。新バージョン(2020.2)では「リレーションシップ」になります。
・関係句?(結合ではないので結合句ではないのだろうと思います)を左右のデータ表から選択します。
・サンプルデータでは「YYYY/MM/DD」です。
・いったん閉じます。同時に複数の句を選択できないみたいです。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_10-1024x489.png)
・リレーションシップを示す棒線をクリックすると窓が開きます。
・「フィールドをさらに追加」をクリックします。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_11-1024x490.png)
・両方のデータ表から「業態」を選択し閉じます。
ここまででデータへの接続は完了です。
フォルダーごとにグループ化します
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_12-1024x620.png)
旧バージョンとの違いはリレーションシップ(データブレンド)にもかかわらず接続データを切り替える必要がなくなったことです。
鎖マークもない!結合とも違いデータ表ごとにディメンションとメジャーが表示されています。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_13-1024x487.png)
・検索窓の横の▼(三角)マークをクリックします。
・「フォルダーごとにグループ化」を選択します。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_14-1024x706.png)
ひとつのデータ表へ接続しているのと同じようになります。お~・・・(画像の丸数字はもとデータ表の番号です。)
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_15-1024x487.png)
ダブっているディメンションを非表示にします。
・データ表⑥の「YYYY/MM/DD」と「業態」を非表示にします。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_16-1024x492.png)
もはや複数のデータ表へ接続しているような感じがまったくなくなりました。
リレーションしたときのデータソースの状態
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_17-1024x486.png)
・データソースへ戻り、データ表⑤をクリックします。
下部のデータフィールドを見ると、元のデータ表⑤のままです。「結合」ではないので、もちろん右側へデータ表⑥のフィールドが追加されることはありません。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_18-1024x492.png)
・データ表⑥をクリックします。
何かの列がありません!非表示にした「YYYY/MM/DD」と「業態」の列がありません。これでリレーションが成立しているのだから不思議です。
操作性 新旧の違い
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_19-1024x490.png)
新旧バージョンの違いをみてゆきます。
・計算メジャーをつくります。
・計算式は
[売上高(百万円)]/[店舗数]
・「売上高(百万円)」はデータ表⑥のメジャー
・「店舗数」はデータ表⑤のメジャーです。
旧バージョンのように計算式内へデータ表を指定する必要がなく計算メジャーを作成できます。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_20-1024x486.png)
いい感じです。
旧バージョンではできなかったこと
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_21-1024x488.png)
・「YYYY/MM/DD」を列シェルフへ投入します。
これはデータ表⑤の「YYYY/MM/DD」です。
・データ表⑥の「売上高(百万円)」を行シェルフへ入れます。
・データ表⑥の「商品」を色へドロップします。
完成です。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_22-1024x487.png)
旧バージョンでやってみます。
・データ表⑥の「商品」を使用して色分類することができません。
プライマリーの軸に設定しているデータ表⑤の「YYYY/MM/DD」がデータ表⑥の「商品」と紐づかないからリレーションできません。
その他のリレーション
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_23-1024x489.png)
別のデータですが、画像のようなリレーションが可能です。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_28-1024x492.png)
こんなこともできます。
リレーションシップのルールは
・プライマリデータ(親)は1データ表
・セカンダリデータ(子)は複数データ表
・関連句(KEY)は1個以上
ここまでは、旧バージョンのリレーションシップ(データブレンド)と同じ。
・セカンダリ(子)をプライマリ(親)にしてサード(孫)をリレーションすることができる。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_24-1024x484.png)
ファイル形式がハイパー(.hyper)のときは、画像のように「Extract」をドロップします。
![](https://data-analyzer.net/wp-content/uploads/2020/06/relationship_25-1024x490.png)
名前を変更しておくと後々に便利です。
データ表⑤
コピーしてご利用ください。データ表⑥は下にあります。
YYYY/MM/DD,業態,店舗数 2019/05/01,コンビニエンスストア,56473 2019/06/01,コンビニエンスストア,56485 2019/07/01,コンビニエンスストア,56552 2019/08/01,コンビニエンスストア,56647 2019/09/01,コンビニエンスストア,56575 2019/10/01,コンビニエンスストア,56575 2019/11/01,コンビニエンスストア,56567 2019/12/01,コンビニエンスストア,56502 2020/01/01,コンビニエンスストア,56500 2020/02/01,コンビニエンスストア,56382 2020/03/01,コンビニエンスストア,56334 2020/04/01,コンビニエンスストア,56382 2019/05/01,ドラッグストア,16019 2019/06/01,ドラッグストア,16042 2019/07/01,ドラッグストア,16104 2019/08/01,ドラッグストア,16144 2019/09/01,ドラッグストア,16169 2019/10/01,ドラッグストア,16241 2019/11/01,ドラッグストア,16346 2019/12/01,ドラッグストア,16422 2020/01/01,ドラッグストア,16444 2020/02/01,ドラッグストア,16456 2020/03/01,ドラッグストア,16511 2020/04/01,ドラッグストア,16550 2019/05/01,ホームセンター,4346 2019/06/01,ホームセンター,4352 2019/07/01,ホームセンター,4353 2019/08/01,ホームセンター,4351 2019/09/01,ホームセンター,4353 2019/10/01,ホームセンター,4356 2019/11/01,ホームセンター,4358 2019/12/01,ホームセンター,4357 2020/01/01,ホームセンター,4352 2020/02/01,ホームセンター,4349 2020/03/01,ホームセンター,4355 2020/04/01,ホームセンター,4362 2019/05/01,大型家電専門店,2501 2019/06/01,大型家電専門店,2511 2019/07/01,大型家電専門店,2511 2019/08/01,大型家電専門店,2516 2019/09/01,大型家電専門店,2515 2019/10/01,大型家電専門店,2520 2019/11/01,大型家電専門店,2540 2019/12/01,大型家電専門店,2547 2020/01/01,大型家電専門店,2538 2020/02/01,大型家電専門店,2540 2020/03/01,大型家電専門店,2546 2020/04/01,大型家電専門店,2551