リレーションシップ (タブロー2020.2.1)
商業動態統計調査(オープンデータ)を利用して、タブロー2020.2.1の新機能、データの「リレーションシップ」について解説しています。
データ表を分割します
データ表
<データ出典>
政府統計の総合窓口「e-Stat」(https://www.e-stat.go.jp/)
商業・サービス業>商業動態統計調査>時系列データ>
コンビニエンスストア商品別販売額等及び前年(度、同期、同月)比
家電大型専門店商品別販売額等及び前年(度、同期、同月)比
ドラッグストア商品別販売額等及び前年(度、同期、同月)比
ホームセンター商品別販売額等及び前年(度、同期、同月)比を加工して作成
データ表は画像のように行が日付です。
・B、C、D、E列がそれぞれ列名に記載されている商品(カテゴリ)ごとの売上高(単位百万円)
・F列がコンビニエンスストアの店舗数になっています。
このデータ表は、
① 月別・商品別売上高のデータ表
② 月別店舗数のデータ表
①と②が合体したクロス集計形式のデータ表です。
このデータ表を分割します。
<現在のデータ表>
・ディメンション:YYYY/MM/DD
・メジャー:B列からF列までの5種類
分割してデータ形式を変更する
①(月別・商品別売上高のデータ表)の商品(カテゴリ)列をピボットして列指向形式へ変換します。
「業種」の列を追加します。内容はすべて「コンビニエンスストア」です。
エクセルPower Query エディターを使用したピボットはこちらをご参照ください
これでデータ表①が完成です。
・ディメンション:
A列=YYYY/MM/DD
B列=属性(商品)
D列=業種
・メジャー:
C列=値(売上高)
列指向形式へ変換されました。
②(月別店舗数のデータ表)は、BからEの列を削除すれば完成です。
A列=YYYY/MM/DD
B列=店舗数
<ポイント>
データ表①とデータ表②は「YYYY/MM/DD」をKEYにしてリレーションすることができるようになっています。
データ表をリレーションするためには、KEYになるフィールド(列)が必要です。
別ブックのデータも同様に編集する
業種が「ドラッグストア」というデータ表が別ブックであります。さらに、「大型家電専門店」と「ホームセンター」の別ブックもあります。
全部で
・業態=4
・それぞれの業態のメジャー数=2(売上高と店舗数)
4×2=8データ表になるところを、最終的に2データ表へまとめます。
ドラッグストアもコンビニエンスストアと同様に③(月別・商品別売上高のデータ表)を列指向形式へ、③(月別店舗数のデータ表)は店舗数だけをとり出します。
現在のデータ表数は、
・業態数2×メジャー数2=4表
①~④の4表になっています。
最終的には
・業態数4×メジャー数2=8表になりますね。
くっつける
・店舗数データの②(コンビニの店舗数)と④(ドラッグストアの店舗数)を結合します。
・ピボットして列指向形式へ変換します。
A列=YYYY/MM/DD
B列=業態
C列=店舗数
・①(コンビニの売上高)と③(ドラッグストアの売上高)をユニオン(縦結合)します。
これで4表に分かれていたデータが⑤と⑥の2表になりました。
「大型家電専門店」と「ホームセンター」のデータ表も同様に分解・ピボット・結合します。
これで、「業態」(ブック・シート)や「商品」(列)はもちろん「YYYY/MM/DD」(行)がどんどん増えたとしてもデータ表の数は常に2表におさまります。。
リレーションシップ(タブロー)
2020.2.1新機能
データ表は画像のとおりです。(ちょっと整えています)
データはこの記事の下の方からダウンロードまたはコピーできます。
まず、タブローから
・データ表⑤(各業態の店舗数)へ接続します。
・データ表⑥(各業態の売上高)をドロップします。
旧バージョン(2020.1以前)ではデータが「結合」されます。新バージョン(2020.2)では「リレーションシップ」になります。
・関係句?(結合ではないので結合句ではないのだろうと思います)を左右のデータ表から選択します。
・サンプルデータでは「YYYY/MM/DD」です。
・いったん閉じます。同時に複数の句を選択できないみたいです。
・リレーションシップを示す棒線をクリックすると窓が開きます。
・「フィールドをさらに追加」をクリックします。
・両方のデータ表から「業態」を選択し閉じます。
ここまででデータへの接続は完了です。
フォルダーごとにグループ化します
旧バージョンとの違いはリレーションシップ(データブレンド)にもかかわらず接続データを切り替える必要がなくなったことです。
鎖マークもない!結合とも違いデータ表ごとにディメンションとメジャーが表示されています。
・検索窓の横の▼(三角)マークをクリックします。
・「フォルダーごとにグループ化」を選択します。
ひとつのデータ表へ接続しているのと同じようになります。お~・・・(画像の丸数字はもとデータ表の番号です。)
ダブっているディメンションを非表示にします。
・データ表⑥の「YYYY/MM/DD」と「業態」を非表示にします。
もはや複数のデータ表へ接続しているような感じがまったくなくなりました。
リレーションしたときのデータソースの状態
・データソースへ戻り、データ表⑤をクリックします。
下部のデータフィールドを見ると、元のデータ表⑤のままです。「結合」ではないので、もちろん右側へデータ表⑥のフィールドが追加されることはありません。
・データ表⑥をクリックします。
何かの列がありません!非表示にした「YYYY/MM/DD」と「業態」の列がありません。これでリレーションが成立しているのだから不思議です。
操作性 新旧の違い
新旧バージョンの違いをみてゆきます。
・計算メジャーをつくります。
・計算式は
[売上高(百万円)]/[店舗数]
・「売上高(百万円)」はデータ表⑥のメジャー
・「店舗数」はデータ表⑤のメジャーです。
旧バージョンのように計算式内へデータ表を指定する必要がなく計算メジャーを作成できます。
いい感じです。
旧バージョンではできなかったこと
・「YYYY/MM/DD」を列シェルフへ投入します。
これはデータ表⑤の「YYYY/MM/DD」です。
・データ表⑥の「売上高(百万円)」を行シェルフへ入れます。
・データ表⑥の「商品」を色へドロップします。
完成です。
旧バージョンでやってみます。
・データ表⑥の「商品」を使用して色分類することができません。
プライマリーの軸に設定しているデータ表⑤の「YYYY/MM/DD」がデータ表⑥の「商品」と紐づかないからリレーションできません。
その他のリレーション
別のデータですが、画像のようなリレーションが可能です。
こんなこともできます。
リレーションシップのルールは
・プライマリデータ(親)は1データ表
・セカンダリデータ(子)は複数データ表
・関連句(KEY)は1個以上
ここまでは、旧バージョンのリレーションシップ(データブレンド)と同じ。
・セカンダリ(子)をプライマリ(親)にしてサード(孫)をリレーションすることができる。
ファイル形式がハイパー(.hyper)のときは、画像のように「Extract」をドロップします。
名前を変更しておくと後々に便利です。
データ表⑤
コピーしてご利用ください。データ表⑥は下にあります。
YYYY/MM/DD,業態,店舗数 2019/05/01,コンビニエンスストア,56473 2019/06/01,コンビニエンスストア,56485 2019/07/01,コンビニエンスストア,56552 2019/08/01,コンビニエンスストア,56647 2019/09/01,コンビニエンスストア,56575 2019/10/01,コンビニエンスストア,56575 2019/11/01,コンビニエンスストア,56567 2019/12/01,コンビニエンスストア,56502 2020/01/01,コンビニエンスストア,56500 2020/02/01,コンビニエンスストア,56382 2020/03/01,コンビニエンスストア,56334 2020/04/01,コンビニエンスストア,56382 2019/05/01,ドラッグストア,16019 2019/06/01,ドラッグストア,16042 2019/07/01,ドラッグストア,16104 2019/08/01,ドラッグストア,16144 2019/09/01,ドラッグストア,16169 2019/10/01,ドラッグストア,16241 2019/11/01,ドラッグストア,16346 2019/12/01,ドラッグストア,16422 2020/01/01,ドラッグストア,16444 2020/02/01,ドラッグストア,16456 2020/03/01,ドラッグストア,16511 2020/04/01,ドラッグストア,16550 2019/05/01,ホームセンター,4346 2019/06/01,ホームセンター,4352 2019/07/01,ホームセンター,4353 2019/08/01,ホームセンター,4351 2019/09/01,ホームセンター,4353 2019/10/01,ホームセンター,4356 2019/11/01,ホームセンター,4358 2019/12/01,ホームセンター,4357 2020/01/01,ホームセンター,4352 2020/02/01,ホームセンター,4349 2020/03/01,ホームセンター,4355 2020/04/01,ホームセンター,4362 2019/05/01,大型家電専門店,2501 2019/06/01,大型家電専門店,2511 2019/07/01,大型家電専門店,2511 2019/08/01,大型家電専門店,2516 2019/09/01,大型家電専門店,2515 2019/10/01,大型家電専門店,2520 2019/11/01,大型家電専門店,2540 2019/12/01,大型家電専門店,2547 2020/01/01,大型家電専門店,2538 2020/02/01,大型家電専門店,2540 2020/03/01,大型家電専門店,2546 2020/04/01,大型家電専門店,2551