リレーションしたテーブルからグラフを作成する方法-タブロー編

リレーションしたテーブルからグラフを作成する方法-タブロー編

データについて

<データ出典>
政府統計の総合窓口「e-Stat」(https://www.e-stat.go.jp/)
商業・サービス業>商業動態統計調査>時系列データ>
コンビニエンスストア商品別販売額等及び前年(度、同期、同月)比
オープンデータですので上のリンクからダウンロードできます。

データ

 今回、利用させていただくデータ表です。

データインタープリター
接続

 エクセルブックへ接続します。
 もとデータのシートの内容をみると「データインタープリター」を使用するのがよいのだろうと思います。
・「データインタープリターの使用」をチェックします。

データ内容を確認します。

 クリーニングされたデータ表のなかから該当する表をみつけます。
・データ表名へマウスオンします。
・データ表名の右側のデータグリッドのようなアイコンが出現します。クリックします
・窓が開きます。

 年月を示すデータフィールドの一番下まで確認すると、2020年の行がありません。

分割されている。

 もう一方のデータ表を見てみます。
 2020年だけになっています。

 2表をユニオンする方法を考えることができますが、一方にはフィールド名(列名)がありません。
 ユニオンしてフィールドをマージする・・・できそうですが、スマートな方法とは言い難い。

データインタープリター結果のレビュー
結果レビュー

 データインタープリターによるクリーニング結果の詳細を確認できる機能があります。
・「結果のレビュー」をクリックします。
・エクセルが開きます。

C006_M287

 データテーブル該当するシートを確認します。2019年12月でデータは切れています。

C288_M297

 こちらは2020年だけです。

あきらめる前に

 では、もともとのシート(データインタープリターでクリーニングする前)は・・・

 ばっちり接続できているではありませんか!
 ちなみに赤い列は、接続したときにフィールド名を自動作成している部分です。

そのまま接続

 該当のシートをそのまま使用します。ここまで少し遠回りをしてしまいました。
 結論は「データインタープリターしない」です。

列の非表示とピボット
データの構造

 もとのデータフィールドには、画像のように小計・合計が含まれています。これらは不要なので接続しません。

フィールドの非表示

 先ず、「年」~「商品販売額」までの列を選択します。
・列を右クリック
・「非表示」を選択します。

売上の値をとりだします。

 もとデータ表は売上高を示す4列、店舗数を示す1列が合体しています。

店舗数の列を非表示

 店舗数を示すフィールドと不要なフィールドを非表示にします。

フィールド名変更

 フィールド名を整えます。
 現在の接続状態は
・ディメンション=年月
・メジャー=カテゴリごとの売上高(4フィールド)

ピボット

 カテゴリごとの売上高を示す4フィールドを選択します。
・右クリック
・「ピボット」を選択します。

フィールド名変更

 フィールド名を整えます。

データ表のリレーションシップ
リレーションシップ

 同一のデータ表をリレーションシップします。
 リレーションするフィールドは
・YYYY/MM
・Year And Month

フィールド削除

・リレーションした方のデータをクリック
・店舗数を示すフィールドと年月を示すフィールドだけを残して、その他のフィールドを非表示にします。

フィールド名変更

 フィールド名を整えます。
 他のデータ表の名称や他のデータ表をふくめてすべてのフィールド名で同一の名称は設定できません。
 YYYY/MMはもう一方のデータ表のフィールド名で使用しているため、YYYY/MM(E)としました。

データ表名を変更

・データ表を右クリック
・「名前の変更」を選択

同一名は使用できない

 フィールド名と同一の名称を使用できないため(Data)を語尾へくっつけました。

ディメンションとメジャー
「表」のデータペイン

 データ表をリレーションシップした状態です。
 デフォルトでは、画像のようにデータ表ごとにディメンションとメジャーが表示されます。

フィールドでグループ化

・▼をクリック
・「フィールドでグループ化」を選択します。

「フォルダー」のデータペイン

 データ表ごとの別はなくなり、ディメンションとメジャーだけの区別になります。

 チャート作成などの操作方法はどちらでも同じです。見え方が違うと考えてもよさそです。

 多数のデータ表をリレーションしているときはフォルダーの方が扱いやすいと思います。

チャート作成
色塗り棒グラフ

・「YYYY/MM」(データ表のどちらでも構いません)を列シェルフ
・「Value」(売上高)を行シェルフ
・形状は「棒」
・「category」を色

二重軸グラフへ

・「Establishment」(店舗数)を行シェルフ
・▼三角をクリック
・「二重軸」を選択します。

カードを選択

・「Establishment」のカードをクリック
・色へドロップしてある「category」を外します。

形状変更

「Establishment」のカードの
・形状を「線」へ変更します。

色を編集

「Establishment」のカードの
・「色」をクリック
・「色の編集」をクリック
・開いた窓の「Establishments」をクリック
・パレットの中から色を選択します。

軸の書式設定

・軸を右クリック
・「書式設定」を選択します。

標準へ変更

・「数値」のドロップダウン
・「標準」を選択します。

「書式設定」を開いたまま

・もう一方の軸を左クリック(右クリックしなくてもよし)
・「数値」のドロップダウンから「標準」を選択
・「×」をクリックして「書式設定ペイン」を閉じます。

「年月」をフィルター

・軸に設定している方の「YYYY/MM」を右クリック
・「フィルターの表示」を選択します。

フィルターを適用

 12か月分のデータがない1997年と2020年のチェックを外します。

集計方法を変更
デフォルトの集計方法は「合計」

 右側のスケールは「Establishments」(店舗数)です。70万店に迫る勢いになっているところが妙です。

店舗数のデータ

 2019年の店舗数は5万6千店のあたりで推移しています。ところが、チャートの数値は70万近くの値になっています。

 チャートの軸(集計単位)は「年」です。ここがポイントです。
 グラフの横軸が「年」ということは、グラフの値は「年」の合計値を示すことになります。つまり、横軸に従い表計算をした合計値がグラフへプロットされるしくみになっています。
 タブローは常に表計算します。計算方法は「合計」です。従って店舗数の合計は「679,003」になります。

 もちろん、横軸を「年月」に設定すればデータ表通りの値になります。

集計方法を変更

・集計方法を変更するメジャーの▼三角をクリック
・「メジャー(合計)」へポインタを合わせます。
・「平均」を選択します。

リレーションしたデータ表から計算フィールド(メジャー)をつくる
計算フィールド作成

 新規作成するのは、
1店舗あたりの売上高=Value÷Establishments

・▼三角をクリック
・「計算フィールドの作成」を選択します。

計算式

・フィールド名をタイピング
・計算式を作成します。

計算式
SUM([Value])/AVG([Establishments])

 以前のようなデータ表名は必要ありません。通常の計算式です。

メジャー入れ替え

 メジャーを入れ替えて「二重軸」にします。

形状を変更

・形状を「線」
・色もメンテナンスしてください。

スケールを変更
折線のダイナミズムがない

 折線と棒との隙間が気になります。折線の動きがゆるやかでダイナミズムに欠けているようです。

軸の編集

・折線の軸(右側)を右クリック
・「軸の編集」を選択します。

固定値に設定

・「固定」のラジオボタンをクリック
・開始値(スケールの最小値)、終了値(スケールの最大値)を入力します。

傾向線を追加
傾向線

・折線のどこかへポインタを合わせて右クリック
・「傾向線」
・「傾向線の表示」を選択します。

出来上がり

 完成です。