リレーションしたテーブルからグラフを作成する方法-タブロー編
データについて
<データ出典>
政府統計の総合窓口「e-Stat」(https://www.e-stat.go.jp/)
商業・サービス業>商業動態統計調査>時系列データ>
コンビニエンスストア商品別販売額等及び前年(度、同期、同月)比
オープンデータですので上のリンクからダウンロードできます。
今回、利用させていただくデータ表です。
データインタープリター
エクセルブックへ接続します。
もとデータのシートの内容をみると「データインタープリター」を使用するのがよいのだろうと思います。
・「データインタープリターの使用」をチェックします。
クリーニングされたデータ表のなかから該当する表をみつけます。
・データ表名へマウスオンします。
・データ表名の右側のデータグリッドのようなアイコンが出現します。クリックします
・窓が開きます。
年月を示すデータフィールドの一番下まで確認すると、2020年の行がありません。
もう一方のデータ表を見てみます。
2020年だけになっています。
2表をユニオンする方法を考えることができますが、一方にはフィールド名(列名)がありません。
ユニオンしてフィールドをマージする・・・できそうですが、スマートな方法とは言い難い。
データインタープリター結果のレビュー
データインタープリターによるクリーニング結果の詳細を確認できる機能があります。
・「結果のレビュー」をクリックします。
・エクセルが開きます。
データテーブル該当するシートを確認します。2019年12月でデータは切れています。
こちらは2020年だけです。
では、もともとのシート(データインタープリターでクリーニングする前)は・・・
ばっちり接続できているではありませんか!
ちなみに赤い列は、接続したときにフィールド名を自動作成している部分です。
該当のシートをそのまま使用します。ここまで少し遠回りをしてしまいました。
結論は「データインタープリターしない」です。
列の非表示とピボット
もとのデータフィールドには、画像のように小計・合計が含まれています。これらは不要なので接続しません。
先ず、「年」~「商品販売額」までの列を選択します。
・列を右クリック
・「非表示」を選択します。
もとデータ表は売上高を示す4列、店舗数を示す1列が合体しています。
店舗数を示すフィールドと不要なフィールドを非表示にします。
フィールド名を整えます。
現在の接続状態は
・ディメンション=年月
・メジャー=カテゴリごとの売上高(4フィールド)
カテゴリごとの売上高を示す4フィールドを選択します。
・右クリック
・「ピボット」を選択します。
フィールド名を整えます。
データ表のリレーションシップ
同一のデータ表をリレーションシップします。
リレーションするフィールドは
・YYYY/MM
・Year And Month
・リレーションした方のデータをクリック
・店舗数を示すフィールドと年月を示すフィールドだけを残して、その他のフィールドを非表示にします。
フィールド名を整えます。
他のデータ表の名称や他のデータ表をふくめてすべてのフィールド名で同一の名称は設定できません。
YYYY/MMはもう一方のデータ表のフィールド名で使用しているため、YYYY/MM(E)としました。
・データ表を右クリック
・「名前の変更」を選択
フィールド名と同一の名称を使用できないため(Data)を語尾へくっつけました。
ディメンションとメジャー
データ表をリレーションシップした状態です。
デフォルトでは、画像のようにデータ表ごとにディメンションとメジャーが表示されます。
・▼をクリック
・「フィールドでグループ化」を選択します。
データ表ごとの別はなくなり、ディメンションとメジャーだけの区別になります。
チャート作成などの操作方法はどちらでも同じです。見え方が違うと考えてもよさそです。
多数のデータ表をリレーションしているときはフォルダーの方が扱いやすいと思います。
チャート作成
・「YYYY/MM」(データ表のどちらでも構いません)を列シェルフ
・「Value」(売上高)を行シェルフ
・形状は「棒」
・「category」を色
・「Establishment」(店舗数)を行シェルフ
・▼三角をクリック
・「二重軸」を選択します。
・「Establishment」のカードをクリック
・色へドロップしてある「category」を外します。
「Establishment」のカードの
・形状を「線」へ変更します。
「Establishment」のカードの
・「色」をクリック
・「色の編集」をクリック
・開いた窓の「Establishments」をクリック
・パレットの中から色を選択します。
・軸を右クリック
・「書式設定」を選択します。
・「数値」のドロップダウン
・「標準」を選択します。
・もう一方の軸を左クリック(右クリックしなくてもよし)
・「数値」のドロップダウンから「標準」を選択
・「×」をクリックして「書式設定ペイン」を閉じます。
・軸に設定している方の「YYYY/MM」を右クリック
・「フィルターの表示」を選択します。
12か月分のデータがない1997年と2020年のチェックを外します。
集計方法を変更
右側のスケールは「Establishments」(店舗数)です。70万店に迫る勢いになっているところが妙です。
2019年の店舗数は5万6千店のあたりで推移しています。ところが、チャートの数値は70万近くの値になっています。
チャートの軸(集計単位)は「年」です。ここがポイントです。
グラフの横軸が「年」ということは、グラフの値は「年」の合計値を示すことになります。つまり、横軸に従い表計算をした合計値がグラフへプロットされるしくみになっています。
タブローは常に表計算します。計算方法は「合計」です。従って店舗数の合計は「679,003」になります。
もちろん、横軸を「年月」に設定すればデータ表通りの値になります。
・集計方法を変更するメジャーの▼三角をクリック
・「メジャー(合計)」へポインタを合わせます。
・「平均」を選択します。
リレーションしたデータ表から計算フィールド(メジャー)をつくる
新規作成するのは、
1店舗あたりの売上高=Value÷Establishments
・▼三角をクリック
・「計算フィールドの作成」を選択します。
・フィールド名をタイピング
・計算式を作成します。
計算式 SUM([Value])/AVG([Establishments])
以前のようなデータ表名は必要ありません。通常の計算式です。
メジャーを入れ替えて「二重軸」にします。
・形状を「線」
・色もメンテナンスしてください。
スケールを変更
折線と棒との隙間が気になります。折線の動きがゆるやかでダイナミズムに欠けているようです。
・折線の軸(右側)を右クリック
・「軸の編集」を選択します。
・「固定」のラジオボタンをクリック
・開始値(スケールの最小値)、終了値(スケールの最大値)を入力します。
傾向線を追加
・折線のどこかへポインタを合わせて右クリック
・「傾向線」
・「傾向線の表示」を選択します。
完成です。