回帰分析(第4回) 回帰直線の動き
回帰直線の動き
スモールデータで確認してみる
大量データの回帰分析では、一つや二つのデータをを削除したり入れ替えたりしたところで、回帰分析結果は微動だにしません。
そこで、スモールデータサンプルを使い、回帰分析結果をダイナミックに変化させてみます。1つのデータをを変化させるだけで回帰直線の様相がガラリと変わるレベルまでデータ数を減らします。
「変化が事象的にいくつかの状態から合成されている」(ベルクソン・思想と動くもの)
合成された結果がみえてくると思います。
サンプルデータ
顧客コード | 来店回数 | 月間購入金額 |
A | 10 | 20,000 |
B | 20 | 40,000 |
C | 30 | 60,000 |
D | 5 | 150,000 |
E | 25 | 200,000 |
F | 30 | 20,000 |
小売店舗の顧客6名、来店回数(1か月)、月間購入額データです。
このうちA、B、C、この3名の顧客を基本にします。基本顧客3名に加える1名のデータ次第で回帰直線が大きく変化するように各顧客の数値を設定しています。
回帰直線の動き
完全「正」の関係

顧客がA、B、C、3名のとき、来店回数と月間購入額は完全な「正」の関係になります。
回帰方程式:売上売価 = 2000*来店回数 + 0
R-2 乗:1
「R-2 乗」が1になることに注目です。「R-2 乗」=1というのは回帰方程式が全てのデータを完全に説明しているということです。外れ値はありません。全データ点が回帰直線上に乗っかています。
顧客1回来店ごとに2,000円購入します。仮に、データにない15回の来店回数であれば購入額は30,000円で間違いありません。全てのデータといってもデータ数は3ですから・・・
負の関係

顧客をA、B、CにDを加えた4名にします。
回帰方程式:売上売価 = -2271.19*来店回数 + 104407
R-2 乗:0.19262
右肩下がりの直線になりました。つまり、来店回数が多いほど購入額が減少するという意味になります。ゼロからABCを結んでいた直線の左側をデータDがリフトアップしたのでこのような結果になりました。
来店回数が少なく月間購入額が高い顧客がが出現すると回帰直線の左側を持ち上げる効果があるということがわかります。
「R-2 乗」=0.19ですからこの回帰直線の精度は低いものです。回帰直線上に乗っかているデータ点がありません。「R-2 乗」値が低いということは各データ点と回帰直線との距離が離れているということです。
来店回数が少なくても売上高を獲得する方法がある!かも?
来店回数アップ→売上高アップという方程式とは別の戦略を考えるヒントになります。
分析過程では「R-2 乗」値を下げる悪いヤツです。データのなかで月間購入金額が2番目に高いからすぐに最上位ランク顧客だということがわかりますが、前回のデータが示すとおり、顧客売上高順にならべると中位ランク顧客のなかに隠れていることが多いです。
正の関係1

顧客をA、B、C、Eにします。
回帰方程式:月間購入金額 = 4571.43*来店回数 + -17142.9
R-2 乗:0.228571
右肩が大きく上がります。データEが直線の右側をリフトアップしました。
方程式へ来店回数30を代入すると、月間購入額が120,000円になります。お~売上高が倍増!
しかし、顧客Cの売上高は60,000円です。
顧客Eの購入額を肯定的にとらえて、「毎日のように来店している顧客の購入額をさらにアップさせる方法はないか?」と考えることができます。これは正解です。
ただし、このような戦略を実施する場合、問題になるのが費用です。30回来店=120,000円なら、これまでの費用の2倍を投下しても元はとれる計算になります。もちろん実際は?ですね。
何とかしてプロジェクトの決算書へサインがほしい!
このようなときに使われることがありますから、要注意です。
正の関係2

顧客をA、B、C、Fにします。
回帰方程式:月間購入金額 = 909.091*来店回数 + 14545.5
R-2 乗:0.206612
右肩が下がります。直線が全体的に下へシフトします。高齢化の現状をふまえると、来るべき将来といった感がします。
店舗売上高=客数×客単価
客数=顧客数×来店回数
客単価=一品単価×販売点数
多くの小売店舗では、客単価が横ばい、客数が苦戦といった状況が多く見受けられます。
たちまち人口が減少している地域があります。もちろんこれからは全体的に人口が減少するわけですから「1顧客あたりの来店回数」がこれからのネットを含めて小売業態の生命線だろうと思います。