今回は、「運営管理 ~H28-39 POSシステム(3)マーケットバスケット分析~」について説明します。
目次
運営管理 ~平成28年度一次試験問題一覧~
平成28年度の試験問題に関する解説は、以下のページを参照してください。
RFM分析・FSP・マーケットバスケット分析・PI値 -リンク-
本ブログにて「RFM分析」「FSP」「マーケットバスケット分析」「PI値」について説明しているページを以下に示しますのでアクセスしてみてください。
- RFM分析・FSP・マーケットバスケット分析・PI値のまとめ
- R4-39 POSシステム(10)マーケットバスケット分析
- R3-39 POSシステム(9)RFM分析・FSP
- R2-44 POSシステム(8)RFM分析
- R1-39 POSシステム(5)RFM分析・FSP
- R1-40 POSシステム(6)PI値
- H30-39 POSシステム(1)マーケットバスケット分析
- H29-40 POSシステム(2)マーケットバスケット分析
- H27-40 POSシステム(4)RFM分析
- H27-41 その他店舗・販売管理(15)ABC分析
- H26-27 POSシステム(7)PI値
マーケットバスケット分析
「マーケットバスケット分析」は、マーケティングで利用される代表的なデータ分析手法であり、店舗のPOSデータやECサイトの取引データなどの蓄積データ(トランザクション)から、顧客が商品を購入するパターンを分析して、一緒に購入されやすい商品(商品Xと商品Yの関連性)を明らかにしていくことをいいます。
「マーケットバスケット分析」では、大量のデータから有用なパターンやルールを見つけ出すデータマイニングの分析手法である「アソシエーション分析」が用いられます。
なお、「商品Xと商品Yの関連性」とは、「相関関係」ではなく「因果関係」のことを示しています。
相関関係と因果関係の違い
「マーケットバスケット分析」では「相関関係」ではなく「因果関係」を分析していきます。
ここでは、「相関関係」と「因果関係」の違いを以下に説明します。
相関関係
「相関関係」とは、2つのデータが存在する場合において、片方のデータが変動すると、それに応じて他方のデータも変動する関係のことをいい、パターンに応じて「正の相関」「負の相関」と呼ばれます。
- 正の相関
片方のデータが変動すると、他方のデータもそれに応じて同じ方向に変動する。 - 負の相関
片方のデータが変動すると、他方のデータはそれに応じて逆の方向に変動する。
相関係数
2つのデータの「相関関係」は「相関係数」を用いて表されます。
「相関係数」は2つのデータの「相関関係」を表す数値であり「ρ(ロー)」で表されます。
「相関係数」は「-1 ≦ ρ ≦ 1」の範囲で推移し、その数値は以下の意味を示しています。
相関係数 | 説明 |
ρ=1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に同じ方向に変動する。 |
0<ρ<1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて同じ方向に変動する。「1」に近いほど「正」の相関関係が強い。 |
ρ=0 | 2つのデータの変動には、全く関連性がない。 |
-1<ρ<0 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて逆の方向に変動する。「-1」に近いほど「負」の相関関係が強い。 |
ρ=-1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に逆の方向に変動する。 |
マーケティングにおいて「相関係数」は2つの商品の売上金額の共分散と標準偏差から求められ、2つの商品の売上金額の「相関関係」を確認するために用いられます。
ここからは、「2つのデータ」という表記を「2つの商品の売上金額」に置き換えて「相関係数」の「符号」と「絶対値」が示す内容について確認していきます。
相関係数が「プラス」の場合
「相関係数」が「プラス」の場合、2つの商品の売上金額には「正の相関」があるといい、片方の商品の売上金額が変動するともう1つの商品の売上もそれに応じて同じ方向に変動します。
例えば、商品Aの売上金額が増加すれば、商品Bの売上金額も増加します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額も減少します。
相関係数が「マイナス」の場合
「相関係数」が「マイナス」の場合、2つの商品の売上金額には「負の相関」があるといい、片方の商品の売上金額が変動するともう1つの商品の売上金額もそれに応じて逆の方向に変動します。
例えば、商品Aの売上金額が増加すれば、商品Bの売上金額は減少します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額は増加します。
相関係数の絶対値
「相関係数」の「絶対値」は、2つの商品の売上金額に関する「相関関係」の強さを表しています。
2つの商品の売上金額に「相関関係」がない場合は「相関係数」の値は「0」であり、2つの商品の売上金額の増減に関する「相関関係」が強くなるにつれて「相関係数」の「絶対値」は徐々に大きくなっていきます。(最大値は「1」です。)
因果関係
「因果関係」とは「原因」と「結果」であり、片方の事柄が原因となって他方の結果が発生するという関係のことをいいます。
「マーケットバスケット分析」では「商品Xを購入した顧客は商品Yも購入する」という「因果関係」から、2つの商品の売上金額の関連性を分析していきます。
なお、「原因(条件)」と「結果(結論)」は、以下のように表現します。
マーケットバスケット分析の評価指標
「マーケットバスケット分析」では、以下の3つの評価指標を用いて2つの商品の売上金額に関する「因果関係」を分析していきます。
- 信頼度(コンフィデンス/確信度)
- 支持度(サポート)
- リフト値
「信頼度(コンフィデンス/確信度)」「支持度(サポート)」「リフト値」の数値が高い商品の組み合わせが「因果関係」が強く有用な組み合わせであると判断することができます。
アソシエーションルール
「アソシエーションルール」は「条件(原因)」と「結論(結果)」を関連付けることをいいます。今回の説明では、「商品Xを購入した顧客は商品Yも購入する」という「アソシエーションルール」について説明を進めていきます。
信頼度(コンフィデンス/確信度)
「信頼度」は「条件」が発生した場合に「結論」が発生する割合を示しており、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。
支持度(サポート)
「支持度」は、「全ての購買データ」の中で「条件」と「結論」の「因果関係」が成立した割合を示しており、その数値が高いほど全顧客の売上データの中で「因果関係」が成立する確率が高いことを表しています。
「支持度」の数値が低い場合は、店舗やECサイト全体の売上データにおいて、その2つの商品を同時に買う顧客が少ないことを表しています。
つまり、「支持度」が低い商品の組み合わせは、「信頼度」が高い商品の組み合わせであったとしても、店舗やECサイト全体の売上に占める割合が低く、たとえその商品の組み合わせの売上を伸ばせたとしても店舗やECサイト全体の効率的な売上拡大にはつながらないため、有用な組み合わせではないと判断することができます。
リフト値
「リフト値」は「結論」が「条件」と無関係に発生していないかを確認するための指標であり、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。一般的に、リフト値は「1」より大きくなる必要があります。
店舗やECサイト全体で最も売れている商品は、どの商品と組み合わせてもよく売れる組み合わせとなってしまうため、このような商品は一緒に購入されやすい商品を検討する対象から除外する必要があります。
「リフト値」では「結論」が発生する割合を分母に設定するため、店舗やECサイト全体で最も売れている商品を「結論」に設定すると「リフト値」が低くなり、有用な組み合わせではないと判断することができます。(この場合「結論」に設定している商品は、他の商品と関係なく単独で売れていることを示しています。)
試験問題
それでは、実際の試験問題を解いてみます。
【平成28年度 第39問】
ある小売店の一定期間におけるID-POSデータを用いて、100人のある顧客セグメントに対するマーケットバスケット分析を行ったところ、商品aと商品bの購買に関して、下表のような結果が得られたとする。
このとき、以下の設問に答えよ。
購買した商品群 購買した顧客数 商品a 20 商品b 40 商品a かつ 商品b 10
(設問1)
支持度(サポート)に関係する記述として、最も不適切なものはどれか。
ア 商品aのみを購買した顧客数は10人である。
イ 商品bのみを購買した顧客数は30人である。
ウ 商品aと商品bを共に購買した顧客数は10人である。
エ 商品aも商品bも購買していない顧客数は40人である。
オ 商品aも商品bも購買していない顧客数は、商品bのみを購買した顧客数より多い。
(設問2)
リフト値(lift(商品a⇒商品b))の値として、最も適切なものはどれか。
ア 0.25
イ 0.50
ウ 1.00
エ 1.25
オ 2.50
中小企業診断協会Webサイト(https://www.j-smeca.jp/contents/010_c_/shikenmondai.html)
考え方と解答(設問1)
「マーケットバスケット分析」の「支持度(サポート)」に関する知識を問う問題ですが、問題文の条件を正確に読み取って、以下に示すようにそれぞれの商品を購買した人数を算出することができば、確実に正解することができる問題です。
(ア) 適切です。
商品aのみを購買した顧客数は「10人」であるため、選択肢の内容は適切です。
(イ) 適切です。
商品bのみを購買した顧客数は「30人」であるため、選択肢の内容は適切です。
(ウ) 適切です。
商品aと商品bを共に購買した顧客数は「10人」であるため、選択肢の内容は適切です。
(エ) 不適切です。
商品aも商品bも購買していない顧客数は「40人」ではなく「50人」であるため、選択肢の内容は不適切です。
(オ) 適切です。
商品aも商品bも購買していない顧客数「50人」は、商品bのみを購買した顧客数「30人」より多いため、選択肢の内容は適切です。
答えは(エ)です。
考え方と解答(設問2)
「マーケットバスケット分析」の「リフト値」に関する知識を問う問題です。
「リフト値」は「結論」が「条件」と無関係に発生していないかを確認するための指標であり、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。一般的に、リフト値は「1」より大きくなる必要があります。
「リフト値」は、以下の公式により算出することができます。
上記の公式に基づいて「リフト値( 商品a ⇒ 商品b )」を算出すると以下の通りです。
- 信頼度( a → b )= 10人 ÷ 20人 = 0.5
- 支持度( b )= 40人 ÷ 100人 =0.4
- リフト値( a → b )= 0.5 ÷ 0.4 = 1.25
答えは(エ)です。
コメント