今回は、「運営管理 ~H29-40 POSシステム(2)マーケットバスケット分析~」について説明します。
目次
運営管理 ~平成29年度一次試験問題一覧~
平成29年度の試験問題に関する解説は、以下のページを参照してください。
RFM分析・FSP・マーケットバスケット分析・PI値 -リンク-
本ブログにて「RFM分析」「FSP」「マーケットバスケット分析」「PI値」について説明しているページを以下に示しますのでアクセスしてみてください。
- RFM分析・FSP・マーケットバスケット分析・PI値のまとめ
- R4-39 POSシステム(10)マーケットバスケット分析
- R3-39 POSシステム(9)RFM分析・FSP
- R2-44 POSシステム(8)RFM分析
- R1-39 POSシステム(5)RFM分析・FSP
- R1-40 POSシステム(6)PI値
- H30-39 POSシステム(1)マーケットバスケット分析
- H28-39 POSシステム(3)マーケットバスケット分析
- H27-40 POSシステム(4)RFM分析
- H27-41 その他店舗・販売管理(15)ABC分析
- H26-27 POSシステム(7)PI値
マーケットバスケット分析
「マーケットバスケット分析」は、マーケティングで利用される代表的なデータ分析手法であり、店舗のPOSデータやECサイトの取引データなどの蓄積データ(トランザクション)から、顧客が商品を購入するパターンを分析して、一緒に購入されやすい商品(商品Xと商品Yの関連性)を明らかにしていくことをいいます。
「マーケットバスケット分析」では、大量のデータから有用なパターンやルールを見つけ出すデータマイニングの分析手法である「アソシエーション分析」が用いられます。
なお、「商品Xと商品Yの関連性」とは、「相関関係」ではなく「因果関係」のことを示しています。
相関関係と因果関係の違い
「マーケットバスケット分析」では「相関関係」ではなく「因果関係」を分析していきます。
ここでは、「相関関係」と「因果関係」の違いを以下に説明します。
相関関係
「相関関係」とは、2つのデータが存在する場合において、片方のデータが変動すると、それに応じて他方のデータも変動する関係のことをいい、パターンに応じて「正の相関」「負の相関」と呼ばれます。
- 正の相関
片方のデータが変動すると、他方のデータもそれに応じて同じ方向に変動する。 - 負の相関
片方のデータが変動すると、他方のデータはそれに応じて逆の方向に変動する。
相関係数
2つのデータの「相関関係」は「相関係数」を用いて表されます。
「相関係数」は2つのデータの「相関関係」を表す数値であり「ρ(ロー)」で表されます。
「相関係数」は「-1 ≦ ρ ≦ 1」の範囲で推移し、その数値は以下の意味を示しています。
相関係数 | 説明 |
ρ=1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に同じ方向に変動する。 |
0<ρ<1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて同じ方向に変動する。「1」に近いほど「正」の相関関係が強い。 |
ρ=0 | 2つのデータの変動には、全く関連性がない。 |
-1<ρ<0 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて逆の方向に変動する。「-1」に近いほど「負」の相関関係が強い。 |
ρ=-1 | 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に逆の方向に変動する。 |
マーケティングにおいて「相関係数」は2つの商品の売上金額の共分散と標準偏差から求められ、2つの商品の売上金額の「相関関係」を確認するために用いられます。
ここからは、「2つのデータ」という表記を「2つの商品の売上金額」に置き換えて「相関係数」の「符号」と「絶対値」が示す内容について確認していきます。
相関係数が「プラス」の場合
「相関係数」が「プラス」の場合、2つの商品の売上金額には「正の相関」があるといい、片方の商品の売上金額が変動するともう1つの商品の売上もそれに応じて同じ方向に変動します。
例えば、商品Aの売上金額が増加すれば、商品Bの売上金額も増加します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額も減少します。
相関係数が「マイナス」の場合
「相関係数」が「マイナス」の場合、2つの商品の売上金額には「負の相関」があるといい、片方の商品の売上金額が変動するともう1つの商品の売上金額もそれに応じて逆の方向に変動します。
例えば、商品Aの売上金額が増加すれば、商品Bの売上金額は減少します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額は増加します。
相関係数の絶対値
「相関係数」の「絶対値」は、2つの商品の売上金額に関する「相関関係」の強さを表しています。
2つの商品の売上金額に「相関関係」がない場合は「相関係数」の値は「0」であり、2つの商品の売上金額の増減に関する「相関関係」が強くなるにつれて「相関係数」の「絶対値」は徐々に大きくなっていきます。(最大値は「1」です。)
因果関係
「因果関係」とは「原因」と「結果」であり、片方の事柄が原因となって他方の結果が発生するという関係のことをいいます。
「マーケットバスケット分析」では「商品Xを購入した顧客は商品Yも購入する」という「因果関係」から、2つの商品の売上金額の関連性を分析していきます。
なお、「原因(条件)」と「結果(結論)」は、以下のように表現します。
マーケットバスケット分析の評価指標
「マーケットバスケット分析」では、以下の3つの評価指標を用いて2つの商品の売上金額に関する「因果関係」を分析していきます。
- 信頼度(コンフィデンス/確信度)
- 支持度(サポート)
- リフト値
「信頼度(コンフィデンス/確信度)」「支持度(サポート)」「リフト値」の数値が高い商品の組み合わせが「因果関係」が強く有用な組み合わせであると判断することができます。
アソシエーションルール
「アソシエーションルール」は「条件(原因)」と「結論(結果)」を関連付けることをいいます。今回の説明では、「商品Xを購入した顧客は商品Yも購入する」という「アソシエーションルール」について説明を進めていきます。
信頼度(コンフィデンス/確信度)
「信頼度」は「条件」が発生した場合に「結論」が発生する割合を示しており、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。
支持度(サポート)
「支持度」は、「全ての購買データ」の中で「条件」と「結論」の「因果関係」が成立した割合を示しており、その数値が高いほど全顧客の売上データの中で「因果関係」が成立する確率が高いことを表しています。
「支持度」の数値が低い場合は、店舗やECサイト全体の売上データにおいて、その2つの商品を同時に買う顧客が少ないことを表しています。
つまり、「支持度」が低い商品の組み合わせは、「信頼度」が高い商品の組み合わせであったとしても、店舗やECサイト全体の売上に占める割合が低く、たとえその商品の組み合わせの売上を伸ばせたとしても店舗やECサイト全体の効率的な売上拡大にはつながらないため、有用な組み合わせではないと判断することができます。
リフト値
「リフト値」は「結論」が「条件」と無関係に発生していないかを確認するための指標であり、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。一般的に、リフト値は「1」より大きくなる必要があります。
店舗やECサイト全体で最も売れている商品は、どの商品と組み合わせてもよく売れる組み合わせとなってしまうため、このような商品は一緒に購入されやすい商品を検討する対象から除外する必要があります。
「リフト値」では「結論」が発生する割合を分母に設定するため、店舗やECサイト全体で最も売れている商品を「結論」に設定すると「リフト値」が低くなり、有用な組み合わせではないと判断することができます。(この場合「結論」に設定している商品は、他の商品と関係なく単独で売れていることを示しています。)
試験問題
それでは、実際の試験問題を解いてみます。
【平成29年度 第40問】
次の文章を読んで、下記の設問に答えよ。
あるスーパーマーケットの、ある期間に購買のあった顧客1,000人分のID-POSデータを用いて、顧客が当該期間内に購入する商品の組み合わせを分析した。その結果、商品Aの購入者が200人、商品Bの購入者が250人、商品Aと商品Bの両方の購入者が100人であった。
(設問1)
「商品Aを購入した当該顧客の何パーセントが商品Bを購入するか」という値を、商品Bのプロモーションを検討する材料として計算したい。このときこの値は、一般に何と呼ばれる値か、最も適切なものを選べ。
ア Jaccard係数
イ 支持度(サポート)
ウ 信頼度(コンフィデンス)
エ 正答率
オ リフト値
(設問2)
設問1の「商品Aを購入した当該顧客の何パーセントが商品Bを購入するか」という値を実際に計算したとき、最も適切な値はどれか。
ア 15%
イ 20%
ウ 25%
エ 40%
オ 50%
中小企業診断協会Webサイト(https://www.j-smeca.jp/contents/010_c_/shikenmondai.html)
考え方と解答(設問1)
「マーケットバスケット分析」に関する知識を問う問題です。
「マーケットバスケット分析」は、マーケティングで利用される代表的なデータ分析手法であり、店舗のPOSデータやECサイトの取引データなどの蓄積データ(トランザクション)から、顧客が商品を購入するパターンを分析して、一緒に購入されやすい商品(商品Xと商品Yの関連性)を明らかにしていくことをいいます。
「マーケットバスケット分析」では、以下の3つの評価指標を用いて2つの商品の売上金額に関する「因果関係」を分析していきます。
- 信頼度(コンフィデンス/確信度)
「信頼度」は、「条件」が発生した場合に「結論」が発生する割合を示す指標であり、その数値が高いほど「因果関係」が強くて有用な組み合わせであることを表しています。 - 支持度(サポート)
「支持度」は、「全ての購買データ」の中で「条件」と「結論」が同時に発生した割合を示す指標であり、「支持度」が低い組み合わせは、その2つの商品を同時に買う顧客が少ないことを表しています。「支持度」が低い組み合わせは、たとえ「信頼度」が高い組み合わせであっても、そもそも全体の中で発生する確率が低いため、有用な組み合わせではないことを表しています。 - リフト値
「リフト値」は「結論」が「条件」と無関係に発生していないかを確認するための指標であり、数値が高ければ「因果関係」が強くて有用な組み合わせであることを表しています。
「商品Aを購入(条件)した当該顧客の何パーセントが商品Bを購入(結論)するか」を表す指標は「信頼度(コンフィデンス)」です。
Jaccard係数
選択肢にある「Jaccard係数」とは、2つの集合に含まれている要素のうち共通要素が占める割合を表す指標です。
その数値は「0~1」で推移しますが「1」に近いほど2つの集合が類似していることを表しています。
集合Xと集合Yの「Jaccard係数」は、以下の公式により算出することができます。
答えは(ウ)です。
考え方と解答(設問2)
「商品Aを購入した当該顧客の何パーセントが商品Bを購入するか」を示す「信頼度(コンフィデンス)」を算出します。
「信頼度」は「条件」が発生した場合に「結論」が発生する割合を示しており、その数値が高いほど「因果関係」が強く有用な組み合わせであることを表しています。
問題文で与えられた数値から「信頼度(コンフィデンス)」を算出すると以下の通りです。
- 信頼度( A → B )
商品Aと商品Bを購入した購入数(100人)÷ 商品Aを購入した顧客数(200人)= 50%
答えは(オ)です。
コメント