運営管理 ~H28-39 POSシステム(2)マーケットバスケット分析~

シェアしてもらえたらうれしいです!

見出し


にほんブログ村に参加しています。
記事の内容にご満足いただけた方は、以下のボタンをクリックしてもらえると嬉しいです。
にほんブログ村

にほんブログ村 資格ブログ 中小企業診断士試験へ


今回は、「運営管理 ~H28-39 POSシステム(2)マーケットバスケット分析~」について説明します。

運営管理 ~平成28年度一次試験問題一覧~

平成28年度の試験問題に関する解説は、以下のページを参照してください。

マーケットバスケット分析

「マーケットバスケット分析」は、大量のデータから有用なパターンやルールを見つけ出すデータマイニングの分析手法である「アソシエーション分析」の中の1つの方法です。

「マーケットバスケット分析」は、マーケティングで利用される代表的なデータ分析手法であり、店舗のPOSデータやECサイトの取引データなどの蓄積されたデータ(トランザクション)から、顧客が商品を購入する際の購入パターンや売買履歴を分析して「商品Xと商品Yの関連性」を見つけ出していきます

なお、「商品Xと商品Yの関連性」とは、「相関関係」ではなく「因果関係」のことを示しています。

相関関係と因果関係の違い

「マーケットバスケット分析」は「相関関係」ではなく「因果関係」を分析する手法です。
「相関関係」と「因果関係」の違いを以下に説明します。

相関関係

「相関関係」とは、2つのデータが存在する場合において、片方のデータが変動すると、それに応じて他方のデータも変動する関係のことをいい、パターンに応じて「正の相関」「負の相関」と呼ばれます。

  • 正の相関
    片方のデータが変動すると、他方のデータもそれに応じて同じ方向に変動する。
  • 負の相関
    片方のデータが変動すると、他方のデータはそれに応じて逆の方向に変動する。

参考として、「相関関係」の強さを示す「相関係数」について以下に説明します。

相関係数

「相関係数」とは2つのデータの相関関係を表す数値であり「ρ(ロー)」で表されます。
「相関係数」は「-1 ≦ ρ ≦ 1」の範囲で推移し、その数値は以下の意味を示しています。

相関係数 説明
ρ=1 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に同じ方向に変動する。
0<ρ<1 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて同じ方向に変動する。「1」に近いほど「正」の相関関係が強い
ρ=0 2つのデータの変動には、全く関連性がない
-1<ρ<0 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて逆の方向に変動する。「-1」に近いほど「負」の相関関係が強い
ρ=-1 2つのデータは、片方のデータが変動すると他方のデータもそれに応じて完全に逆の方向に変動する。

相関係数は、2つの商品の売上金額の増減に関する関連性を示す数値であり、2つの商品の売上金額の共分散と標準偏差から求められます。

相関係数が「+プラス」の場合

相関係数が「+プラス」の場合は、2つの商品の売上金額には「正」の相関関係があるといい、片方の商品の売上金額が変動するともう1つの商品の売上もそれに応じて同じ方向に変動します。

例えば、商品Aの売上金額が増加すれば、商品Bの売上金額も増加します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額も減少します。

相関係数が「-マイナス」の場合

相関係数が「-マイナス」の場合は、2つの商品の売上金額には「負」の相関関係があるといい、片方の商品の売上金額が変動するともう1つの商品の売上金額もそれに応じて逆の方向に変動します。

例えば、商品Aの売上金額が増加すれば、商品Bの売上金額は減少します。
逆に、商品Aの売上金額が減少すれば、商品Bの売上金額は増加します。

相関係数の絶対値

相関係数の絶対値は、相関関係の強さを表しています。

2つの商品の売上金額の増減に関連性がない場合は相関係数の数値は「0」であり、2つの商品の売上金額の増減に関する関連性が強くなるにつれて、相関係数の絶対値は徐々に大きくなっていきます。(最大値は「1」です。)

因果関係

「因果関係」とは「原因」と「結果」であり、片方の事柄が原因となって他方が発生するという結果になる関係のことをいいます。

「マーケットバスケット分析」では、「商品X」を購入した人は「商品Y」も購入するという「因果関係」を分析していきます。

「原因(条件)」と「結果(結論)」は、以下のように表現します。

マーケットバスケット分析で用いる指標

「マーケットバスケット分析」では「信頼度(コンフィデンス/確信度)」「支持度(サポート)」「リフト値」という3つの指標を使って「因果関係」を分析していきます。

「信頼度(コンフィデンス/確信度)」「支持度(サポート)」「リフト値」の全ての指標が高い商品の組み合わせが「因果関係」が強くて有用な組み合わせであると判断します。

アソシエーションルール

「アソシエーションルール」は「条件」と「結論」を関連付けることをいいます。今回の説明では、「商品Xを購入した顧客は商品Xも購入する」という「アソシエーションルール」について説明を進めていきます。

信頼度(コンフィデンス/確信度)

「信頼度」は、「⁠条件」が発生した場合に「結論」が発生する割合を示す指標であり、その数値が高いほど「因果関係」が強くて有用な組み合わせであることを表しています。

支持度(サポート)

「支持度」は、「全ての購買データ」の中で「条件」と「結論」が同時に発生した割合を示す指標であり、「支持度」が低い組み合わせは、その2つの商品を同時に買う顧客が少ないことを表しています。

したがって、「支持度」が低い組み合わせは、たとえ「信頼度」が高い組み合わせであっても、そもそも全体の中で発生する確率が低いため、有用な組み合わせではないと判断します。

リフト値

「リフト値」は「結論」が「条件」と無関係に発生していないかを確認するための指標です。

店舗においてもっともよく売れている商品は、どの商品と組み合わせてもよく売れる組み合わせとなってしまうため、見極めが必要です。

「リフト値」では「結論」が発生する割合を分母にするため、店舗においてもっともよく売れている商品を「結論」に設定している場合は「リフト値」が低くなります。(この場合「結論」に設定している商品は、他の商品と関係なく単独で売れていることを示しています。)

したがって、数値が高い方が「因果関係」が強くて有用な組み合わせであると判断することができます。一般的に、リフト値は「1」より大きい数値である必要があります。

試験問題

それでは、実際の試験問題を解いてみます。

【平成28年度 第39問】

ある小売店の一定期間におけるID-POSデータを用いて、100人のある顧客セグメントに対するマーケットバスケット分析を行ったところ、商品aと商品bの購買に関して、下表のような結果が得られたとする。
このとき、以下の設問に答えよ。

購買した商品群 購買した顧客数
商品a 20
商品b 40
商品a かつ 商品b 10

(設問1)

支持度(サポート)に関係する記述として、最も不適切なものはどれか

ア 商品aのみを購買した顧客数は10人である。
イ 商品bのみを購買した顧客数は30人である。
ウ 商品aと商品bを共に購買した顧客数は10人である。
エ 商品aも商品bも購買していない顧客数は40人である。
オ 商品aも商品bも購買していない顧客数は、商品bのみを購買した顧客数より多い。

(設問2)

リフト値(lift(商品a⇒商品b))の値として、最も適切なものはどれか。

ア 0.25
イ 0.50
ウ 1.00
エ 1.25
オ 2.50

中小企業診断協会Webサイト(https://www.j-smeca.jp/contents/010_c_/shikenmondai.html

考え方と解答(設問1)

「マーケットバスケット分析」の「支持度(サポート)」に関する知識を問う問題ですが、問題文の条件を正確に読み取って、以下に示すようにそれぞれの商品を購買した人数を算出することができば、確実に正解することができる問題です。

(ア) 適切です。

商品aのみを購買した顧客数は「10人」であるため、選択肢の内容は適切です

(イ) 適切です。

商品bのみを購買した顧客数は「30人」であるため、選択肢の内容は適切です

(ウ) 適切です。

商品aと商品bを共に購買した顧客数は「10人」であるため、選択肢の内容は適切です

(エ) 不適切です。

商品aも商品bも購買していない顧客数は「40人」ではなく「50人」であるため、選択肢の内容は不適切です

(オ) 適切です。

商品aも商品bも購買していない顧客数「50人」は、商品bのみを購買した顧客数「30人」より多いため、選択肢の内容は適切です

答えは(エ)です。


考え方と解答(設問2)

「マーケットバスケット分析」の「リフト値」に関する知識を問う問題です。

「リフト値( x → y )」は「結論」が「条件」と無関係に発生していないかを確認するための指標です。

少し難しいですが、「リフト値( x → y )」が「1」より大きい数値であれば、「商品x」が売れた場合には「商品y」も売れているということを意味しており、「商品x」と「商品y」は「因果関係」が強くて有用な組み合わせであると判断することができます

「リフト値( x → y )」は、以下の公式により算出することができます。

上記の公式に基づいて「リフト値( 商品a ⇒ 商品b )」を算出すると以下の通りです。

  • 信頼度( a → b )= 10人 ÷ 20人 = 0.5
  • 支持度( b )= 40人 ÷ 100人 =0.4
  • リフト値( a → b )= 0.5 ÷ 0.4 = 1.25

答えは(エ)です。


シェアしてもらえたらうれしいです!