『決定木』 -朝野熙彦
長かった残暑がようやく終わって秋らしい季節になってきました。さて、今月はマーケット・セグメンテーションの話をします。セグメンテーションには2つの異なるアプローチがあるという話題です。
■従来のセグメンテーションへの不満
マーケティングの実務では、消費者のライフスタイルや価値観を因子分析して、その結果をクラスター分析にかけて市場を分割するというアプローチが、ポピュラーに行われてきました。
もし分析者の思惑通りに運べば、クラスター間で消費行動に違いが出て、効率的な市場対応ができるはずです。しかし、実際にはそうは問屋がおろさないことがあります。どのクラスターも大差がないので市場全体に訴求するのと違わないとか、そもそも企業がクラスターにアクセスできるような仕組みが用意できていない、という問題がありました。つまり概念レベルでの議論ならOKですが、具体的なマーケティング・アクションに展開することができない、という不満です。
また標準的なセグメンテーションは、多次元空間に消費者を位置づけた上で消費者間の類似度にしたがってグルーピングを行うというロジックでした。数学的な理屈は通っているのですが、それで理解できるかどうかは利用者次第です。難しいことを言われても分からない、という不満もあったことでしょう。
■望ましいセグメンテーション
さて、ここで産業界のセグメンテーションへの要請を整理すれば、
1.セグメントによって消費者行動が明確に分離できること
2.セグメンテーションのロジックが簡単なこと
3.企業がターゲットにアクセスできること
の3条件だ、ということになりましょう。
これらが厳しい条件であることを例を挙げて確認してみましょう。最近では女性の理想の結婚相手は「3低」なのだそうです。3低とは、「低姿勢」「低依存」「低リスク」を指します。3低はand 条件の定義ですからセグメントを定めるロジックは簡単です。低リスクかどうかは職業で判定するそうです。しかしはたして男性が本当に低姿勢で低依存なのかは外見では識別できません。そのような個人情報を所載した国民のデータベースもたぶんないでしょうから、企業がターゲットにアクセスする事も困難です。
セグメントへの帰属が判定できる情報を持った個人データが利用できて、狙ったターゲットにアクセスできるとき、そのようなセグメントをタンジブル(tangible)だと私は呼んでいます。そのようなセグメンテーションが Tangible Segmentation です。セグメントがタンジブルであることは、現実のマーケティング活動を実行する上で不可欠の条件です。メールの発信や電話セールスをするときに、ターゲットが選別できなければアウトバウンド業務が出来ません。ユーザーの方が企業にコンタクトするインバウンド業務においても、リアルタイムでそのユーザーがどのセグメントに帰属するかが識別できない限り、適確なリコメンデーションができません。
■そこで決定木
タンジブルなセグメンテーションを可能にする方法がディシジョン・ツリーです。従来のセグメンテーションと比べてディシジョン・ツリーの根本的な違いは何かといえば、それは予測したい消費者行動を分析変数に加えて、その消費者行動が予測できるようにセグメントを定める、というところにあります。機械学習の用語でいえば、従来のセグメンテーションは教師なしの学習であり、ディシジョン・ツリーは教師付きの学習だといえます。
図1 ディシジョン・ツリーのアプローチ
■具体的なアウトプット
ディシジョン・ツリーの生みの親であるモーガンは1963年にAIDというツリー技法を提唱しました。けれども今日、よく知られたディシジョン・ツリーの研究者は1984年にC&RT(カートと呼ぶ)を提唱したブライマンでしょう。なおブライマンは2005年に逝去されています。ディシジョン・ツリーの日本語訳はまさに直訳で決定木です。この漢字表記は簡潔で良いのですが、「けっていぎ」「けっていき」「けっていぼく」「けっていもく」などと発音が人によってまちまちです。ディシジョン・ツリーの具体的なアプトプットを図2に示します。
図2 ディシジョン・ツリーの例
アウトプットの詳しい読み方についてはコチラを御覧下さい。
■ディシジョン・ツリーはなぜ強力なのか
相撲用語に、注文相撲という言い方があります。相手の出方を予測して立ち合いに変化するような相撲です。うまく予測があたればいいのですが、見込みが外れれば失敗します。従来のマーケット・セグメンテーションの方法がまさに注文相撲でした。成功するか失敗するかは、データ解析をしてみなければ分かりません。その点、ディシジョン・ツリーは、消費者行動が最も異なるようにマーケットを分割するのですから、失敗はありません。
冒頭に述べた3条件を再確認しますと、
1.セグメントによって消費者行動が明確に分離できることは間違いない
2.説明変数のand条件でセグメンテーションできるのでロジックは簡単
3.企業が入手できる個人情報を説明変数に選べば、ターゲットにアクセスできる
図:ディシジョン・ツリーの活用例(リンク) |
3は、性別や年齢のような情報で市場を分割すればタンジブルなセグメンテーションになり、顧客にコンタクトできるという意味です。
ディシジョン・ツリーにも限界はあります。第1に分析する消費者行動が異なれば、セグメントも変化するという限界があります。けれどもすべての財に共通するセグメントなどあるはずがないので、これは当然の限界だといえましょう。2番目の限界として、多数の説明変数を用意しても、マーケットの分割に採用される説明変数はごく少数に絞られてしまい、大量の情報が活かされない、という問題が指摘できます。この点に関しては、やはりブライマンがランダム・フォレスト法という、集合知を求めるような方法を提案しています。ディシジョン・ツリーそのものが、まだ枝を伸ばして成長している段階にあるといえましょう。シャープで簡潔な市場分割を目指す方にとって、ディシジョン・ツリーは着目すべき方法だといえましょう。
【文献】
Breiman,L., Friedman,J., Olshen,R. and Stone,C. (1984)Classification and Regression
Trees, Wadsworth.
Breiman,L. (2001) Random Forests, Machine Learning, 45, 5-32.
市場調査クリニックの最新情報は、現在フェイスブックページにて先行公開を行っています。
是非ともフェイスブックページにお越し頂き、いいね!をお願い致します。
[市場調査クリニック フェイスブックページ]
https://www.facebook.com/researchclinic
市場調査クリニックではインタビューの他にも、様々なマーケティングの課題に対応する様々な調査手法公開しています。 また、運営会社の株式会社コレクシアではこれらの手法に限らず、様々なテーマの調査実績が御座いますので、詳しくはお気軽にお問い合わせ(03-5937-0137)下さい。すでに調査データをお持ちの場合は、データ再活用サービス:セカンドオピニオンにて、データ診断「0円~」のキャンペーン中です。
朝野 煕彦 (あさの ひろひこ)
1969年、千葉大学文理学部卒業後、マーケティング・リサーチの企業に就職し、コンサルティング業務を行う。1980年、埼玉大学大学院修了。その後、筑波大学特別研究員、専修大学教授を経て、東京都立大学、首都大学東京教授を歴任する。現在、多摩大学大学院客員教授。日本マーケティング・サイエンス学会論文誌編集委員。日本行動計量学会理事。著書は「最新マーケティング・サイエンスの基礎」(講談社)など多数。