『SEMと3つの解法』 -朝野熙彦
SEM(Structural Equation Modeling、構造方程式モデリング)はマーケティングで最近話題になることが多い数理統計手法です。略してセムと呼びます。その着眼点は違うものの共分散構造分析も同義語として用いられています。さて、SEMはなぜ必要なのでしょうか? SEMは産業界で本当に使われているのでしょうか? SEMにはどういう解き方があるのでしょうか?まだSEMを使ったことがない方の疑問にお答えしましょう。
■SEMを使って何が嬉しいのか
SEMを形容する言葉はいくつもあります。フォーネルという人は第2世代の多変量解析だと言いましたし、SEMの権威である狩野先生はグラフィカル多変量解析という表現をしました。前者はSEMがパス解析、重回帰分析、因子分析など各種の多変量解析を包含した一般的なモデルだという性質をさしています。後者はモデルがグラフィックに表されるという性質をさしています。
統計解析の研究者にとってみれば、分析モデルの一般化は興味がある問題なので、本当にSEMだけで多変量解析が何でも実行できるのか?という検討が行われました。実際にかなり多くの分析が実行できることが分かってきています。
しかし、マーケティングにおけるデータ解析の実務家にとってみれば、既存の分析をしたければそれぞれ専用のソフトを使えばよいのであって、何もSEMを持ち出す必要はありません。使い慣れない分析をするのは面倒だ、というのが正直なところでしょう。
一方、分析結果が図解できることは実務家にとってメリットのある性質です。SEM専用のソフトを使えば、分析のアイデアをお絵かき風にドローイングするだけで、計算の実行からレポートまですべて実行してくれます。まさにGUI(グラフィック・ユーザー・インターフェース)の極致ですね。
マーケティングにおけるデータ分析の目的は、マーケティングの意思決定者に理解しやすいようにデータを情報化することにあります。図1のようなパス図で自らの仮説を表して、そのモデルが正しいかどうかをデータで検証できることはとても強力な性質だといってよいでしょう。
■SEMでなければ出来ないこともある
1.既存の多変量解析がSEM一つで代行できる
2.分析のアイデアが絵になる
というだけでは何がなんでもSEMというほどの説得力はありません。
しかし複雑なモデルになると既存の多変量解析では解けなくなります。そのひとつの例が図1の多重指標モデルです。
このモデルは因果モデルに潜在変数を加えたものという理解もできますし、あるいは重回帰分析と因子分析を結合したものという理解をしてもよいでしょう。ある因子とある因子には因果関係を認めたい、しかし別な因子との組み合わせでは無相関を仮定したい、などという複雑な構造のモデルでも分析を実行できます。
図1の楕円が因子という潜在変数を表していて矢印が因果関係を表します。何の線でも繋がれていない因子どうしは無相関を仮定しています。また同図で四角で囲んだ変数は調査によって観測される変数を表しています。
図1 多重指標モデルの一例(サービス産業生産性協議会のホームページを元に作成)
■SEMの適用事例:日本版顧客満足度指標(JCSI)
“日本版CSI”というキーワードでWEB検索をしたところ、ヤフーで49万件、グーグルで50万件がヒットしました(2012年10月23日現在)。JCSIが世の中にとても高い関心を持たれていることが分かります。
公益財団法人日本生産性本部が大規模な調査研究を継続していることは素晴らしい!という好意的な評価を含めていろいろなご意見をホームページで見ることができます。たぶんJCSIが日本で公知の事実になったのは、サービス産業生産性協議会から発表された2009年3月10日(月)の下記のニュースリリースが最初だったでしょう。
■日本版CSIの特徴
1)消費者の購買行動に共通する心の動きをモデル化したもので、サービス産業全体を業種横断的に比較ができます。
2)顧客満足度だけでなく、満足および不満足にいたる原因と、満足および不満足だった結果としてとるであろう行動までも分析できる因果モデルです。
3)ヘビーユーザーだけでなくライトユーザーも含むサービス利用者の全体像を明らかにするために、サービスの利用経験者から一定数の信頼できるデータをとっています。
平成19年の研究着手の当時、ミシガン大学ではすでにACSIを開発していることは承知していました。また欧州、韓国、シンガポール、香港でもそれぞれCSIが導入されていました。しかし、日本版CSIでは既存の指標を模倣するのではなく、我が国独自でSEMのモデルを作りました。そのために先行研究の理論的なレビューを行い、構成概念を検討しパイロット調査を何度も繰り返して開発を進めましたので、結果的にJCSIは日本独自のモデルになりました。なぜそんなに裏事情に詳しいのかといいますと、実は私も日本版CSIの開発委員会に当初から加わっていたからです。
■SEMの3通りの解法
SEMの具体的なパラメータの推定法として主流なのは、共分散構造を利用した最尤法です。パラメータを正確に推定することに力をおいた解法です。 それ以外にPLS(部分最小二乗法)とベイズ推定があって、この3つがSEMの主な解法です。PLSは観測値とモデル値の誤差の二乗和を最小にすることを主眼とした方法です。
ウオルドという人が潜在変数を含んだパス解析で、パラメータを分割して部分だけのパラメータを推定する、という反復推定法を1975年に提唱しました。1970年代は高根先生のグループが、同じく交互最小二乗法 (ALS: alternating least squares method)を多次元尺度構成法に適用して、次々と研究成果を発表されていた時期に重なります。
PLSとALSの発生は統計解析史として興味深いものがあります。さてPLSには数値計算法として、パラメータの全体を部分に分割する操作に一意性がないという弱点があることと、解が収束するとは限らないという問題がありました。また適用上の適切性からも、マーケティング活動のような明確な活動から潜在変数を合成すべきものなのか、それとも消費者の心理的な変数を潜在変数にするかで使い分けるべきだという説があります。
はっきり言えば、前者なら主成分分析でよいし、後者なら因子分析がよいという意味です。顧客満足を心理的な潜在変数であると考えるなら因子としてモデリングする共分散構造分析の採用が適切なことになります。なお、因子分析は観測変数の分散を因子で説明できる分散と、観測変数の固有の分散に分解する方法です。それぞれ共通性、独自性という呼び方をしています。そして独自性がマイナスになる推定結果を不適解と呼んでいます。
不適解を避ける方法としてベイズ推定を利用するという手段があります。非負の事前分布を用いればよいのです。もちろんそういう対処法には異論もあって、根本的な問題はモデリングか調査データの一方か両方が不適切だったことに起因するのであり、そのように不適解を糊塗する行為こそが不適だ、という説もあります。
SEMのカラクリを易しく解説した実務家向けの入門書として次の本がありますので、ご関心のある方はご覧ください。
朝野熙彦・他「入門共分散構造分析の実際」講談社、2005年
■SEMを用いたコレクシアの手法
コミュニケーションゴールに対して、最適なコンタクトポイント編成を行う手法 | 製品ベネフィットがニーズを満たして行く道筋から、最適なコミュニケーションプランを探る手法 | 製品に適した購買行動モデルを作成し、購買ファネル上のどこに問題があるのか特定する手法 |
市場調査クリニックの最新情報は、現在フェイスブックページにて先行公開を行っています。
[市場調査クリニック フェイスブックページ]
https://www.facebook.com/researchclinic
市場調査クリニックではインタビューの他にも、様々なマーケティングの課題に対応する様々な調査手法公開しています。 また、運営会社の株式会社コレクシアではこれらの手法に限らず、様々なテーマの調査実績が御座いますので、詳しくはお気軽にお問い合わせ(03-5937-0137)下さい。すでに調査データをお持ちの場合は、データ再活用サービス:セカンドオピニオンにて、データ診断「0円~」のキャンペーン中です。
朝野 煕彦 (あさの ひろひこ)
1969年、千葉大学文理学部卒業後、マーケティング・リサーチの企業に就職し、コンサルティング業務を行う。1980年、埼玉大学大学院修了。その後、筑波大学特別研究員、専修大学教授を経て、東京都立大学、首都大学東京教授を歴任する。現在、多摩大学大学院客員教授。日本マーケティング・サイエンス学会論文誌編集委員。日本行動計量学会理事。著書は「最新マーケティング・サイエンスの基礎」(講談社)など多数。