多重共線性(multi-colineality)、通称はマルチコと言うらしい。一般に多変量解析では非常に厄介な問題であるが、あまり具体的に説明されていないところがあります。特に数量化分析では少ないようです。多重共線性は多数の説明変数のなかで、ある特定の説明変数間に強い相関がある場合、解析結果が不安定になったり説明不能になる事です。例えば、競馬の場合、騎手と調教師の間に専属契約があり、調教師も騎手も複数の契約が出来ないとすると騎手と言う変数と調教師という変数が全く同一になってしまい、これら2つの変数を同時に設定することは無意味になります。こういう場合はどちらか一方を変数として使用しなければ良いわけですが、一般的なデータの場合は背景の理解が難しい事が多く曖昧です。ここで注意しなければならないのは専属契約と複数契約の禁止と言う二つの条件があるとして、この二つは数学的な処理では無いという事です。多変量解析における変数の設定は突き詰めれば非常に恣意的になっている事です。また、実際の競馬の場合、フリー契約や専属契約の縛りの方向などにより、騎手と調教師は二つの変数を取ることができ、さらに騎手x調教師と言うこれまた厄介な交互作用が存在します。
ところで、数量化では、実は多重共線は起こらないようです。逆行列が発散してしまう事は起こりますので、これを多重共線として扱えばそうでしょうが、発散が起こった場合の状況は一つしかありません。それはダミー変数が等価になった時生じます。ダミー変数が等価になるとは具体的に競馬ではどういう事かですが、父父馬と父馬が一致してしまう事です。さらに具体的に言いますとダンシングブレーブという有名な種牡馬がいます。この馬はマリー病と言う奇病に罹り、生産国イギリスでは種牡馬として見切られたが、JRAがリスクを被って購入し日本で種牡馬として供用され、産駒のコマンダーチーフやホワイトマズルなどが活躍して種牡馬として大成功を収め、生産国イギリスでは安易な日本への流出を問題視されたとか。現在、日本で活躍しているのはコマンダーチーフやホワイトマズルの産駒達で、ダンシングブレーヴから見れば孫馬になる訳です。今回、多重共線らしきもの現象の主役はこの3頭が務めます。


最近のコメント