
今回、速度理論と数量化分析に使用しているモデル構造と予想パラメータの全てを公開します。これは私のソフトの心臓部分でVer.24.0.0に実際に組み込まれているものです。公開した理由は速度理論・数量化分析と一般の指数理論を差別化するためです。私の理論のルーツは1970年代に勤めていた会社と関係があった英国原子力公社のRadiochemical Centreが研究者向けに出していたパンフレットに掲載されていた非線形回帰のプログラムにヒントを得たもので、競馬とは全く関係しない分野からの発想です。DLファイルの内容は
速度理論と数量化分析による競馬予想 (HRPTV5C)の解説にありますので、ここより落として下さい。さらにF27に定義されている基礎牝馬を見つけ出す為の母母母***12代母まで探れるデータテーブルも速度理論と数量化分析による競馬予想 (HRPTV5C)の解説にて落とせます。これはミトコンドリア因子を想定しました。
私が使っています数量化1類はダミー変数による重回帰と等価とされていますが、重回帰の中でも難しい概念は偏相関です。この説明には単純に予想因子と馬の能力(速度)との本当の関係として、あまり詳しく触れませんでした。しかし、最近、この偏相関について分かり易く(?)解説したページが見つかりましたので、ご紹介したいと思います。サイトのタイトルは”アイスクリーム統計学にようこそ!”と言うものです。物事の表面的関係(単相関)と偏相関の違いをアイスクリーム店に来る客の数とその日の最高気温及び最低気温と関係を例にして解説しています。内容的には常識では理解できないような事がさらっと記述されています。それは当然競馬予想にも適用される訳です。
多重共線らしき現象の主役の1頭であるダンシングブレーブに不思議な事が起こるのです。孫馬達のデータを調べていたら、彼らあるいは彼女らの祖父(父の父)馬が不思議な事に2頭いるのです。即ち、Dancing Braveとダンシングブレーヴがいたのです。これは有り得ない事ですね。(これは今回の問題とは別にデータベースの無謬性と言う厄介な命題に繋がります) この2頭の内、Dancing Braveが多重共線らしき現象を芝コースで引き起こしました。父父馬としてのDancing Braveのダミー変数のサンプル数が父馬コマンダーチーフと父馬ホワイトマズルの両ダミー変数のサンプル数合計と全く一致してしまったのです。具体的な数字を挙げますとDancing Braveのサンプル数が2812、コマンダーチーフのサンプル数は1633、ホワイトマズルのサンプル数1179となり、1633+1179=2812となり見事一致します。ここでのサンプル数は孫馬(コマンダーチーフとホワイトマズルに取っては産駒になります)のここ4年間(2004年~)の延べ頭数となります。
最近のコメント