Archives

記号の必勝 競馬配当160億円の「予想プログラム」のロジックとは?

fujisan 005

競馬の配当160億円を脱税、160億円が純利益であれば、まさしく驚愕の一語につきますが、税務処理をまともに行っていなかったと言う事になりますので、本当のところの利益は推測の域を出ませんね。従って、予想プログラムのロジックを推定するには、本当の収支が明らかにならないと出来ない事になります。ただ、3年間に渡って、これだけの金額を動かせたと言う事は、やはり必勝法が存在していたと考えるのは妥当と思われます。

ところで問題なのは、競馬予想プログラムで使われた必勝ロジックとは何者で有るかです。現在、数多くのブログで記事になっていますが、今ひとつな感じです。手掛かりとしては、比較的詳しく書かれた新聞各紙の記事です。もう一つは、今は削除されたデータ分析会社のホームページに書かれていた仕事の内容です。キーワードとしてはデーターマイニング、モデリング、決定木などです。以上を手掛かりにロジックを推定して見ますと大きくは二つに分かれるようです。第一は3着までにくる可能性の無い馬(厳密にはゼロでは有りません)の切捨て、第二は3連単においてトリガミ(的中してもプラスにならない買い方)にならない購入資金の配分方法です。

第二の問題は簡単とは言いませんが、連立方程式の解法の基本であり、リアルオッズが得られれば、略瞬時に数千点の買い目に購入資金を配分するソフトの作成は難しいものでは有りません。現実にJRA-VANのNEXTには購入&シュミレーションの配当均等型として実装されています。ただ、金額の上限が999,900円である事、点数は3連単9頭ボックスの504点(トリガミの無い購入資金の配分が可能のようです)位までに限定されます。

第一の問題は際限の無い難しさですので、別に記事にする事にします。第一及び第二の問題に触れる前に何故券種として3連単が選ばれたかです。点数の扱い易さから言えば購入点数が6分の1になる3連複でも良かったわけですし、極論すれば単勝でも構わなかった訳です。この点については私は馬券の非効率性にあると考えています。これも面白いので別記事に仕立てる予定です。

記号の必勝 競馬予想プログラム160億円配当獲得

fujisan 003

少し旧聞に属しますが、2009年10月9日の新聞各紙の社会面(特に朝日新聞では紙面の半分くらい使用)によれば、英国人が社長を務めるデータ分析会社が、独自に開発した競馬予想プログラムで得た競馬の配当金を3年で160億円隠していたとして脱税容疑で査察されたとの事。事実とすれば非常な驚きです。脱税は許しがたい行為ですが、この事件の特異な事は、直接の被害者が出ていない事です。競馬商材、インチキ競馬ソフトのマルチ等は詐欺であり多数の直接的被害者いる事件とは趣を異にしています。何れにしましても、脱法行為と言う負の側面はありますが、今は削除されているデータ分析会社のHPを読んだ限りに於いては、その方法論を考察する価値は有りそうです。

一般に日本では高度な数学的アプローチによるギャンブルの必勝法は邪道と見なされているようです。しかし欧米では、一つはブックメーカーの存在があるのと、馬券市場を金融市場のミニ版として研究対象とされているようです。従って、競馬必勝法の研究は大学レベルでも数多く行われ、論文も数多く発表されています。中でも、D,B Hausch(行動経済学の世界的権威)監修の”EFFICIENCY OF RACETRACK BETTING MARKETS 2008 Edition”には主に1970年代から最近までの競馬必勝理論がこれでもかと言う数で収録されています。件のデータ分析会社はHPのレベルからすれば、この本の論文には精通している筈です。因みに出版社であるWorld Scintific社は多くのノーベル賞受賞者が論文を寄せています。最近の例ではノーベル物理学賞の南部先生、化学賞の下村先生などですが、この出版社の凄いところはノーベル賞受賞の遥か前に論文が掲載されている事です。

本書の中の論文で注目されるのは”SEARCHING FOR POSITIVE RETURNS AT THE TRACK: A   MULTINOMIAL LOGIT MODEL FOR HANDICAPPING HORSE RACES”の中で用いられている一般化線形モデルの一つである多項ロジットモデルは面白そうです。そして、そのモデルの改良版として発表された”STIL SEARCHING FOR POSITIVE RETURNS AT THE TRACK:EMPIRICAL RESULTS FROM 2,000 HONG KONG RACES”では20%以上の超過利益が期待できるとされています。件のデータ分析会社の本社は香港に存在するとされていますので、まずこの論文を読んでいる可能性は非常に高いと思われます。

今後、私の数量化理論と重ね合わせ、日本の実際のレースで検証してみたいと思います。最後にオッズ解析によりオッズの歪みを見つけ出そうとするオッズ解析は多分間違いです。最後の論文で a 20-variable pure fundamental multinomial logit modelと表現しているのは各馬の真の能力(勝率)を求める事を要請していますので株価のチャート分析のようにオッズの時系列の特異点解析ではないようです。また、論文のどこだかわすれましたが、小数サンプルのアノマリーにも触れられており、熟読する価値は有りそうです。

的中回収 2009年10月10,11日の予想結果纏め

下の表は、先週の全レース48Rを開催場所、日次毎(12レース単位)に馬連数量化本線6点と数量化単勝・複勝1点について纏めたものです。的中率についてはレース単位で、33.3%であれば12レース中4レースが的中していた事を意味します。回収率は均等買いとして、馬連については12レースで7200円配当があれば100%(600円x12レース)となり、単勝・複勝については12レースで1200円配当があれば100%(100円x12レース)になります。なお、個々のレースの詳しい予想内容は各プロバイダーのリンクを辿れば得られます。

馬連F~3連単13Mまでは購入点数は左が1レースあたりの平均点数、右が全12レースでの総購入点数となります。詳しくは「記号の解析 単勝・複勝などの的中解析」を参照してください。

2009年330万円を始め万馬券884本的中
京都4回1日1R 3連単 12→8→3 37560円 1点目-108番人気
京都4回2日8R 3連単 17→18→3 118300円 117点目-409番人気
毎日王冠(G2) 3連複 3-4-6 9890円 20点目-23番人気
京都4回2日12R 3連単 12→15→10 64120円 57点目-198番人気
土日万馬券9本的中速度理論と数量化分析による高精度データマイニング予想

tekityukaisyuritu_9682_image0028