
競馬の配当160億円脱税は話題としては古くなってしましましたが、憶測が多く未だに詳しい状況は不明ですね。しかしながら、最初の報道で対象とした馬券が3連単であったのは事実のようです。そこで何故3連単でなければならないのかを少し考察してみました。
私見では馬券市場の効率性ではないかと思います。上の表には過去5年間に発売された3連単の一番人気の的中率及び回収率を対応する馬連、馬単、3連複と比較したものです。3連単に特徴的なのは回収率が50%から60%の範囲にあり、他の券種より低い事です。即ち、3連単は効率的では無い、言い換えると馬券の買い方が他の券種より下手である事になります。
結局、3連単は非効率であるから選ばれたと思われます。そしてもう一つ重要なのは1から3着までに来る可能性の高い馬を探す(一般の馬券の選択理論であり効率化されている-旨みが無い)よりは、1から3着までに来ない馬を探す方が非効率性を突くには効率的である事です。->負ける馬を真剣に探す行為は一般的には面白くない予想行為ですね。
もう少し、思索を行わないといけませんが、ここで少し脱線して再来年に導入されるであろう5重勝を考えて見ました。5重勝の一番人気の的中率は0.3%と考えています。意外と高い気がします。また1番人気が的中した時の配当は10,000円前後で、こちらは意外と低いようです。回収率は33%位になりそうです。

競馬の配当160億円を脱税、160億円が純利益であれば、まさしく驚愕の一語につきますが、税務処理をまともに行っていなかったと言う事になりますので、本当のところの利益は推測の域を出ませんね。従って、予想プログラムのロジックを推定するには、本当の収支が明らかにならないと出来ない事になります。ただ、3年間に渡って、これだけの金額を動かせたと言う事は、やはり必勝法が存在していたと考えるのは妥当と思われます。
ところで問題なのは、競馬予想プログラムで使われた必勝ロジックとは何者で有るかです。現在、数多くのブログで記事になっていますが、今ひとつな感じです。手掛かりとしては、比較的詳しく書かれた新聞各紙の記事です。もう一つは、今は削除されたデータ分析会社のホームページに書かれていた仕事の内容です。キーワードとしてはデーターマイニング、モデリング、決定木などです。以上を手掛かりにロジックを推定して見ますと大きくは二つに分かれるようです。第一は3着までにくる可能性の無い馬(厳密にはゼロでは有りません)の切捨て、第二は3連単においてトリガミ(的中してもプラスにならない買い方)にならない購入資金の配分方法です。
第二の問題は簡単とは言いませんが、連立方程式の解法の基本であり、リアルオッズが得られれば、略瞬時に数千点の買い目に購入資金を配分するソフトの作成は難しいものでは有りません。現実にJRA-VANのNEXTには購入&シュミレーションの配当均等型として実装されています。ただ、金額の上限が999,900円である事、点数は3連単9頭ボックスの504点(トリガミの無い購入資金の配分が可能のようです)位までに限定されます。
第一の問題は際限の無い難しさですので、別に記事にする事にします。第一及び第二の問題に触れる前に何故券種として3連単が選ばれたかです。点数の扱い易さから言えば購入点数が6分の1になる3連複でも良かったわけですし、極論すれば単勝でも構わなかった訳です。この点については私は馬券の非効率性にあると考えています。これも面白いので別記事に仕立てる予定です。

少し旧聞に属しますが、2009年10月9日の新聞各紙の社会面(特に朝日新聞では紙面の半分くらい使用)によれば、英国人が社長を務めるデータ分析会社が、独自に開発した競馬予想プログラムで得た競馬の配当金を3年で160億円隠していたとして脱税容疑で査察されたとの事。事実とすれば非常な驚きです。脱税は許しがたい行為ですが、この事件の特異な事は、直接の被害者が出ていない事です。競馬商材、インチキ競馬ソフトのマルチ等は詐欺であり多数の直接的被害者いる事件とは趣を異にしています。何れにしましても、脱法行為と言う負の側面はありますが、今は削除されているデータ分析会社のHPを読んだ限りに於いては、その方法論を考察する価値は有りそうです。
一般に日本では高度な数学的アプローチによるギャンブルの必勝法は邪道と見なされているようです。しかし欧米では、一つはブックメーカーの存在があるのと、馬券市場を金融市場のミニ版として研究対象とされているようです。従って、競馬必勝法の研究は大学レベルでも数多く行われ、論文も数多く発表されています。中でも、D,B Hausch(行動経済学の世界的権威)監修の”EFFICIENCY OF RACETRACK BETTING MARKETS 2008 Edition”には主に1970年代から最近までの競馬必勝理論がこれでもかと言う数で収録されています。件のデータ分析会社はHPのレベルからすれば、この本の論文には精通している筈です。因みに出版社であるWorld Scintific社は多くのノーベル賞受賞者が論文を寄せています。最近の例ではノーベル物理学賞の南部先生、化学賞の下村先生などですが、この出版社の凄いところはノーベル賞受賞の遥か前に論文が掲載されている事です。
本書の中の論文で注目されるのは”SEARCHING FOR POSITIVE RETURNS AT THE TRACK: A MULTINOMIAL LOGIT MODEL FOR HANDICAPPING HORSE RACES”の中で用いられている一般化線形モデルの一つである多項ロジットモデルは面白そうです。そして、そのモデルの改良版として発表された”STIL SEARCHING FOR POSITIVE RETURNS AT THE TRACK:EMPIRICAL RESULTS FROM 2,000 HONG KONG RACES”では20%以上の超過利益が期待できるとされています。件のデータ分析会社の本社は香港に存在するとされていますので、まずこの論文を読んでいる可能性は非常に高いと思われます。
今後、私の数量化理論と重ね合わせ、日本の実際のレースで検証してみたいと思います。最後にオッズ解析によりオッズの歪みを見つけ出そうとするオッズ解析は多分間違いです。最後の論文で a 20-variable pure fundamental multinomial logit modelと表現しているのは各馬の真の能力(勝率)を求める事を要請していますので株価のチャート分析のようにオッズの時系列の特異点解析ではないようです。また、論文のどこだかわすれましたが、小数サンプルのアノマリーにも触れられており、熟読する価値は有りそうです。
最近のコメント