競馬のタイム表記の最小値は日本では0.1秒、米国では0.2秒です。タイム理論的には0.1秒以下を論じる無意味であると考えられますが、実は、そうでは無いようです。左の棒グラフは前走における1着馬とのタイム差の影響を見たものです。+0.0はハナ差、アタマ差、クビ差で負けた場合を、-0.0はハナ差、アタマ差、クビ差で1着になった事をあらわしています。物理量的表現では等価である0.0秒差ですが、勝った(-マイナス)場合と負けた(+プラス)場合で大きく違います。私の現在の理解では騎手の心理に原因があるとしています。即ち、僅差(0.0.秒)での負けは騎手の悔しさを刺激していると考えています。ある程度以上差のある勝ち負けは馬の能力差として受け入れる事が出来るが、僅差の勝ち負けは騎手の技量の差であるとの認識が存在するのではと考えています。
ところで、競馬には着差データが存在しています。着差(競馬)-Wikipediaで詳しく解説されていますが、予想因子としても使えるのではと考えています。即ち、0.0秒差をさらに詳しく分析できるのではと。しかしながら、競馬データに盲点が有りました。着差の定義は”前馬”との着差であるとされています。従って、1着になった馬には着差データは同着(降着はあるか不明)以外は有りません。でも良く考えて見ると1着馬に着差データが存在しても良いのではないかと、1着馬の着差は2着馬に着けた着差、2着馬の着差データをコピーすれば良い事になるでは無いか。そんな事で実際にプログラム組んで始めました。ロジック的には簡単ですが実装すると時間がかなり掛かります。
最後まで実装できたかと思い、今週の馬の過去走を参照したら、1着馬の着差データが殆ど歯抜け状態、考えて見たら今週のデータのみからは過去走の1着馬の着差は構築できませんね。数量化用のデータは先ずフルセットアップから入ります。馬毎データでは140万レーコード以上有りますが、この中から2000年以後に実走データのある馬コードを引き抜きます。大体4万数千頭になります。この中で一番古いものは1994年あたりが初出走になりますが、実際に数量化に利用するのは2004年以後のデータです。今週の馬の過去走1着着差を完全に近づけるには4万数千頭の2着データを保持する必要が有る訳ですね。。。。




最近のコメント