操作関連

JRA-VAN提供データのデータベースへの取込

JRA-VANは1986年辺りからのデータを提供してます。ただ、種類にもよりますが、全てのデータが提供されていた訳でもないです。自分が把握しているのは出走別着度数データは2004年から提供されている感じです。坂路調教データは2003年、ウッドチップ調教データは2021年7月等々。フルセットアップすると一応1986年1月1日から現在までを取り込む様になってます。大体3時間程掛かります。データベースファイルサイズは13GB少し超えます。現時点では票数とかの表示もしてませんので、不要と判断すればフルセットアップ時間も短縮されますし、ファイルサイズも抑えられます。[データベース]-[中央競馬]を選ぶとダイアログボックス開きますので、「設定」タブに行くと

ここの票数1と票数6のチェックを外す事で対象外に出来ます。参考までに2024/2/24に票数外してフルセットアップ試してみましたが1時間弱で済みました。データベースファイルも1.6GB程少ないものになってました。アプリをインストールして使い始める時には「セットアップ」タブから「開始」ボタンを押してください。

フルセットアップ開始時に「はい」を押すと上記の様に1986年からのデータをセットアップしますが、セットアップ方法の選択肢として、そんなに昔のデータは使わないと判断するなら希望の日付からのセットアップも可能です。例えば、2010年以降で足りると判断したのなら「設定」タブの"RACE"の所を2010/01/01 00:00:00にしておいてセットアップ開始時に「いいえ」を押して頂ければOKです。

開催に向けての準備

各開催前には(通常金曜日に土曜日と日曜日の重賞レースデータが11:30辺りが目安、日曜日のレースデータは土曜日の11:30辺り)開催に向けてJRA-VANから新しいデータが提供されます。提供スケジュール等はJRA-VANサイトでご確認下さい。開催明けに成績データも提供されたりしますが、まめに取り込んでも開催前に前開催分の成績データを含めてでも特に問題ありませんので「更新」タグで「開始」ボタンを押してください。更新作業はインデックスの張り直し等を含めても3分程度完了します。

レース予想

メニューより[ファイル(F)]→[レース(R)]と選択すると開催日選択が可能になります。

ここで左のツリーより希望の日付をクリックすると

該当する開催日のレース一覧が表示されます。この画像では既にWIN5対象レースがレース番号の背景が変えられてたり、場名が赤色になっているレースは投票済みなのを表します。場名が緑色なのは買い目入力されているけどまだ未投票なレースです。的中していると該当レースの場名の背景色が変わります。下のステータスバーの「WIN5」が赤いのも投票済みだからです。こちらも場名同様買い目入力されて未投票だと緑です。
カラムタイトルの「発走」部分をクリックすると発送時刻でソートされます。ただ、その後に速報取得したりすると一覧が再表示され、ソートが元の場毎に戻り、そこで更に「発走」クリックするとソートが逆ソートになるのでもう一度クリックして通常のソートに戻す必要があったりします。

ステーターバーの左の「標準」(上記画像では「簡易」ですが、Version 1.1.0で「簡易」を廃止し「標準」に変更)はレース詳細表示の際のモードを示します。クリックすると「詳細」→「標準」→「詳細」な感じにサイクリックに変わります。標準モードは

こんな感じに表示されます。詳細モードでは

こんな感じで表示されます。ここでは同じ大きさに見えますが、実際には簡易モードならフルHDモニターでも表示出来ますが、詳細モードはフルHDモニターではスクロールバーが出ます。

これは詳細モードでの過去走表示。

評価はこんな感じ。「グラフ」タブでは

こんな感じでタイム型データマイニングをグラフにして表示。更に

こんな感じで対戦型データマイニングの表示をしてます。ただ、これ見ても分かると思いますが、馬名が全て表示されてないのはLiveCharts2の仕様で原因不明ですorz

詳細モードでは馬名、騎手名、調教師名の背景色が変えたものがあるのはその時点での評価的なものです。赤っぽいのは得意、グレーは苦手、クリームは初っていうかここは過去未経験的なもの(騎手・調教師は年でリセットしてたり)。

詳細モードでは、まあ、こんなの処理したりしてるので当然ながら表示が遅いです。この辺りはニーズに合わせてモードを切替えて頂ければと思います。

標準モードでも詳細モードでも馬番クリックすると

こんな感じの調教データが表示されます。該当レースまでの坂路とウッドチップと出走レースを時系列で表示しますのでデビューから長い馬の場合若干表示に時間が掛かります。これ以外にも、クリックするとデータ詳細見れたりします。ツールチップも表示されたりします。

ユーザー印入力及び買い目入力からの投票

簡易モードでも詳細モードでもユーザー印の入力が可能です。印を入力する馬の印欄でマウスを右クリックすると印を選択するコンテキストメニューが出ますので選択するだけです。

特に制限とか儲けてないので同じ印を何個でも入力可能です。ただ、◎○▲△を各1個にしておかないと買い目入力時に多分バグる。×と注は何個でも買い目入力に影響しません。
標準モードではM1、M2、M3、M4、マイニング、走破予測、順位予測のカラムヘッダーをクリックするとクリックした予想が印として反映されます。既に印が入力された状態でこの操作を行うと印に変更が反映されるので注意して下さい。
印入力した後フッターにある「買い目」ボタンを押すと買い目入力画面が表示されます。上の「買い目」が赤字なのは投票済みを表します。緑だと買い目入力されているけど未投票。

印に該当する馬券のオッズを表示して買いたい馬券にチェックを入れて「追加」ボタンを押すと右側に追加されます。ボックスや流しでの買い目入力はサポートしてません。本来1日の投票可能数の節約とかで必要なのかもですがあまり多点買いしないのでサポート対象外としてます。三連複と三連単は印以外も買いたい時もあるかもって事で任意の目の追加も可能にしてます。
「投票」・「削除」ボタンどちらも買い目リストの左のチェックボックスに何もチェックを入れない状態ではリスト内全てなのか確認して投票又は削除されます。チェックボックスにチェックを入れた状態ではチェック済みな買い目に対して投票又は削除が行われます。
買い目入力画面でマウスの後退ボタンで閉じます。

レース詳細画面でマウスの前進・後退ボタンまたはキーボードのPageUp・PageDownキーで表示レースの移動が可能です。この際、移動は開催日のレース一覧の順番です。場別に表示されていれば場毎1R~12R、発送時刻でソートされていれば発送時刻順移動します。
マウス・キーボードどちらも連続で入力すると入力がバッファリングされて入力されただけ移動しますので、単発での入力(1回入力したら表示が完了するまでは入力しない)がお勧め。

どちらのモードでも開催日のレース一覧から出馬表表示を何度か繰り返すとエラーで表示されなくなる事(エラーが特に表示もされずに1頭目の途中で表示が止まる現象)がありますが、その場合は一度アプリを終了してから起動しなおすと改善されます。原因はWindowsフォームのガーベッジコレクションな気がしてますが、自分の知識不足でのコーディングミスなのか不足なのか、まあ、バグな気はします。

分析:クラス・競馬場・レース

実は競馬に関する分析とか専門的に研究とかした訳ではないので単純な走破タイムの平均の話です。フルセットアップとかの数時間掛かるとかではないですが、お使いのマシンパワーで左右されますが、どっこいしょって感じで処理されます。別に気にしないのであれば現時点で機械学習には影響してません。利用した時期もありましたがもう一つな感じでいったん断念。ただ、レース詳細の「評価」タグで表示しているのは該当馬の過去レースでの

  • レース基準タイム÷走破タイム×100
  • クラス基準タイム÷走破タイム×100
  • クラス基準タイム÷レース基準タイム×100
です。何かの目安になるかなぁ程度で表示してます。レース内でのその馬の評価、クラス的にみたその馬の評価、そのレースの評価がちょっと示されるかなぁって思ってみただけです。

で、その為に[分析(A)]に[クラス(C)...]、[競馬場(J)...]、[レース(R)...]があり、指定した期間分析して保存すると「評価」タグで表示されます。なので、必要であればクラスと競馬場は1986年~直前まで適度に行えば目安になると思います。レースは過去レースもある程度表示したいのであればその必要な年~直前まで。レースは一度過去の分析しておけば、以後は前回分析以後行われたレースについて行えば良いです。レースは特に表示に時間が掛かる為、分析済みレースの表示をするか確認ありますので、単に「いいえ」で表示せずに新たな分析して保存で良いと思います。([分析]-[レース]とすると「表示に滅茶苦茶時間掛かります」的に確認されますが、実際には滅茶苦茶と言っても1分まで掛かりませんので特に気にならないのなら表示しても問題ないです)

分析:標準偏差

Version 1.4.0で追加しました。こちらは上記の分析に比べたら滅茶苦茶時間が掛かります。こちらの環境で1986年~直前とかは1時間程度掛かります。ただ、これは1回だけ行い、後は前回分析以降のレースのみ行って保存しておけば、毎週前週分のみだったらそんなに負担にはならないです。この分析データはどの様に利用するか今後の課題です。このデータから今後行われるレースの標準偏差を基にレースの荒れ具合なんかを表示したいかなぁと思案中。

学習モデル比較

Version 1.6.2ではAutoMLとModel Builderの学習モデルを添付してますのでちょっと選択のヒント的に比較してみます。対象は2024.7.1~2024.9.8です。 75R ShinbaTimeCK.zip ...