【0】 目次
null

 実は、競馬に限らずほぼこの手順で万能である。競馬の場合は当てるだけではなく、当たる確率とオッズとの関係を制御するのが一番つらい。つまり当てるだけなら1番人気を買えばよいが、それでは儲からない、という問題である。

1.データ収集編
2.データ加工編
3.解析編(モデルを作る)
4.解析編(予想する)
5.運用編
6.改善編

※ 画像も欲しいので、ペイントでチャッチャと作ってみました。他のツールが使えない?!

【1】 データ収集編
 これも例外がなく、基本データが多い方が良い。新鮮な方が良い。システムは知り合いの社長が作ってくれている。聞いているところでは次のデータを使っているようです。
・2013年【5月27日】 馬王
・リアルタイムという観点では、Yahoo等の競馬サイトの直前の馬体重を取り込んでいるようである
・自分で決めている世界唯一の指標も取り入れているようである

【2】 データ加工編
 解析では、スコアリングエンジン(bodais)を使うので、データを数字に置き換える必要がある。
・リアルタイムに解析できる、多重共線性の考慮、カテゴリー統合
もやってくれるので、システム連携して解析をするのには非常に便利である。
 他もたくさんやることがあり、
・外れ値の削除(例:頭数が4頭のレースは、1年に1度あるかどうか、等々)
・解析変数用に変更(例:生年月日から年齢を導く、等々)
など、新変数を作ったりする。

【3】 解析編(モデルを作る)
 ここでもいろいろテクニックが必要である。当然に、1つのモデルですべてを語れれば良いが、物事は簡単ではない。時期が古くなれば予測精度が落ちると思うのが当然である。また、1つのモデルでは、過学習の問題も大きい。
・レースの種類別、時期別で複数のモデルを作っている。
 実は次項目で出てくる、アンサンブル学習という手段を使って、その時々、モデルの重要度を決めている。
※ こちらも参考にどうぞ。2018年【10月31日】 アンサンブル学習でAIトレード

【4】 解析編(予想する)
 どうやって重みを決めて、最終的な予想結果にするのか。
・作ったすべてのモデルで、直近のレースの全予想をして、予想結果が当たった分だけ重みをつける
 つまり、直近当てられれば当てられるほど、そのモデルの重みが高くなる。しかも、出来る限りレース直前のデータすべてを取り込むため、解析は全自動になっている。スコアリングエンジン(bodais)の真骨頂である。

【5】 運用編
 実は、競馬はここが一番難しい。いくつもの観点をクリアーする必要がある。
5.1.購入対象決定
 単勝から3連単まで、いろいろなものがある。しかも当たりやすいのではく、儲かるものを探す必要がある。解析結果のデータから、探索を行う必要がある。
5.2.どれぐらい買うのか、どの割合買うのか
 これに答えてくれる数学がある。2013年【8月18日】 ケリー基準である。1種類の賭けにだけ対応しているので、一般化した式を計算した。
 また、N頭の1着から3着の確率が出ている際に、馬連から3連単の確率を計算するための公式などを計算している。つまり、期待値を簡単に出せるようになっている。
5.3.自動購入
 どんなに素晴らしい計算も、実行手段がなくては使えない。システムをお願いしている社長に、リアルタイム購入の仕組みを構築してもらっている。

【6】 改善編
 アンサンブル学習も使っているので、予測は古くはならないが、運用上購入対象としていたものが、期間がたつと古くなり、期待値1を下回ってくる。つまり、同じパターンで購入しても、儲かる時期は永遠には続かない。
 競馬は、人間がドンドン購入パターンを変えてくるので、買い方も定期的に変える必要がある。

 実は、ここでは詳細は書けないが、
・AIで購入パターンを自動で見つけるアルゴリズムが出来た。
 競馬では、規模が小さいので株で応用できるようにしてある。早くアンサンブル学習エンジンをbodais上で公開して、株のトレードに本格参戦したい。


null

★ 菩提心 + ダイス(確率制御)→ ボダイス


★ 一読2クリック応援に感謝します null ←→null
★ アイズファクトリー (Twitter) アイズファクトリー (facebook)

null ◆◆ 注意書き ◆◆  ←必ずお読み下さい。

2014年【8月28日】 ●トランプ2組ゲーム「レットラー」の正しい遊び方
2021年【3月6日】 一木会、bodaisで外国人国際交流会
2021年【3月19日】 AIで競馬をする本気の解析手順 〜〜9年間トータル黒字を説明する〜〜
この記事についてつぶやく