まずは使用データの説明から
今回は過去3回の履歴を使用。新しい試みとして、その1で予測しておいたセット球予測と10分割ゾーン予測データを付加した。
使用スキームは左の列がマルチレイヤー、右側はSVMregとした。
4.549 5.15
5.535 6.298
12.955 12.97
22.512 21.035
26.354 25.45
比較のため今までのやり方での数値も記しておく。
使用データは過去3回の履歴のみ。
4.208 4.33
6.561 6.332
12.724 12.666
17.997 18.337
23.058 22.999
とりあえず計算結果を見てみると明らかに違いが解る。
新たに付加したデータが確実に影響を与えているのが確認できる。あとは、どう判断すればいいのか?だ。
もうひとつ検証のためにデータを追加しよう。それはセット球予測と10分割でのゾーン予測だ。
その1では過去40回という非常に長いスパンでWEKAにデータを与えた。今回は超短期予測で両予測を行い、その結果を先の過去3回の履歴データに付加して予測することとする。
1、準備段階・・過去3回のデータでセット球および10分割ゾーン予測を行う。
2、準備段階で計算した結果を従来の枠別数値予測法(従来のやり方)に付加し、新たに予測を行う。
使用スキームは左側がマルチ、右側はセットのみSMO、ゾーンについてはSVMregとした。
セット球 C C
1.946 1.526
2.282 1.602
4.623 4.883
6.28 5.715
7.977 8.046
つぎに上のデータを付加して新たに予測した数値を下に記しておく。
まず過去3回のセットと10分割ゾーンデータをマルチで計算したデータを付加し、再度マルチで計算した場合。
4.391 7.273 12.332 17.48 21.344
つぎは同じデータでスキームをSVMregにしてみよう。
4.509 7.202 12.43 17.484 21.643
今度はSVMregでのデータをマルチとSVMregで計算してみる。
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上がマルチで下がSVMregである。
ここらでちょっと整理してみたい。
従来の方法・・目的変数は5個。全部の数字を一度で予測する。説明変数は過去の当選数字のみで、枠別に直列に配置したデータを使用。
今回試した方法・・・上と同じく目的変数は5個。ただし説明変数としてあらかじめ予測しておいたセットおよびゾーンの数値を予測回に並列に配置したデータを使用。
準備段階で使用するスキームと最終予測で使用するスキームを変えることができる。
さて肝心の予測であるけど、感触としては直近のデータのみを使用した後者の方が経験上、正解に近い気がする。
よって今回は準備予測データとしては過去3回のセットおよびゾーンデータを採用する。
4.391 7.273 12.332 17.48 21.344
4.509 7.202 12.43 17.484 21.643
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上記の数値を見比べるとおぼろげに今回の予測数字が見えてくる。
3 4 5 6 7 12 13 16 17 21 22 が候補となるが、このままでは再現性もないし結局は勘の勝負となってしまう。どうしたものか?
今回は自分なりにルールを決めてそれに従うという方法を取ってみたい。そうでもしなければ検証できないし前進できないような気がする。
ルール・・すべての数値を四捨五入し、複数かぶった数字を有力候補とする。
4 6 7 12 17 21 22
ルール2・・同数の場合は従来の方法で出した数値を加味して数字を絞ること。
したがって今回は・・・
4 7 12 17 22 とします。
0 コメント:
コメントを投稿