2008年9月10日水曜日

第411回ロト6予測

作業手順

1、全回分のデータ(ゾーンデータ、セット含む)をCSVからARFFファイルに変換
2、変換されたファイルのnumericとなっている項目をすべてnorminalに変換する。
3、最終的にARFFそしてnorminalとなった全回分データを用いて、まずルールを出す。
4、つぎに各枠別に「もっとも目的変数の予測に寄与している属性は何か?」言い換えれば一番相関のある属性は?ということで計算させる。
5、最後に枠別にもっとも寄与する説明変数だけを使用したデータにおいて推測する。

上においては全回分となっているが何故かPCの容量不足で止まってしまった。なので直近10回分のデータを用いた予測数値を以下に記録する。(どれくらいのデータ量が最適か?については試行を重ねないと解らない)

使用スキームはマルチレイヤー

3 18 20 23 24 33 

ちなみに過去2回当選数字のみ(マルチレイヤー)での予測は・・・

8 13 20 27 28 33 

select attribute をせずに全回分データで予測した結果

J-48 1 13 17 30 33 43 
SMO 1 11 17 26 35 43 

全回分データでのゾーン予測

J-48 第一 Aかつa 1 2 3 4
第二 B  c  9 10 11 12
   第三 C e  15 16 
   第四 D g  25 26 27 28
   第五 E i  33 34 35 
   第六 F k  41 42 43

Best rules found:

1. zone11-1=a 182 ==> zone7-1=A 182 conf:(1)
2. zone11-6=k 141 ==> zone7-6=F 141 conf:(1)
3. zone11-6=j 141 ==> zone7-6=F 141 conf:(1)
4. zone7-5=F 131 ==> zone7-6=F 131 conf:(1)
5. zone7-6=F zone11-1=a 122 ==> zone7-1=A 122 conf:(1)
6. zone7-2=A 97 ==> zone7-1=A 97 conf:(1)
7. zone11-2=c 92 ==> zone7-2=B 92 conf:(1)
8. zone11-3=e 91 ==> zone7-3=C 91 conf:(1)
9. zone11-2=b 88 ==> zone7-1=A 88 conf:(1)
10. zone11-4=g 88 ==> zone7-4=D 88 conf:(1)

過去3回当選数字のみでの予測値
 
マルチ 7 16 19 24 35 37 
SMO   7 15 19 25 35 37         

第一枠がAの場合だった抽選回のみを抽出、仮に次回が第一がA、第六がFだとしてマルチで予測した結果は・・
ACDDFF
同じく第一枠がaの場合だった抽選回のみを抽出、仮に次回が第一がaだと仮定してマルチで予測してみた。
abbdjj

とりあえず撤退はないので今回は以下の数字で・・

5 13 20 24 35 41

結果と追記

2 4 6 24 35 39 B-34 24と35は過去3回当選数字のみでの予測値(マルチ)で一致したが、第一、第二、第三ともまるで見当違いとなった。第六についても予想外です。
今まで高精度だった過去2回当選数字のみでの予測値(マルチ)は全滅・・アルゴリズムは不変なので好不調の原因はデータそのもにあるのだろう。過去出目のパターンによってinstanseを変えるべきなのかも?

0 コメント: