今回もアナログ予想です。
WEKAはもっとデータを揃えてから、改めて試行しようかなと思う。
基本データは5回区切り本数字のみ。
まず大雑把な区分で直近4回より2個、直近4回で未出現から3個出ると予測。
今回もおそらく20個ほどで直近5回が完結すると思われるからだ。
問題は次の段階、どうやって最後まで取りこぼしなく残すか?
A
1 3 4 5 7
13 14 17 18
20 22 25 26
27 28 29 31
B
2 6 8 9 10
11 12 15 16 19
21 23 24 30
大雑把な番台別構成をまず考えてみる。久しぶりにWEKAで予測してみた。
その結果は 0-1-1-2-2 これは第一枠が0番台、2枠が10番台という意味である。
一応これをベースとし、変化をつけてみる。第一~第三の組み合わせと第四、第五の二つに分けて考えてみる。もっとも有りそうなのは・・
0-1-1
0-0-1
1-1-2
第四、第五は・・
1-2
2-2
次は肝心の数字選びとなる。今回の予測にあたってwekaの予測データを過去20回ほどにわたり整理してみた。もちろんデータの与え方と予測スキームは統一した。
WEKAでの過去検証はデータが2種類、スキームも2種類あわせて4パターン用意し、当選数字と照らしてみた。
それを基にアナログ予想をブレンドし絞り込んでいく作戦となる。
1点予想:6 11 14 23 26
今回は深く沈んでいる6を選択、あと気になる数字は25と28である。それと2。
予算上たくさんは買えないので様子見となる。
3 7 13 16 25 (31)
Aから4個、Bから1個となった。すでにこの時点で負け確定・・
どうも数字選びにセンスがない。また次回の挑戦に期待。
2 コメント:
匿名ですいません。
Wekaを調べてて、こちらに迷い込み?ました。
興味のそそられるテーマに取り組まれていますね。
私もニューラルネットワーク&遺伝的アルゴリズムによる種々の予測をソフト化することを楽しんでいます。
ロト6に関しては、最近、あの!!Microsoft!!のBIチームのBlogに、SQLサーバーを駆使したロト6予測について書かれています。
http://mskkbi.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&_c=BlogPart&partqs=amonth%3d9%26ayear%3d2007
書き出しに、ロト6のデータの 2 つの特性の問題点が書かれています。
1 つは、ロト6のデータは連続属性データではないこと。
もう 1 つは、ロト6データの公開の仕方に問題がある。本数字 1 ~ 6 は、この順番で抽選されたものじゃないことにあります。抽選された数字を小さい順から並べている。
だそうです。
要するに、時系列的要素が無いデータということ。
確かに、どのセット球を使い、出現した順番の数字が判れば、数字の予測は可能な気がしますね。
であれば、数字では無く、○や×といった記号として、過去データからニューラルネットワーク&遺伝的アルゴリズムで、パターン認識からの予測なら好い線いくかも・・・
良い結果を期待しています。
がんばって下さい。
匿名さん、こんにちは。
コメントありがとうございます。お返事遅くなってすみません。
ご指摘の記事読みました。興味深いですね。
「Time Series をはじめとする回帰分析は、連続するデータの推移を予測するものですから、この時点で使えません。」
この部分、正解ですね。確かに私の勘違いです。ロト6の当選数字はボールを識別するための、単なるIDです。ですからそれ自体を連続数値、つまりnumericとして分析することは間違いですね。やはり指摘されてるようにnorminal、名義属性として分析するのが正解。
毎回独り言のように更新してるわけですが、機会がありましたらまた遊びに来てください。
ご意見ありがとうございました。
コメントを投稿