過去2回の履歴をSVMで計算。
過去3回の11分割データから同じくSVMで予測。そして過去2回のゾーンデータに予測したゾーン数値を付加し、なおかつ過去2回の当選データといっしょにSVMで予測した。
結果としてなぜか過去2回の当選データだけで予測した数値とまったく同じとなった。
12 19 21 29 34 35
ただし第六だけは意図的に 36 から 35 とした。
やっぱり計算どおりの 36 のままで。
追記 結果
6 13 17 27 28 36 B-33
んー・・ 36 のみ正解という結果。珍しく第六が正解したけどこの兆候は今までのやり方では見られなかった。前向きにとらえれば、このやり方には一定の評価を与えてもいいかも?
第二、第三、第四は過去2回のデータで予測、第五、第六はゾーンデータを付加したデータで予測する、というような変則パターンで次回もやってみようか?
ざっと振り返ってみると、一番難しいと感じるのは第一数字。
何回前に出た数字か?というようなデータを見てみると一番荒れてると感じるのが第一なわけで。
どうしたものか?
2008年8月28日木曜日
2008年8月27日水曜日
第409回ロト6予測
今回の試みは・・・
各枠で何回前に出た数字が当選したか?
これをキーワードにデータを作成、WEKAで予測してみる。ちなみに今回作成したデータは過去3回の履歴を対象にしている。
シュミレーションの結果は 13 5 5 7 4 12 ・・・
おっと大事な事っていうか基本的なことを忘れていた。それは元になったデータが枠を意識したものではないということ。だから候補となる数字はもっと増える。困った・・・
ついでだが直近2回のデータでも「何回前に出た数字か?」を予測してみた。
17 3 4 6 2 16
例によって過去2回のデータで予測した数値も記録しておく。
12 19 21 29 34 36
またまた何の根拠もないが、大雑把な推測だけれど予測回も同じような傾向だとすれば上記のような出方をするのではないか?
過去2回の結果をもとに実際の数値を書き出してみよう。矢印の右側が枠別にふさわしいだろうという数字だ。
10 15 18 30 31 37 → 10 15
1 2 4 16 36 37 → 16
6 13 19 20 30 31 → 19 20 30
8 10 13 20 24 33 → 24 33
11 18 19 30 37 39 → 30 37
7 18 27 37 38 43 → 37 38 43
ちょっとおかしな事になってるが・・どうしたものか?
12 19 21 29 34 36 がピンポイント予測だが、なぜか上で選んだ数字と似てる気がしないでもない。
というわけでまとまらんね。
各枠で何回前に出た数字が当選したか?
これをキーワードにデータを作成、WEKAで予測してみる。ちなみに今回作成したデータは過去3回の履歴を対象にしている。
シュミレーションの結果は 13 5 5 7 4 12 ・・・
おっと大事な事っていうか基本的なことを忘れていた。それは元になったデータが枠を意識したものではないということ。だから候補となる数字はもっと増える。困った・・・
ついでだが直近2回のデータでも「何回前に出た数字か?」を予測してみた。
17 3 4 6 2 16
例によって過去2回のデータで予測した数値も記録しておく。
12 19 21 29 34 36
またまた何の根拠もないが、大雑把な推測だけれど予測回も同じような傾向だとすれば上記のような出方をするのではないか?
過去2回の結果をもとに実際の数値を書き出してみよう。矢印の右側が枠別にふさわしいだろうという数字だ。
10 15 18 30 31 37 → 10 15
1 2 4 16 36 37 → 16
6 13 19 20 30 31 → 19 20 30
8 10 13 20 24 33 → 24 33
11 18 19 30 37 39 → 30 37
7 18 27 37 38 43 → 37 38 43
ちょっとおかしな事になってるが・・どうしたものか?
12 19 21 29 34 36 がピンポイント予測だが、なぜか上で選んだ数字と似てる気がしないでもない。
というわけでまとまらんね。
2008年8月23日土曜日
第472回ミニロト予測
使用データは過去2回の履歴のみ。
今回も2パターンで予測した。
ゾーンデータを付加した値も、過去出目だけで予測した値とそれほど変わらなかった。
と言っても方法は枠別ではなく、一括して予測する方法ではあるが。
端数を恣意的に処理した数値を以下に記録する。
12 16 21 27 31 予備として第五と第六にそれぞれ 26 と 30 を挙げておく。
今回はシンプルに以上。
結果は 4 15 17 20 21 B-3
上手く機能してないね。どうもロト6とミニロトは同じ考え方では予測できないような気がする。
何か違う。一応、一致している数字もあるんだけどねぇ。
今回も2パターンで予測した。
ゾーンデータを付加した値も、過去出目だけで予測した値とそれほど変わらなかった。
と言っても方法は枠別ではなく、一括して予測する方法ではあるが。
端数を恣意的に処理した数値を以下に記録する。
12 16 21 27 31 予備として第五と第六にそれぞれ 26 と 30 を挙げておく。
今回はシンプルに以上。
結果は 4 15 17 20 21 B-3
上手く機能してないね。どうもロト6とミニロトは同じ考え方では予測できないような気がする。
何か違う。一応、一致している数字もあるんだけどねぇ。
2008年8月20日水曜日
第408回ロト6予測その2
今回のミニロト(471回)の結果を踏まえて再考してみることにする。
ロト6予測においても、おそらくゾーンデータを付加する方法は失敗に終わるだろう。そこでまず従来の方法によって候補をリストアップしてみる。使用データは過去3回の履歴である。
5 10 14 21 34 35
6 11 14 22 34 36
つぎに念のため過去2回データで同じように候補を出してみよう。
6 10 12 23 37 38
6 10 12 23 37 38
数値は微妙に違うがフォームは良く似ている。
予測数値は足して2で割ったような感じである。というかそのものか?
今回の予測にあたり、過去記事を少し読み返してみた。
考えを整理したかったからであるが、まだまだ試行が足りないし、WEKAに対する理解もまったく不十分な現状では、自分の軌跡を確認できるのみである。
それでも少しは前進してるのか?
10 12 23 を仮に当選したものとして残りの数字を予測してみよう。条件は過去2回のデータで同じスキームとする。
結果はまったく同じとなった。当然か。
考えた結果、今回は枠別にそれぞれデータを用意して予測してみる。
肝心のデータだが過去履歴を使うのは同じ。内容は当選数字のみとする。
詳しい書き方やデータの与え方は非公開とする。
使用スキームは片っ端から使うこととする。意味がよくわからないので、結果をみてから考えるなり、調べてみるということで。
とりあえず試行結果より数字を出してみよう。
まず第一数字、 1 と 2 のふたつ。意外な数字だ。使用スキームは非公開。
第二は 12 第三は 19 第四= 14~17 と 19~22? 第五は 34 第六は 39 かな。
データの与え方はいつもと違って枠別に予測をしたわけだけど、結果的に従来とよく似た数字が選ばれるケースが多くあった。そもそも与えるデータ自体はまったく同じなわけだから当然といえるだろう。
それにしても予測に使うスキーム、アルゴリズムでかなり予測数値は変わる。
現状やってることの意味は「過去の出来事が次の結果に影響を与えている」ということを前提にして回帰分析?を行っているわけだ。いや、ちょっと違うか?
時系列じゃなくて、条件だ。
つまり条件設定だ。「過去出目がこの数値の場合、この枠はこうだった・・」という考え方。
ちと安易な考えか?
またしても時間切れで 2 12 19 14 34 39 ということで・・
追記
12 20 23 28 31 32 B-39
まあ、正解がひとつでもあったということで少しほっとした。だが20番台で三つも出たことで、大ハズレという結果、そして相変わらず第五、第六はまったく読めてない。第一も・・・。
偶然にも過去2回のデータでの予測では1点予想で2個正解している。ボーナス数字はいつものように偶然だ。
んーいまだ決定打が見出せない状況。
あれ?あとで気が付いたのだけれど、その1予測で最初に出した数字の第五、第六が正解している。
偶然かもしれないが今までこれらの枠が正解したことはほんとに例が少ない、というか皆無かもしれない。
今回はキャリーしたことからも、予測は難しかったのか?それでもゾーン予測を付加したこの予測では見事にこの連番をはじきだしている。
もしかして有効打となり得るのか?
今回の整理
過去2回のデータでの予測・・・第三、第四が正解。
過去3回のデータで11分割ゾーン予測値を付加して予測・・・第五、第六が正解。
ロト6予測においても、おそらくゾーンデータを付加する方法は失敗に終わるだろう。そこでまず従来の方法によって候補をリストアップしてみる。使用データは過去3回の履歴である。
5 10 14 21 34 35
6 11 14 22 34 36
つぎに念のため過去2回データで同じように候補を出してみよう。
6 10 12 23 37 38
6 10 12 23 37 38
数値は微妙に違うがフォームは良く似ている。
予測数値は足して2で割ったような感じである。というかそのものか?
今回の予測にあたり、過去記事を少し読み返してみた。
考えを整理したかったからであるが、まだまだ試行が足りないし、WEKAに対する理解もまったく不十分な現状では、自分の軌跡を確認できるのみである。
それでも少しは前進してるのか?
10 12 23 を仮に当選したものとして残りの数字を予測してみよう。条件は過去2回のデータで同じスキームとする。
結果はまったく同じとなった。当然か。
考えた結果、今回は枠別にそれぞれデータを用意して予測してみる。
肝心のデータだが過去履歴を使うのは同じ。内容は当選数字のみとする。
詳しい書き方やデータの与え方は非公開とする。
使用スキームは片っ端から使うこととする。意味がよくわからないので、結果をみてから考えるなり、調べてみるということで。
とりあえず試行結果より数字を出してみよう。
まず第一数字、 1 と 2 のふたつ。意外な数字だ。使用スキームは非公開。
第二は 12 第三は 19 第四= 14~17 と 19~22? 第五は 34 第六は 39 かな。
データの与え方はいつもと違って枠別に予測をしたわけだけど、結果的に従来とよく似た数字が選ばれるケースが多くあった。そもそも与えるデータ自体はまったく同じなわけだから当然といえるだろう。
それにしても予測に使うスキーム、アルゴリズムでかなり予測数値は変わる。
現状やってることの意味は「過去の出来事が次の結果に影響を与えている」ということを前提にして回帰分析?を行っているわけだ。いや、ちょっと違うか?
時系列じゃなくて、条件だ。
つまり条件設定だ。「過去出目がこの数値の場合、この枠はこうだった・・」という考え方。
ちと安易な考えか?
またしても時間切れで 2 12 19 14 34 39 ということで・・
追記
12 20 23 28 31 32 B-39
まあ、正解がひとつでもあったということで少しほっとした。だが20番台で三つも出たことで、大ハズレという結果、そして相変わらず第五、第六はまったく読めてない。第一も・・・。
偶然にも過去2回のデータでの予測では1点予想で2個正解している。ボーナス数字はいつものように偶然だ。
んーいまだ決定打が見出せない状況。
あれ?あとで気が付いたのだけれど、その1予測で最初に出した数字の第五、第六が正解している。
偶然かもしれないが今までこれらの枠が正解したことはほんとに例が少ない、というか皆無かもしれない。
今回はキャリーしたことからも、予測は難しかったのか?それでもゾーン予測を付加したこの予測では見事にこの連番をはじきだしている。
もしかして有効打となり得るのか?
今回の整理
過去2回のデータでの予測・・・第三、第四が正解。
過去3回のデータで11分割ゾーン予測値を付加して予測・・・第五、第六が正解。
2008年8月19日火曜日
第408回ロト6の予測その1
今回の予測方法は・・・
過去3回の11分割ゾーンデータから次回ゾーンを予測。
その結果を従来の予測データに付加し、予測するというもの。
使用スキームは上段がマルチ、下段がSVM。
4 9 15 18 31 32
5 10 15 19 31 32
以下は従来の方法での予測値。
使用スキームは上と同じである。
5 10 14 21 34 35
6 11 14 22 34 36
大きく違うのは第五、第六の数値。付加したゾーンの数値が影響を与えているのが確認できる。
とりあえず現段階では 4 9 15 18 31 32 を採用するつもり。
過去3回の11分割ゾーンデータから次回ゾーンを予測。
その結果を従来の予測データに付加し、予測するというもの。
使用スキームは上段がマルチ、下段がSVM。
4 9 15 18 31 32
5 10 15 19 31 32
以下は従来の方法での予測値。
使用スキームは上と同じである。
5 10 14 21 34 35
6 11 14 22 34 36
大きく違うのは第五、第六の数値。付加したゾーンの数値が影響を与えているのが確認できる。
とりあえず現段階では 4 9 15 18 31 32 を採用するつもり。
第471回ミニロトの予測
予測方法
過去10回のセットと10分割そして5分割のデータを使用し、まずこれらを予測してみた。
そして計算結果を新たにいつものやり方に付加し、過去3回の履歴をもとに予測しなおす。
スキームはSVMregとマルチレイヤー。
とりあえず 7 9 14 (23 24) 26 という結果・・・
以下に比較のため過去2回の履歴だけで同じスキームによる予測を示す。
8 12 17 23 25 ←いつもの方法による予測値。
2.9 4.4 6.2 7.6 9.1 ← これは10分割でのゾーン予測値。過去10回分のデータをWEKAで計算したもの。
単純に係数 3.1 を掛けてみよう。
8.99 13.64 19.22 23.56 28.21
四捨五入すると・・・ 9 14 19 24 28
ついでに直近3回データで10分割ゾーンの予測をしてみた。
結果は・・
3 4 6 8 9
これは適当に端数を調整した数値だ。この結果から数字を拾うと以下のようになる。
7 8 9 10 11 12 16 17 18 22 23 24 25 26 27
あまり候補を出してもどれを重視すればいいのか?解らなくなる。
今回は最終的に以下の組み合わせで勝負です・・・。
予測方法は 10分割とピンポイント予測の合わせ技。
過去3回の履歴よりまずゾーンを予測、そのあとピンポイント予測においてゾーン予測値を付加し、いつものようにスキームを選び計算させた。
8 11 16 24 26
追記 結果と反省
13 17 20 23 30 B-28
やっぱりゾーンデータを付加する方法はあまり良くないね。
従来の方法での予測のほうが結果としては良い。何の根拠もないけれど、今までの経験値?から判断すると、まず直近2~3回の過去当選数字から予測させる。それを基に第一および第五あたりを再考するのがベストか?
過去10回のセットと10分割そして5分割のデータを使用し、まずこれらを予測してみた。
そして計算結果を新たにいつものやり方に付加し、過去3回の履歴をもとに予測しなおす。
スキームはSVMregとマルチレイヤー。
とりあえず 7 9 14 (23 24) 26 という結果・・・
以下に比較のため過去2回の履歴だけで同じスキームによる予測を示す。
8 12 17 23 25 ←いつもの方法による予測値。
2.9 4.4 6.2 7.6 9.1 ← これは10分割でのゾーン予測値。過去10回分のデータをWEKAで計算したもの。
単純に係数 3.1 を掛けてみよう。
8.99 13.64 19.22 23.56 28.21
四捨五入すると・・・ 9 14 19 24 28
ついでに直近3回データで10分割ゾーンの予測をしてみた。
結果は・・
3 4 6 8 9
これは適当に端数を調整した数値だ。この結果から数字を拾うと以下のようになる。
7 8 9 10 11 12 16 17 18 22 23 24 25 26 27
あまり候補を出してもどれを重視すればいいのか?解らなくなる。
今回は最終的に以下の組み合わせで勝負です・・・。
予測方法は 10分割とピンポイント予測の合わせ技。
過去3回の履歴よりまずゾーンを予測、そのあとピンポイント予測においてゾーン予測値を付加し、いつものようにスキームを選び計算させた。
8 11 16 24 26
追記 結果と反省
13 17 20 23 30 B-28
やっぱりゾーンデータを付加する方法はあまり良くないね。
従来の方法での予測のほうが結果としては良い。何の根拠もないけれど、今までの経験値?から判断すると、まず直近2~3回の過去当選数字から予測させる。それを基に第一および第五あたりを再考するのがベストか?
2008年8月14日木曜日
第407回ロト6結果と検証
当選数字
11 18 19 30 37 39 B-38
買い目
3 8 12 18 31 36
というわけで正解は1個という結果に。
全体的には20番台抜けという大きな流れのまま今回のキャリーは終了した。
偶然かもしれないけど1つずれの数字が三つも出現した。前向きにとらえれば「いい線いってるかも?」ってな感じかね?
予測方法は過去3回履歴のみ使用でスキームはいつもと同じ。
0番台抜けというのは、今のやり方では絶対に予測結果としては出てこないパターンではある。
というのは、どうもいつも使っているスキームはリニアな予測をするようで、たまたま線形的な結果である場合は近い数値をだす。またその逆でノンリニア的結果の場合は大抵の場合、激ハズレとなる。
WEKAの各種スキームについては、まだほとんど無知といってもよいレベルなのでいい加減なことは言えないのだけれど、非線形的予測というのはあるのだろうか?
11 18 19 30 37 39 B-38
買い目
3 8 12 18 31 36
というわけで正解は1個という結果に。
全体的には20番台抜けという大きな流れのまま今回のキャリーは終了した。
偶然かもしれないけど1つずれの数字が三つも出現した。前向きにとらえれば「いい線いってるかも?」ってな感じかね?
予測方法は過去3回履歴のみ使用でスキームはいつもと同じ。
0番台抜けというのは、今のやり方では絶対に予測結果としては出てこないパターンではある。
というのは、どうもいつも使っているスキームはリニアな予測をするようで、たまたま線形的な結果である場合は近い数値をだす。またその逆でノンリニア的結果の場合は大抵の場合、激ハズレとなる。
WEKAの各種スキームについては、まだほとんど無知といってもよいレベルなのでいい加減なことは言えないのだけれど、非線形的予測というのはあるのだろうか?
第407回ロト6の予測
3 8 12 18 31 36
今回は単純に過去3回の履歴だけで予測する。
使用スキームはマルチとSVMregのみ。結果はどちらも良く似た数値で、適当に端数を処理した数値が上記6点である。
ここ最近は特徴的な出目となっていて、例えば20番台が無い、小さい数字と大きい方に2極化するなど。
そういうわけで予測も必然的にそういった流れに沿った数値となった模様。
どうもゾーンやセットというのは急ごしらえの方法では上手く機能しないようだ。
現状では「相関があるのが当然であろう」という考えに基づきデータ作成を引き続きしようかなという段階で。
ただゴチャマゼ状態のデータでスキームを上手く機能させる方法がよく解らないというのが正直なところではあるね。
今回は単純に過去3回の履歴だけで予測する。
使用スキームはマルチとSVMregのみ。結果はどちらも良く似た数値で、適当に端数を処理した数値が上記6点である。
ここ最近は特徴的な出目となっていて、例えば20番台が無い、小さい数字と大きい方に2極化するなど。
そういうわけで予測も必然的にそういった流れに沿った数値となった模様。
どうもゾーンやセットというのは急ごしらえの方法では上手く機能しないようだ。
現状では「相関があるのが当然であろう」という考えに基づきデータ作成を引き続きしようかなという段階で。
ただゴチャマゼ状態のデータでスキームを上手く機能させる方法がよく解らないというのが正直なところではあるね。
2008年8月13日水曜日
第470回ミニロトの結果と検証
11 15 22 30 31 B-14 という出目に対して
予測は・・・
4 7 12 17 22
結果は 22 のみ正解でサッパリだ。
やはりどこかやり方が間違っている。いや方法だけではないな。
ざっくり言えば今回の予測方法では当てることは不可能。奇跡的?に一つだけ合ってるけど、おそらくマグレでしょう。
今はゆっくり考える時間がないので与えたデータの中身や方法については後ほどまたアップすることにする。
予測は・・・
4 7 12 17 22
結果は 22 のみ正解でサッパリだ。
やはりどこかやり方が間違っている。いや方法だけではないな。
ざっくり言えば今回の予測方法では当てることは不可能。奇跡的?に一つだけ合ってるけど、おそらくマグレでしょう。
今はゆっくり考える時間がないので与えたデータの中身や方法については後ほどまたアップすることにする。
2008年8月11日月曜日
第470回ミニロト予測その2
まずは使用データの説明から
今回は過去3回の履歴を使用。新しい試みとして、その1で予測しておいたセット球予測と10分割ゾーン予測データを付加した。
使用スキームは左の列がマルチレイヤー、右側はSVMregとした。
4.549 5.15
5.535 6.298
12.955 12.97
22.512 21.035
26.354 25.45
比較のため今までのやり方での数値も記しておく。
使用データは過去3回の履歴のみ。
4.208 4.33
6.561 6.332
12.724 12.666
17.997 18.337
23.058 22.999
とりあえず計算結果を見てみると明らかに違いが解る。
新たに付加したデータが確実に影響を与えているのが確認できる。あとは、どう判断すればいいのか?だ。
もうひとつ検証のためにデータを追加しよう。それはセット球予測と10分割でのゾーン予測だ。
その1では過去40回という非常に長いスパンでWEKAにデータを与えた。今回は超短期予測で両予測を行い、その結果を先の過去3回の履歴データに付加して予測することとする。
1、準備段階・・過去3回のデータでセット球および10分割ゾーン予測を行う。
2、準備段階で計算した結果を従来の枠別数値予測法(従来のやり方)に付加し、新たに予測を行う。
使用スキームは左側がマルチ、右側はセットのみSMO、ゾーンについてはSVMregとした。
セット球 C C
1.946 1.526
2.282 1.602
4.623 4.883
6.28 5.715
7.977 8.046
つぎに上のデータを付加して新たに予測した数値を下に記しておく。
まず過去3回のセットと10分割ゾーンデータをマルチで計算したデータを付加し、再度マルチで計算した場合。
4.391 7.273 12.332 17.48 21.344
つぎは同じデータでスキームをSVMregにしてみよう。
4.509 7.202 12.43 17.484 21.643
今度はSVMregでのデータをマルチとSVMregで計算してみる。
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上がマルチで下がSVMregである。
ここらでちょっと整理してみたい。
従来の方法・・目的変数は5個。全部の数字を一度で予測する。説明変数は過去の当選数字のみで、枠別に直列に配置したデータを使用。
今回試した方法・・・上と同じく目的変数は5個。ただし説明変数としてあらかじめ予測しておいたセットおよびゾーンの数値を予測回に並列に配置したデータを使用。
準備段階で使用するスキームと最終予測で使用するスキームを変えることができる。
さて肝心の予測であるけど、感触としては直近のデータのみを使用した後者の方が経験上、正解に近い気がする。
よって今回は準備予測データとしては過去3回のセットおよびゾーンデータを採用する。
4.391 7.273 12.332 17.48 21.344
4.509 7.202 12.43 17.484 21.643
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上記の数値を見比べるとおぼろげに今回の予測数字が見えてくる。
3 4 5 6 7 12 13 16 17 21 22 が候補となるが、このままでは再現性もないし結局は勘の勝負となってしまう。どうしたものか?
今回は自分なりにルールを決めてそれに従うという方法を取ってみたい。そうでもしなければ検証できないし前進できないような気がする。
ルール・・すべての数値を四捨五入し、複数かぶった数字を有力候補とする。
4 6 7 12 17 21 22
ルール2・・同数の場合は従来の方法で出した数値を加味して数字を絞ること。
したがって今回は・・・
4 7 12 17 22 とします。
今回は過去3回の履歴を使用。新しい試みとして、その1で予測しておいたセット球予測と10分割ゾーン予測データを付加した。
使用スキームは左の列がマルチレイヤー、右側はSVMregとした。
4.549 5.15
5.535 6.298
12.955 12.97
22.512 21.035
26.354 25.45
比較のため今までのやり方での数値も記しておく。
使用データは過去3回の履歴のみ。
4.208 4.33
6.561 6.332
12.724 12.666
17.997 18.337
23.058 22.999
とりあえず計算結果を見てみると明らかに違いが解る。
新たに付加したデータが確実に影響を与えているのが確認できる。あとは、どう判断すればいいのか?だ。
もうひとつ検証のためにデータを追加しよう。それはセット球予測と10分割でのゾーン予測だ。
その1では過去40回という非常に長いスパンでWEKAにデータを与えた。今回は超短期予測で両予測を行い、その結果を先の過去3回の履歴データに付加して予測することとする。
1、準備段階・・過去3回のデータでセット球および10分割ゾーン予測を行う。
2、準備段階で計算した結果を従来の枠別数値予測法(従来のやり方)に付加し、新たに予測を行う。
使用スキームは左側がマルチ、右側はセットのみSMO、ゾーンについてはSVMregとした。
セット球 C C
1.946 1.526
2.282 1.602
4.623 4.883
6.28 5.715
7.977 8.046
つぎに上のデータを付加して新たに予測した数値を下に記しておく。
まず過去3回のセットと10分割ゾーンデータをマルチで計算したデータを付加し、再度マルチで計算した場合。
4.391 7.273 12.332 17.48 21.344
つぎは同じデータでスキームをSVMregにしてみよう。
4.509 7.202 12.43 17.484 21.643
今度はSVMregでのデータをマルチとSVMregで計算してみる。
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上がマルチで下がSVMregである。
ここらでちょっと整理してみたい。
従来の方法・・目的変数は5個。全部の数字を一度で予測する。説明変数は過去の当選数字のみで、枠別に直列に配置したデータを使用。
今回試した方法・・・上と同じく目的変数は5個。ただし説明変数としてあらかじめ予測しておいたセットおよびゾーンの数値を予測回に並列に配置したデータを使用。
準備段階で使用するスキームと最終予測で使用するスキームを変えることができる。
さて肝心の予測であるけど、感触としては直近のデータのみを使用した後者の方が経験上、正解に近い気がする。
よって今回は準備予測データとしては過去3回のセットおよびゾーンデータを採用する。
4.391 7.273 12.332 17.48 21.344
4.509 7.202 12.43 17.484 21.643
3.395 5.856 12.445 16.71 21.487
3.805 6.189 12.529 16.88 21.791
上記の数値を見比べるとおぼろげに今回の予測数字が見えてくる。
3 4 5 6 7 12 13 16 17 21 22 が候補となるが、このままでは再現性もないし結局は勘の勝負となってしまう。どうしたものか?
今回は自分なりにルールを決めてそれに従うという方法を取ってみたい。そうでもしなければ検証できないし前進できないような気がする。
ルール・・すべての数値を四捨五入し、複数かぶった数字を有力候補とする。
4 6 7 12 17 21 22
ルール2・・同数の場合は従来の方法で出した数値を加味して数字を絞ること。
したがって今回は・・・
4 7 12 17 22 とします。
2008年8月8日金曜日
第470回ミ二ロト予測 その1
今回の予測手順
1、使用データの仕様について
過去40回の過去履歴を使用。各数値は以下のとおり。
まず抽選に使われたセット球、 当選数字の10分割表での第一枠から第五枠までの出現ゾーン、同じく5分割表での第一枠から第五枠までの出現ゾーン、以上全部で11個の要素を各列の要素名とし、遡ること40回分の表をエクセルにて作成した。
以上で第一段階の準備完了。
2、スキームの使用状況。
WEKAでは目的変数の形式?(名義尺度とか量的尺度あるいは順序尺度など)によって使うことのできるスキームが制限される模様。したがってCLASS(目的変数のこと)を変えるたびにスキームを変える必要がある。
こういった事を避けるためかどうかはよく解らないが、目的のスキームを使用するために尺度の方を変換する方法もある。
今回はデータの尺度は初期設定のままとし、目的変数が数値の場合とABCのように名義の場合とでスキームを変える方法で予測してみることとした。
3、予測結果
今回は、初めて臨む予測方法であり、自信は全く無いが後々の検証のために、ありのままを記録しておく。
第470回使用セット球予測は B
5分割でのゾーン予測 A B C D E
10分割でのゾーン予測 1.106 4.232 5.828 7.691 9.608
セット球予測に使用したスキーム SMO
ゾーン予測5分割 SMO
ゾーン予測10分割 SVMreg
10分割でゾーン予測数値が妙なことになっているが、現状ではこのままとして解釈したい。
概観後記
今回の5分割でのゾーン予測は意味がない(笑)全部対象。。アホかいな。
10分割での小数点以下の数字は一応重み付けとして含みを持たせてみたい。
もしかしたら過去40回のデータ取りというのは適切ではないかも知れない。もっと短期が良いのかも?
ただ数値の尺度が名義の場合の予測法がよく解らない。(決定木あるいは樹木モデルというのか、そういうモデルで考えるのがいいのかな?)
因子というキーワードがあるが、これはおそらく説明変数のこと。当たり前じゃね?
WEKAではごった混ぜのデータから因子を探すこともできるようなのでもうチット勉強せなアカンね。
1、使用データの仕様について
過去40回の過去履歴を使用。各数値は以下のとおり。
まず抽選に使われたセット球、 当選数字の10分割表での第一枠から第五枠までの出現ゾーン、同じく5分割表での第一枠から第五枠までの出現ゾーン、以上全部で11個の要素を各列の要素名とし、遡ること40回分の表をエクセルにて作成した。
以上で第一段階の準備完了。
2、スキームの使用状況。
WEKAでは目的変数の形式?(名義尺度とか量的尺度あるいは順序尺度など)によって使うことのできるスキームが制限される模様。したがってCLASS(目的変数のこと)を変えるたびにスキームを変える必要がある。
こういった事を避けるためかどうかはよく解らないが、目的のスキームを使用するために尺度の方を変換する方法もある。
今回はデータの尺度は初期設定のままとし、目的変数が数値の場合とABCのように名義の場合とでスキームを変える方法で予測してみることとした。
3、予測結果
今回は、初めて臨む予測方法であり、自信は全く無いが後々の検証のために、ありのままを記録しておく。
第470回使用セット球予測は B
5分割でのゾーン予測 A B C D E
10分割でのゾーン予測 1.106 4.232 5.828 7.691 9.608
セット球予測に使用したスキーム SMO
ゾーン予測5分割 SMO
ゾーン予測10分割 SVMreg
10分割でゾーン予測数値が妙なことになっているが、現状ではこのままとして解釈したい。
概観後記
今回の5分割でのゾーン予測は意味がない(笑)全部対象。。アホかいな。
10分割での小数点以下の数字は一応重み付けとして含みを持たせてみたい。
もしかしたら過去40回のデータ取りというのは適切ではないかも知れない。もっと短期が良いのかも?
ただ数値の尺度が名義の場合の予測法がよく解らない。(決定木あるいは樹木モデルというのか、そういうモデルで考えるのがいいのかな?)
因子というキーワードがあるが、これはおそらく説明変数のこと。当たり前じゃね?
WEKAではごった混ぜのデータから因子を探すこともできるようなのでもうチット勉強せなアカンね。
第406回ロト6結果検証
抽選結果
1 2 4 16 36 37 ボーナス 40
買い目
4 11 16 19 28 37
というわけで 4 16 37 の三つが正解という結果に。
第一数字と第二数字の 1 2 はどうあがいても計算からは導き出せない結果となった。
また第五、第六で非常に近い数字が二つのスキームでの予測から出現したことも珍しいな。
5等に当選したことは素直にうれしい。
だが今回の当選には必然性というか再現性がない。通常の予測法であればおそらく1個か2個しか正解してないはず。
いちど予測した数字から、比較的近い数値を示すことの多い枠の数値を、再度WEKAに投入した今回の方法は再現性に乏しい。その場かぎりでなら使い道もあるかもしれないが。
皮肉にも再投入した数値は全くの激ハズレである。(笑)
ここ何回か同じような方法で予測してきたわけだが、客観的に見て全体を総括すると、どう判断されるだろうか?
まずWEKAに与えるデータについては、過去2回から3回の当選履歴を使用している。そして予測モデルにはMultiLayerPerceptron と SVMreg の二つを用いた。
結果は正解がゼロから3個まで。予測に用いた数字の総数は、1回の予測につき、およそ7個から8個ぐらいか?
客観的判断というのは自分では難しいが、かなりイケテル気がする。正解がゼロの時でも、実は隣数字であったりした事も多々あり、ハズレの内容を評価するとしたら「かなり惜しいハズレ」といえるものもあった。
まだまだ先は長いが、試さなければならない事はたくさんあるはず。何はともあれ今回の当たりで弾みをつけたい。ちなみに1点購入での当選は初めてである。
1 2 4 16 36 37 ボーナス 40
買い目
4 11 16 19 28 37
というわけで 4 16 37 の三つが正解という結果に。
第一数字と第二数字の 1 2 はどうあがいても計算からは導き出せない結果となった。
また第五、第六で非常に近い数字が二つのスキームでの予測から出現したことも珍しいな。
5等に当選したことは素直にうれしい。
だが今回の当選には必然性というか再現性がない。通常の予測法であればおそらく1個か2個しか正解してないはず。
いちど予測した数字から、比較的近い数値を示すことの多い枠の数値を、再度WEKAに投入した今回の方法は再現性に乏しい。その場かぎりでなら使い道もあるかもしれないが。
皮肉にも再投入した数値は全くの激ハズレである。(笑)
ここ何回か同じような方法で予測してきたわけだが、客観的に見て全体を総括すると、どう判断されるだろうか?
まずWEKAに与えるデータについては、過去2回から3回の当選履歴を使用している。そして予測モデルにはMultiLayerPerceptron と SVMreg の二つを用いた。
結果は正解がゼロから3個まで。予測に用いた数字の総数は、1回の予測につき、およそ7個から8個ぐらいか?
客観的判断というのは自分では難しいが、かなりイケテル気がする。正解がゼロの時でも、実は隣数字であったりした事も多々あり、ハズレの内容を評価するとしたら「かなり惜しいハズレ」といえるものもあった。
まだまだ先は長いが、試さなければならない事はたくさんあるはず。何はともあれ今回の当たりで弾みをつけたい。ちなみに1点購入での当選は初めてである。
2008年8月7日木曜日
第469回ミニロト結果検証
5 9 12 16 19 ボーナス 3
8 9 10 15 17 18 26
上が当選数字で下がWEKAで出した数値を小数点以下、四捨五入した数値である。
一致したのは 9 のみで残りはハズレ。
第五数字として計算した 26 は大きく外れた。たぶん出目のパターンとしては異常でしょ?
あと目に付くのは 15~19のゾーン。好意的に見れば惜しいとも言えるけど、ハズレはハズレ。
WEKA予測が有効かどうか?判断できないな。
ただピンポイント予測(一点予想)で機械的に正解が出たことについては少し満足です。
次回はミニロトでもセット球情報などデータを変えて予測してみたい。
8 9 10 15 17 18 26
上が当選数字で下がWEKAで出した数値を小数点以下、四捨五入した数値である。
一致したのは 9 のみで残りはハズレ。
第五数字として計算した 26 は大きく外れた。たぶん出目のパターンとしては異常でしょ?
あと目に付くのは 15~19のゾーン。好意的に見れば惜しいとも言えるけど、ハズレはハズレ。
WEKA予測が有効かどうか?判断できないな。
ただピンポイント予測(一点予想)で機械的に正解が出たことについては少し満足です。
次回はミニロトでもセット球情報などデータを変えて予測してみたい。
WEKA予測にはどんなデータが有効なのか?
現状では過去履歴、つまり当選数字そのものを使ってWEKAに読み込ませ、predictを行っているだけ。
説明変数については、いろいろ考えを巡らせているわけだ。
次回からになると思うが現在新たにデータを作成中で、検証のためにすべて隠さず備忘録として記録していくつもりだ。
とくに目新しい変数はなく、どれもおなじみのデータばかり。以下に名義尺度?を列挙してみる。
セット球
7分割
11分割
3回ぐらい前までの各当選数字
考えを文章でまとめてみる。
「どのセットが使われたとき、どのゾーンから、どの数字が選ばれたか?」
これを各枠別に予測用データとして作成する。
こういう考え方で予測している人は想像するに圧倒的多数であり、誤解を恐れず言うならば非常にイージーな方法であろう。
だけどM氏のやってる事と決定的に違うのは、そこに、予測に主観、希望的観測?直感?などなど・・が一切入り込まないということ。(やり方によって入る場合もあり)
言い方を変えれば、データそしてアルゴリズムが同じならばいつでも過去の予測を再現できるということであり、違った予測方法を何度でも試行、そして検証できることだ。
だが直感とかシンクロニシティなど俗にオカルトと呼ばれる事象、考え方は否定しない。
むしろそれらに対しては「この世には何かしら未知の力が働いているにちがいない」という理由無き?確固たる信念がある。
ただ唯一残念なこと、それは、ロト予測に限って言えば再現性がないということに尽きる。
M氏の目標は高額当選ではあるけど、予測モデルをつくる目的もある。だから当てたからといってそれですべてが終わるわけではないのだ。実現不可能かもね。
というわけで早く新たな試みをやってみよう。
説明変数については、いろいろ考えを巡らせているわけだ。
次回からになると思うが現在新たにデータを作成中で、検証のためにすべて隠さず備忘録として記録していくつもりだ。
とくに目新しい変数はなく、どれもおなじみのデータばかり。以下に名義尺度?を列挙してみる。
セット球
7分割
11分割
3回ぐらい前までの各当選数字
考えを文章でまとめてみる。
「どのセットが使われたとき、どのゾーンから、どの数字が選ばれたか?」
これを各枠別に予測用データとして作成する。
こういう考え方で予測している人は想像するに圧倒的多数であり、誤解を恐れず言うならば非常にイージーな方法であろう。
だけどM氏のやってる事と決定的に違うのは、そこに、予測に主観、希望的観測?直感?などなど・・が一切入り込まないということ。(やり方によって入る場合もあり)
言い方を変えれば、データそしてアルゴリズムが同じならばいつでも過去の予測を再現できるということであり、違った予測方法を何度でも試行、そして検証できることだ。
だが直感とかシンクロニシティなど俗にオカルトと呼ばれる事象、考え方は否定しない。
むしろそれらに対しては「この世には何かしら未知の力が働いているにちがいない」という理由無き?確固たる信念がある。
ただ唯一残念なこと、それは、ロト予測に限って言えば再現性がないということに尽きる。
M氏の目標は高額当選ではあるけど、予測モデルをつくる目的もある。だから当てたからといってそれですべてが終わるわけではないのだ。実現不可能かもね。
というわけで早く新たな試みをやってみよう。
2008年8月5日火曜日
WEKAによる第406回ロト6の予測
まずはいつものように過去3回の履歴データをマルチレイヤーとSVMregにぶち込む。
4.884 5.667
11.293 11
16.11 15.336
19.118 19.332
27.592 26.664
36.796 35.669
左がマルチ、右がSVMである。上から順に第一~そして第六数字となった。
いま仮に第406回で第二数字に 11 そして第四数字に 19 が当選したと仮定してみる。
そして、もう一度WEKAに同じスキームで計算してみた。
結果は以下のとおり。
4.387 4.4
11 11.497
16.309 16.334
19 18.98
27.847 27.867
37.099 37.399
結果はわずかに変化してきた。
第一数字がやや小さい方にシフト、第三、第五はやや大きく、そして第六も大きい方にシフトした。
このことから推測するに、確かに与えたデータ、つまりは各数値は目的変数に対して相互に影響を与えている。「もしココがこうであればアソコはこうなるはず・・」というように自ら作成した予測モデルに従って微妙に数値を変化させている。
そもそもWEKAに興味を持ったのは決定木というのかな?脳神経(ニューロンとシナプス)の働きをコンピューターで再現?するという人工知能の分野にいたくそそられたからである。
毎回「ああでもない・・こうでもない・・」と予測しても再現性が低いでしょ?
一発当てればいいじゃん?という想いと不思議に対する探究心の両方があるわけで。
アカデミックとは無縁の無学、そしてウェブからだけのうすっぺらな知識のM氏こと私が言うのもまったく説得力がないが、これらは重回帰分析の一種らしい。
簡単にいうと説明変数がひとつだけのものを単回帰分析、複数のものを重回帰と言うのだそうな。
しかもいまWEKAでやってることは目的変数も複数であり、M氏のやってることはいったい何なのか?
という根本的な疑問があるわけで。(笑)
本来なら(ウェブでの教科書的な方法のこと)説明変数をズラリと並べ、最後の列に予測すべき目的変数をもってこなくてはならないはず。
要するに枠別にきちんとデータを揃えて(その数字が選ばれた時の条件等)目的変数を予測すべきなのではないか?
というわけで非常にズボラなやり方ではあるな。(笑)
まあこのブログは個人の記録、検証のためでもあり(参考に見てる人は皆無であろう。できれば役にたちたいという気持ちがあるのも事実。)気長に続けるつもりだけど、いつの日か勝利の雄叫びを挙げてみたいと夢想する次第。
今回は・・・
4 11 16 19 28 37 を買ってみます。
4.884 5.667
11.293 11
16.11 15.336
19.118 19.332
27.592 26.664
36.796 35.669
左がマルチ、右がSVMである。上から順に第一~そして第六数字となった。
いま仮に第406回で第二数字に 11 そして第四数字に 19 が当選したと仮定してみる。
そして、もう一度WEKAに同じスキームで計算してみた。
結果は以下のとおり。
4.387 4.4
11 11.497
16.309 16.334
19 18.98
27.847 27.867
37.099 37.399
結果はわずかに変化してきた。
第一数字がやや小さい方にシフト、第三、第五はやや大きく、そして第六も大きい方にシフトした。
このことから推測するに、確かに与えたデータ、つまりは各数値は目的変数に対して相互に影響を与えている。「もしココがこうであればアソコはこうなるはず・・」というように自ら作成した予測モデルに従って微妙に数値を変化させている。
そもそもWEKAに興味を持ったのは決定木というのかな?脳神経(ニューロンとシナプス)の働きをコンピューターで再現?するという人工知能の分野にいたくそそられたからである。
毎回「ああでもない・・こうでもない・・」と予測しても再現性が低いでしょ?
一発当てればいいじゃん?という想いと不思議に対する探究心の両方があるわけで。
アカデミックとは無縁の無学、そしてウェブからだけのうすっぺらな知識のM氏こと私が言うのもまったく説得力がないが、これらは重回帰分析の一種らしい。
簡単にいうと説明変数がひとつだけのものを単回帰分析、複数のものを重回帰と言うのだそうな。
しかもいまWEKAでやってることは目的変数も複数であり、M氏のやってることはいったい何なのか?
という根本的な疑問があるわけで。(笑)
本来なら(ウェブでの教科書的な方法のこと)説明変数をズラリと並べ、最後の列に予測すべき目的変数をもってこなくてはならないはず。
要するに枠別にきちんとデータを揃えて(その数字が選ばれた時の条件等)目的変数を予測すべきなのではないか?
というわけで非常にズボラなやり方ではあるな。(笑)
まあこのブログは個人の記録、検証のためでもあり(参考に見てる人は皆無であろう。できれば役にたちたいという気持ちがあるのも事実。)気長に続けるつもりだけど、いつの日か勝利の雄叫びを挙げてみたいと夢想する次第。
今回は・・・
4 11 16 19 28 37 を買ってみます。
2008年8月4日月曜日
WEKAによる第469回ミニロトの予測
使用データは過去3回の当選履歴。
以下の数値はスキームSVMregでの結果。設定はいずれもデフォルトのままです。
7.674
8.674
15.241
18.004
26.331
次はmultilayerPerceptronでの結果です。
8.746
9.746
15.34
17.317
26.253
これらの数値から大雑把に数値を拾ってみよう。
まず第一、第二では 8 9 10 あたりが怪しい。
第三は 15
第四は 17 18
最後の第五は 26 辺りか?
これらの予測は与えるデータ、例えば過去履歴の回数を変えるだけで変化する。
いわゆる線形、リニアですね。だから与えるデータが増えれば増えるほど平均化された数値を返すんじゃないか?と思う。
特異な、いわゆる 外れ値 も含んでしまうから。まあこれはM氏の独断だけれども。
Rでは非線形予測のための関数も多く用意されているのだが、今の自分の理解力ではとても使いこなせなかった。なにしろ引数に具体的な数式を入れなければならないのだ。
その点このWEKAでは非常に助かっている。データを与えれば素早く計算結果を返してくれる。
十分なjavaの知識があれば自分で細かいアルゴリズムもカスタマイズできるはずだけど、M氏には無理。現状を理解するだけでも精一杯だ。
あと難しいと感じるのは予測に使うデータそのもの。
いったいどう書けばいいのか?
arff形式やデータの読ませ方などは理解できたのだけど、問題はその中身。
何かとの相関を予測の前提とするわけで、現状では過去履歴のみ。
M氏が思うに、これが、つまり相関が予測の核心なわけで拠り所なんですね。
企業秘密ということで、仮に有益な係数が見つかっても、皆さん簡単には人に教えないでしょう。
もちろんM氏もそう。(笑)
相関は因果関係とはまた違う。因果関係はなくとも相関が見出せることもあるわけで。
そんなわけでデータ作成、知恵を絞るわけですが、ここでひとつ問題がある。
それは予測のためには前もって必要な情報が揃っていなければならないという事実。
当然のことだけどロト予測に必要な十分な情報といえるのは過去履歴しかない。
セット球は抽選前に調べれば解るけど分析には時間がなさすぎる。
あ、そうだ、ひとつ有力な手掛かりがある。それはボタン押し行員のデータだ。おそらくこれらのデータをきちんと保存している個人、または組織、どこかに存在してるんじゃないか?
これらを十分な分析時間のあるうちに、事前に知り得ることは不可能だけれど過去履歴を手に入れることは可能なのか?
フム。。まあ知ったところで、いくつかのシナリオで予測するしかないわけだけれど。
ところでM氏は確率の収束は信用していない。いろいろ考え方はあるだろうけどいつまでたってもアンバランスであろう。
当選数字の分布についてはほぼ数学?定理というべきか?どうりだ。
ヒストグラムを見ても変なグラフにはなっていない。全体を通してみればちゃんと落ち着くようになっている。不思議だ。
ただピンポイントで観察すると、とても変な動きをするように見える。
なんだかグダグダになってきたが、要するに次回の数値が読めればいいわけで、M氏の場合は有効な説明変数を探し出すこと、これが緊急の課題ってことです。
以下の数値はスキームSVMregでの結果。設定はいずれもデフォルトのままです。
7.674
8.674
15.241
18.004
26.331
次はmultilayerPerceptronでの結果です。
8.746
9.746
15.34
17.317
26.253
これらの数値から大雑把に数値を拾ってみよう。
まず第一、第二では 8 9 10 あたりが怪しい。
第三は 15
第四は 17 18
最後の第五は 26 辺りか?
これらの予測は与えるデータ、例えば過去履歴の回数を変えるだけで変化する。
いわゆる線形、リニアですね。だから与えるデータが増えれば増えるほど平均化された数値を返すんじゃないか?と思う。
特異な、いわゆる 外れ値 も含んでしまうから。まあこれはM氏の独断だけれども。
Rでは非線形予測のための関数も多く用意されているのだが、今の自分の理解力ではとても使いこなせなかった。なにしろ引数に具体的な数式を入れなければならないのだ。
その点このWEKAでは非常に助かっている。データを与えれば素早く計算結果を返してくれる。
十分なjavaの知識があれば自分で細かいアルゴリズムもカスタマイズできるはずだけど、M氏には無理。現状を理解するだけでも精一杯だ。
あと難しいと感じるのは予測に使うデータそのもの。
いったいどう書けばいいのか?
arff形式やデータの読ませ方などは理解できたのだけど、問題はその中身。
何かとの相関を予測の前提とするわけで、現状では過去履歴のみ。
M氏が思うに、これが、つまり相関が予測の核心なわけで拠り所なんですね。
企業秘密ということで、仮に有益な係数が見つかっても、皆さん簡単には人に教えないでしょう。
もちろんM氏もそう。(笑)
相関は因果関係とはまた違う。因果関係はなくとも相関が見出せることもあるわけで。
そんなわけでデータ作成、知恵を絞るわけですが、ここでひとつ問題がある。
それは予測のためには前もって必要な情報が揃っていなければならないという事実。
当然のことだけどロト予測に必要な十分な情報といえるのは過去履歴しかない。
セット球は抽選前に調べれば解るけど分析には時間がなさすぎる。
あ、そうだ、ひとつ有力な手掛かりがある。それはボタン押し行員のデータだ。おそらくこれらのデータをきちんと保存している個人、または組織、どこかに存在してるんじゃないか?
これらを十分な分析時間のあるうちに、事前に知り得ることは不可能だけれど過去履歴を手に入れることは可能なのか?
フム。。まあ知ったところで、いくつかのシナリオで予測するしかないわけだけれど。
ところでM氏は確率の収束は信用していない。いろいろ考え方はあるだろうけどいつまでたってもアンバランスであろう。
当選数字の分布についてはほぼ数学?定理というべきか?どうりだ。
ヒストグラムを見ても変なグラフにはなっていない。全体を通してみればちゃんと落ち着くようになっている。不思議だ。
ただピンポイントで観察すると、とても変な動きをするように見える。
なんだかグダグダになってきたが、要するに次回の数値が読めればいいわけで、M氏の場合は有効な説明変数を探し出すこと、これが緊急の課題ってことです。
登録:
投稿 (Atom)