2009年1月14日水曜日

近況報告

現在はデータ整備中。自力予測ではどうしても壁をブチ敗れない。
そこでネット公開中の削除や候補数字から何かヒントを得ようと画策中である。
予想方法は各自いろんな技をお持ちのようで、各種データも豊富に公開されている。
問題はそれらを使って次回数字をあぶりだすこと。そのためのデータ作成だ。
基本は7個の削除数字と8個の候補数字。
7個削除はパーフェクトが5人集まれば一等という目標は達成する。一方候補数字は最小で2人分の予想で一等を達成できる。(もちろん1人で達成可能だが実績をみるかぎり3hitですらかなり難しい。)
7個削除の成功率は比較的高い。一方8個候補で5等当選の成功率はかなり低い。あくまでM氏の主観だけど。
あとは活かし方次第だ。成功は目前に在る。

2009年1月1日木曜日

第427回ロト6予測

新年明けましておめでとう。今日は元旦、心機一転新しい気持ちで取り組んでいきたい。

ざっと間隔だけ見てみると6までで30個も数字が残っている。これをどう捉えるか?
単純に考えればここだけで相当数出現するだろう。もしかして完結も有り得るのか。それとも関係なしに遠いところがメインとなって完結するのか全体像はまったく読めない。
ずっと以前から出現の条件というものを考えていたわけだけど、間隔と回数という二つの属性にとくに注目してデータを更新している。
絶対に来ない組み合わせを出すのは簡単だ。当選数字を含んでしまう可能性は高いが。(笑)
ある属性のみで6個選べばほぼ外れる。属性は何でもいい。要するに分類するための条件。最大で2個から3個当選数字を選んでしまう可能性がある。
ちなみに絶対に完結しないグループを以下に挙げておく。
1、11 22 21 27 42 38 41
2、10 15 18 33 23 7 17 24 26 40 39
3、1 5 14 13 4 29 32 35
4、19 9 34 31 36 43 
5、8 16 12 30 25 20 28
6、2 3 6 37
全部で6種類の分類だ。お気付きかも知れないが、これは出現回数による分類だ。
他に同色数字でも完結はしない。妄想段階だけれど、こんなふうにたくさん分類を考えてフィルターとするとどれくらい削除できるのだろう?
注意することは表面上のデータ、例えば奇数偶数とか合計数、それに連番とかにこだわらないこと。これは失敗する。それに確率の収束も。持論だが抽選結果はいつでもスタート地点であり、終わりはない。

2008年12月20日土曜日

第426回ロト6具体的に絞り込む



表の列 9 8 7 の意味は各枠でいくつ数字が残っているか?
間隔の方はお休み回数、色分けは過去21回での出現回数を表しています。
これは始めたばかりなので蓄積情報がほとんどないです。でもざっと見る限りポイントとなる数値は 7 です。識別IDの7ではなくて7個のグループという意味です。
どういうわけか各枠第一から第六まで間隔での残り具合を見ると多く残っている列から出やすい傾向があるように感じる。バラツキはありますが少なくとも 7個以下の列がメインになることはない、もしくは稀なことかも知れない。
また過去21回での平均出現を3回とみると大抵の場合それを上回っている数字が当選数字に絡んでいる。
まだまだ他にも見所はあるだろうけどWEKAの場合は残念ながらアバウトな思考はできない。ファジイと表現した方がいいのか。こういった人間的な判断の仕方を数値に変換し、(何か尺度を自分なりに決めてエクセルなど表をつくりCSV形式で書けばよい)パターンを抽出すれば何とかなるかも知れない。

表の説明に戻ると、第二数字と第四数字は現在の残り数字(出現待ち)がともに6個である。だからこの表に載せていない。
削除した列からの気になる数字、とくに直近でいくつかあるのだけれどどうしたものか?
いつもなら迷わず候補にするところだが、列の残り具合から察すると出現なしとなるかも。
でも列の残りが4個のケースもあるようだから現段階では何とも言えない。

過去21回での出現回数によるグルーピングから言えば同じ回数同士で完結することは無い模様。直近10回以内で活発な動きを見せている数字群から2個から4個出そうな気がする。
3 6 19 12 16 20 25 30 34 43 36 31 37
敬遠されそうな数字として 2 
次点で 3 6 37 
この4個のいくつかを選ぶのも面白い。
直近10回以内で出現1回の数字 21 22 は出ないかも。どうせなら 11 27 42 を選びたい。
回数から見て大抵の場合一番大きなグループは2回出現のグループまたは3回グループだ。おそらく毎回両方あわせて20個にはなるだろう。不思議な事におよそ半数をいつも占めるのだ。
ここから1個も出現なしというケースはあるのか?有りそうなのはどちらから1個、または両方から1個づつというパターンか。
でも数が多いから全然わからない。今回の場合、強いて言えば間隔の遠いところで 9 か 4 がくさい。(笑)近いとするなら 10 7 17 辺りか?
2回か3回の過去分析を見ただけの判断だから評価の仕様がないが、直近5回で3回出現数字は今回は候補としない。
1 5 14 13 35 となっているはず。
また同じように直近5回ぐらいで1回だけ出現している数字も外してみる。
38 41 となっている。

結果を見て唖然とするかもしれないが(笑)今回は上記のように考えて組み合わせを作る事とします。

2008年12月19日金曜日

第426回ロト6状況判断

WEKAによる予測は中断中。
今回はアナログ思考による状況判断についてのメモです。

使用するデータは過去21回分の履歴で、注目する主な属性はその間の出現回数とインターバル、配色による組み合わせ、以上3点。

基本的な考え方は「ひとつの共通した属性で当選数字は完結しない」という点。
またコールド数字や多選数字、連続出現数字を削除対象にしてしまうのもミスとなる可能性がある。
だから一番最初はすべての数字を候補としスタートするのが良い。

具体的に何をどう操作するか?最初に出現回数を調べる。各数字のインターバルを記した表に回数を色分けして分布を見てみる。あっちこっち予想を見ていくといろいろな場読みをされているが、こういった表を眺めつつ読んでみるとほぼ似たような所見に出くわす場合が多い気がする。それもそのはず同じデータを見てるんだからね。
たとえばコールド数字の構成比が多ければ当然次回はその内どれかが出現する確率は高くなる。それに同じ抽選回の6個の数字が複数回に渡り残っているような場合も当然そこから出現する確率も高い。
また直近数字が出やすいというのも理由は簡単、約1/7(単純に43個から6個選ぶ場合の確率)という数値から考えれば前回から引っ張る現象というのは確率上十分有り得る。
それに直近5回分ぐらいを見れば、およそ半分20個ぐらいの候補数字があるから、ここから3個ぐらいは毎回出現してもおかしくない。
このように考えてみると、すべては(純粋に確率と表現していいのか解らないが、)まったくランダムに選ばれているように見える。
こう言ってしまうと身も蓋もない、予想なんて出来ねーやってことになってしまう。
だけどやっぱり予測しなきゃならん。いやM氏は予測できると信じている。

それで当選数字に共通する特性は何だと思いますか?
M氏はいろいろ予想してきたなかで重要な?ことを見落としていました。それは1から43までを数字として見てきたということ。これは他の方も数多く指摘されてることですが、「1から43は識別番号である」ということです。
ですから連続番号とか奇数偶数だとか、あるいはミニロト化とか逆に巨大化とか(笑)あまり関係ない気がする。データとして奇遇の分布などはある程度信頼性があるのは否定しませんがね。だから字面(つまり表面上の数字の並び)を見て判断するというのは危険ということです。
話しを戻すと共通する特性というのは表面上は分からない。字面だけ見ても、WEKAにぶちこんで分析しても解りませんでした。個別には顕著な傾向は分かるのですよ。(ただし時系列で見た場合は無理。方法に限界を感じた)だけど組み合わせとしては分からない。パターンもいろいろ出してみたけどね。数値あるいは名義変数として分類しても顕著な相関はなかったと思う。
要するに過去パターンに照らして判断するだけなので未来の出来事、動きを的確に予測できない。線形予測が通用する相手ではないし、何かの係数?指数にしたがって動くものでもない。
まあ、そういう説明変数を探していたわけでもあるのだけれど、いまだ収穫なし。

そういうわけで現状、間隔回数表をみながら考え中というわけです。
強いて次回の状況判断をするなら活発な動きを見せている数字群をメインにして、残りはやや低調な数字、もしくはコールドから選ぶというのが本線のような気がする。
インターバルで言うなら間隔5まででほとんど完成するかも。ただし全部出るか?というとそうでもない。コールドや中間層からも候補を出した方が良いかもしれない。
なんとも玉虫色?の所見になってしまったか。

2008年12月9日火曜日

ロト6特異出目に関するメモ

1 8 15 22 29 36 43ーA
2 9 16 23 30 37 ーB
3 10 17 24 31 38 ーC
4 11 18 25 32 39ーD
5 12 19 26 33 40 ーE
6 13 20 27 34 41ーF
7 14 21 28 35 42ーG

これはご存知のようにセット球による分類である。セットが変わって色が変わっても、このグループ分けに変更はない。これらを便宜上A~Gまでの記号で7分割してみる。
連番出目を考えた場合、表面上、特に1~43の数直線で見た場合、有り得ないような印象を受けるが、上記の分類でいえば逆に自然なものとなる。
この分類の特徴は横の空き間隔が6刻みであること。連番と6刻みでどちらが来やすいか?あるいは来にくいか?を問うことはおそらく無意味だ。どんな属性で分類しても6個すべてが完全に一致することはほぼない。もしくは稀。いまここで問題にしているのは連番についてであるが、先に述べたように同じ属性で完結することはないことを思う時、連番で出現することは極自然だということを6刻みの分類を用いて説明しているに過ぎない。
A~Gまででバラバラに選んだ時、結果として連番になったといえる。

同じように間隔データでも考えてみよう。
この場合数字の分類は毎回変化する。数字の残り具合から推測する方法であるが、これも特定の間隔で完結することはない。多くの場合ほぼ全域が対象となっている。(直近からコールドまで)もっとも有りそうなのは直近とコールドから1個のパターン。イレギュラーといえるのは直近からゼロでコールドからが多いときだろうと思う。
間隔データの構成数からいえば直近数字がほぼ半数を占めるので次回は当然そこから選ばれる確率が高い。逆にコールドは時系列で言えば縦に長くなり、また個数も直近に比べれば少ないので選ばれる確率が若干低いし、的も絞りづらい。
話しを特異出目に戻すと、(ここでいう特異出目とは表面上のことであって間隔での特異ケースではない。)組み合わせを考える時、間隔データを重視すべきで表面上不自然に感じる場合でも他の属性で極端に片寄ってなければ良い組み合わせと言えるんじゃないだろうか?

間隔、配色、全体あるいは任意の区切りでの出現数、まだ他にもあるだろうけど集中しても3個ぐらいが限度ではないだろうか。

2008年12月3日水曜日

第423回ロト6WEKAによる予測

上手くいく可能性はとても低いが今回はセット球予測を試行してみる。
使用データは全回分で枠別にセットと出目の相関を各スキームで試してみようと思う。
SMO
G J  B  D
3 1  1  4
10 11 16  8
19 15 17 18
31 30 30 25
36 31 33 37
41 43 43 42

過去12回のデータからMLPで出した以下の数字を削除とする。
2 6 7 9 10 37 あと一つ36を勘で選択。
セットを使った予測はたぶん出来が悪い。だから7個削除で残った数字を間隔やら他人の予想を見て絞り込むことになるだろう。(笑)

2008年11月26日水曜日

ロト6における説明変数

タイトルについて、ずっと考えてはいたのだが未だ決定的な要因は解らない。
WEKAではattributeとして表現されていて、それらを並べ任意のアルゴリズムで計算する。ある事柄についてデータを分類し、推定するわけだ。
ロトにおいて、ある事柄とは数字そのもの、あるいはゾーンなどいろいろ考えられる。問題は何を分類するか?経験から言って数字そのもは上手く機能しない。何か他の条件みたいなものを考える必要がある。例えば気圧。?と思うかもしれないが、まったくのデタラメとも言えない要素を含んでいる。このように抽選に際して事前に知り得る情報をattributeとして蓄積し、それらが実際の抽選結果に対してどんな関係を持っているか?を調べる。
ロトにおける予想はアナログであれM氏のようにソフトウェアを使う場合でも基本的な考え方は同じだ。つまり相関であり関連付けだと思う。
したがって重要なのは「事前に知り得る情報」の質、それと量もあるか?量とは種類のこと。
情報の質についてはロト抽選そのもにインサイダーは有り得ない。だからどういった情報を過去履歴から抽出するか?にかかってくると思う。一方抽選とは直接的に関係ない属性はありとあらゆるものが対象となりえる。
今のところ過去履歴から何種類か数値を取り出そうと思っている。それらを各数字1~43について独立して分析にかけてみようか?