ミニロトの主催者?である「みずほ銀行」が実際の抽選結果をどう取り扱っているのか?つまり何かツールを用いて専門の部署が分析とかしてるのか?についてはまったく解らないわけだけど、ひょっとして公正な抽選のために異常な偏り、つまり明確な予測可能な状態を避けるために何らかの対策を施すためのデータを得るために分析をしていることは大いに有り得る。ちょっと意味が解りづらい言い回しかもしれないが、イカサマではないけれど明らかなクセが出ないようにするという意味です。つまり大方の期待を裏切ってくれないと魅力ある宝くじにはならない。(笑)
分析とは関係ないことを述べましたが主催者の意図?(あくまで憶測)とは別に結果をみると明らかに傾向はあると思うんですけど。以下にWEKAでの傾向分析を記します。
Scheme: weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -c -1
Relation: mini-5bunkatu
Instances: 473
Attributes: 5
5分割第一
5分割第二
5分割第三
5分割第四
5分割第五
上から解説します。まず一番上が分析に用いたスキームです。Relationはデータの名前(笑)
Instancesはデータの行のこと。Attributesは属性です。
Best rules found:
1. 5分割第四=E 153 ==> 5分割第五=E 153 conf:(1)
2. 5分割第二=A 103 ==> 5分割第一=A 103 conf:(1)
3. 5分割第一=A 5分割第四=E 86 ==> 5分割第五=E 86 conf:(1)
4. 5分割第三=D 5分割第四=E 84 ==> 5分割第五=E 84 conf:(1)
5. 5分割第二=A 5分割第五=E 65 ==> 5分割第一=A 65 conf:(1)
6. 5分割第二=B 5分割第四=E 56 ==> 5分割第五=E 56 conf:(1)
7. 5分割第二=C 5分割第四=E 54 ==> 5分割第五=E 54 conf:(1)
8. 5分割第一=B 5分割第四=E 51 ==> 5分割第五=E 51 conf:(1)
9. 5分割第二=A 5分割第三=B 47 ==> 5分割第一=A 47 conf:(1)
10. 5分割第三=B 5分割第五=E 56 ==> 5分割第一=A 54 conf:(0.96)
途中でずらずらと計算過程?らしきものが出てきますが重要なのは最後の部分です。スキームによってはほんとに長ったらしいのが出てきます。
このスキームの場合、各属性の関係を上から重要なものから、つまり分類例が多いと言う意味において上から順に示してくれます。
Best rules found 文字通りベストなルールが見つかったというわけです。(笑)
日本語マニュアルを見てこの記事を書いているわけではないので、どこかに間違いや勘違いがあることを承知で見て頂きたい。
一応解説を。一例だけしておきます。
1. 5分割第四=E 153 ==> 5分割第五=E 153 conf:(1)
これはもっとも例の多いケースで、5分割第四=E 153 というのは5分割で見た場合、第四数字が E ブロックだった場合、第五数字も E だったのが全体で153例あるということを示している。当たり前だね。(笑)たぶんこんな風に見ていくんだろうけど、大きな組み合わせを考えるときには使えるかも。それに上で使用したデータは全体を通してのものなので、短期的トレンド?は反映していない。ごく当然のルールしか出てこないな。(笑)
下の数値は10分割ゾーンを数値にして相関係数を計算したもの。表の見方は縦と横、それぞれが交わる数値がお互いの相関度合いを表している。ちなみに計算に用いたソフトはRです。
X10分割第一 X10分割第五 X10分割第三 X10分割第四 X10分割第二
X10分割第一 1.0000000 0.1897637 0.4561763 0.2906758 0.6275653
X10分割第五 0.1897637 1.0000000 0.4227798 0.5926932 0.3057410
X10分割第三 0.4561763 0.4227798 1.0000000 0.7043353 0.6724843
X10分割第四 0.2906758 0.5926932 0.7043353 1.0000000 0.4860062
X10分割第二 0.6275653 0.3057410 0.6724843 0.4860062 1.0000000
第四と第三が一番高い数値となっている。だからどちらかを基に予測するとき、かなり高い確率で予測できるはず。
こちらはWEKAによる10分割と5分割を一緒に分析した結果です。
Best rules found:
1. 10分割第五=j 253 ==> 5分割第五=E 253 conf:(1)
2. 10分割第一=a 180 ==> 5分割第一=A 180 conf:(1)
3. 10分割第五=j 5分割第一=A 155 ==> 5分割第五=E 155 conf:(1)
4. 5分割第四=E 153 ==> 5分割第五=E 153 conf:(1)
5. 10分割第五=j 5分割第四=E 137 ==> 5分割第五=E 137 conf:(1)
6. 10分割第一=b 131 ==> 5分割第一=A 131 conf:(1)
7. 10分割第一=a 5分割第五=E 128 ==> 5分割第一=A 128 conf:(1)
8. 10分割第四=i 108 ==> 5分割第四=E 108 conf:(1)
9. 10分割第四=i 108 ==> 5分割第五=E 108 conf:(1)
10. 10分割第四=i 5分割第五=E 108 ==> 5分割第四=E 108 conf:(1)
こちらの方はやや使い物になるかも?予測の流れとしては、まず5分割で大枠を決めた後、10分割で緩やかに絞り込んで後、具体的な数字を出すという感じかな。考え方の基本は最大公約数的?で、もっとも頻繁に有りそうなパターンを見つけ出すというもの。予測というより経験値から有りそうだど予想する方法だ。局所的に限って言えば、次回来るかどうかは全くの未知数ではあるけれど、継続して初めて値打ちのあるやり方だと思う。
さて上のデータの話に戻るが、データでは左から右に結果が記されている。当然?かどうかは解らないが、細かい条件から粗い条件へと流れている。(たぶん正しい考え方ではないだろうけど)今後を予測する場合、逆に読んでも差し支えは無いように思える。なぜなら上の分類は実測値をただ分類しただけだからだ。類例の多いものは以後の抽選でも繰り返し再現されるであろうことは容易に推測できる。つづく。
2008年9月8日月曜日
登録:
コメントの投稿 (Atom)
0 コメント:
コメントを投稿