今回の予測手順
1、使用データの仕様について
過去40回の過去履歴を使用。各数値は以下のとおり。
まず抽選に使われたセット球、 当選数字の10分割表での第一枠から第五枠までの出現ゾーン、同じく5分割表での第一枠から第五枠までの出現ゾーン、以上全部で11個の要素を各列の要素名とし、遡ること40回分の表をエクセルにて作成した。
以上で第一段階の準備完了。
2、スキームの使用状況。
WEKAでは目的変数の形式?(名義尺度とか量的尺度あるいは順序尺度など)によって使うことのできるスキームが制限される模様。したがってCLASS(目的変数のこと)を変えるたびにスキームを変える必要がある。
こういった事を避けるためかどうかはよく解らないが、目的のスキームを使用するために尺度の方を変換する方法もある。
今回はデータの尺度は初期設定のままとし、目的変数が数値の場合とABCのように名義の場合とでスキームを変える方法で予測してみることとした。
3、予測結果
今回は、初めて臨む予測方法であり、自信は全く無いが後々の検証のために、ありのままを記録しておく。
第470回使用セット球予測は B
5分割でのゾーン予測 A B C D E
10分割でのゾーン予測 1.106 4.232 5.828 7.691 9.608
セット球予測に使用したスキーム SMO
ゾーン予測5分割 SMO
ゾーン予測10分割 SVMreg
10分割でゾーン予測数値が妙なことになっているが、現状ではこのままとして解釈したい。
概観後記
今回の5分割でのゾーン予測は意味がない(笑)全部対象。。アホかいな。
10分割での小数点以下の数字は一応重み付けとして含みを持たせてみたい。
もしかしたら過去40回のデータ取りというのは適切ではないかも知れない。もっと短期が良いのかも?
ただ数値の尺度が名義の場合の予測法がよく解らない。(決定木あるいは樹木モデルというのか、そういうモデルで考えるのがいいのかな?)
因子というキーワードがあるが、これはおそらく説明変数のこと。当たり前じゃね?
WEKAではごった混ぜのデータから因子を探すこともできるようなのでもうチット勉強せなアカンね。
0 コメント:
コメントを投稿