【確率・統計っぽい】種類数の推測

先日、GREEで「くみかえトーテム」というゲームをやってた時にふと思ったこと。
ちなみに、論理立てて問題を解いたりはしてないです。

■状況

くみかえトーテムでは、集落の御神体的なもの=トーテムを、任意のパーツ5つを組み合わせることでカスタマイズできる。
パーツは、ターン終了ごとに1つ作成することができ、パーツのレベルを選択すると、そのレベルのいずれかのパーツがランダムに作成される。

■気になったこと

各レベルごとに、何種類のパーツがあるか分からない。何回か試した中で、実際に出現した回数から推測できないもんかなぁと思った。

■問題

何種類あるか分からない対象物を均等な確率で1個入手できる行為をN回繰り返し、結果としてM種類の対象物を入手できたとする。この時、この行為で入手可能な対象物は何種類あると推測すればよいか。

■実験した。

実験は、実際に入手可能な種類を設定してN回対象物を入手するテストを10000回行ない、M種類の対象物が入手できた回数を記録する、という形で行なった。
ぶっちゃけこの手の実験はExcelVBAも使わずにやってる*1ので、あまり回数をこなせない。10000回ってぶっちゃけ超少ない。でも重くてこれ以上無理。
あと、実際に入手可能な種類を増やすほどM種類入手できる確率が減っていくようになった段階で、M種類入手できる確率が1割を切った時点で実験は止めている。なので、結果の一部は実際より若干低めに出ることになる。

■結果を書く前に

当然ながら、「結果としてM種類の対象物を入手できた」時点で、「この行為で入手可能な対象物」の種類がM種類未満ということはありえない。
また、「行為をN回繰り返し」た結果、N種類の対象物が現れた場合、この問題の条件だけからは絞込みが行なえない。なにせ実際の種類が多ければ多いほど、一度も重複しない確率も増えるわけで。

■結果

〜1: 5回やって1種類入手できた〜
実種類数 問題との一致率
1種類 100.00%
2種類 6.43%
一番確率の高い種類数 種類数の期待値推測
1種類 1.06種類
〜2: 5回やって2種類入手できた〜
実種類数 問題との一致率
2種類 93.77%
3種類 36.62%
4種類 17.97%
5種類 9.51%
一番確率の高い種類数 種類数の期待値推測
2種類 2.64種類
〜3: 5回やって3種類入手できた〜
実種類数 問題との一致率
3種類 61.63%
4種類 58.09%
5種類 47.82%
6種類 39.07%
7種類 31.21%
8種類 25.19%
9種類 20.28%
10種類 18.14%
11種類 15.4%
12種類 13.29%
13種類 11.3%
14種類 10.05%
15種類 9.3%
一番確率の高い種類数 種類数の期待値推測
3種類 6.74種類
〜4: 5回やって4種類入手できた〜
実種類数 問題との一致率
4種類 23.18%
5種類 38.66%
6種類 46.26%
7種類 50.21%
8種類 51.15%
9種類 51.49%
10種類 50.33%
11種類 48.67%
12種類 48.07%
13種類 46.3%
14種類 45.21%
15種類 42.44%
16種類 41.13%
17種類 40.02%
18種類 39.68%
19種類 37.06%
20種類 35.84%
21種類 35.51%
22種類 33.51%
23種類 33.05%
24種類 32.12%
25種類 31.08%
26種類 30.69%
27種類 29.27%
28種類 28.05%
29種類 27.59%
30種類 27.03%
31種類 26.61%
32種類 25.66%
33種類 25.04%
34種類 24.2%
35種類 23.9%
36種類 23.34%
37種類 22.15%
38種類 22.08%
39種類 21.94%
40種類 21.79%
41種類 21.09%
42種類 20.89%
43種類 20.7%
44種類 20.42%
45種類 19.24%
46種類 18.84%
47種類 18.54%
48種類 18.5%
49種類 18.17%
50種類 17.57%
51種類 17.27%
52種類 17.04%
53種類 17.03%
54種類 16.91%
55種類 16.47%
56種類 15.46%
57種類 15.18%
58種類 15.56%
59種類 14.71%
60種類 15.32%
61種類 14.99%
62種類 15.05%
63種類 14.16%
64種類 14.68%
65種類 13.21%
66種類 13.28%
67種類 13.42%
68種類 13.43%
69種類 12.72%
70種類 12.8%
71種類 13.19%
72種類 12.45%
73種類 12.46%
74種類 12.59%
75種類 12.75%
76種類 11.77%
77種類 12.02%
78種類 11.45%
79種類 11.18%
80種類 11.55%
81種類 11.08%
82種類 11.43%
83種類 11.5%
84種類 10.83%
85種類 11.21%
86種類 10.71%
87種類 10.46%
88種類 10.85%
89種類 9.77%
一番確率の高い種類数 種類数の期待値推測
9種類 34.66種類
〜5: 10回やって1種類入手できた〜
実種類数 問題との一致率
1種類 100%
2種類 0.18%
一番確率の高い種類数 種類数の期待値推測
1種類 1.00種類
〜6: 10回やって2種類入手できた〜
実種類数 問題との一致率
2種類 99.72%
3種類 5.05%
一番確率の高い種類数 種類数の期待値推測
2種類 2.05種類
〜7: 10回やって3種類入手できた〜
実種類数 問題との一致率
3種類 94.73%
4種類 21.09%
5種類 5.79%
一番確率の高い種類数 種類数の期待値推測
3種類 3.27種類
〜8: 10回やって4種類入手できた〜
実種類数 問題との一致率
4種類 77.81%
5種類 41.73%
6種類 20.66%
7種類 9.72%
一番確率の高い種類数 種類数の期待値推測
4種類 4.75種類
〜9: 10回やって5種類入手できた〜
実種類数 問題との一致率
5種類 51.79%
6種類 50.41%
7種類 38.55%
8種類 27.16%
9種類 18.5%
10種類 13.54%
11種類 9.04%
一番確率の高い種類数 種類数の期待値推測
5種類 6.94種類
〜10: 10回やって6種類入手できた〜
実種類数 問題との一致率
6種類 27.78%
7種類 40.05%
8種類 42.62%
9種類 38.9%
10種類 33.96%
11種類 29.37%
12種類 25.17%
13種類 20.14%
14種類 16.84%
15種類 13.4%
16種類 12.39%
17種類 10.12%
18種類 9.05%
一番確率の高い種類数 種類数の期待値推測
8種類 10.43種類
〜11: 10回やって7種類入手できた〜
実種類数 問題との一致率
7種類 10.16%
8種類 22.02%
9種類 30.43%
10種類 35.67%
11種類 37.77%
12種類 37.52%
13種類 37.1%
14種類 35.25%
15種類 33.38%
16種類 31.04%
17種類 28.84%
18種類 25.92%
19種類 24.26%
20種類 22.45%
21種類 20.29%
22種類 19.24%
23種類 17.36%
24種類 16.65%
25種類 15.16%
26種類 13.79%
27種類 12.66%
28種類 11.1%
29種類 11%
30種類 10.11%
31種類 9.99%
一番確率の高い種類数 種類数の期待値推測
11種類 16.79種類
〜12: 10回やって8種類入手できた〜
実種類数 問題との一致率
8種類 2.81%
9種類 7.86%
10種類 13.62%
11種類 19.06%
12種類 24.63%
13種類 29.01%
14種類 30.76%
15種類 33.2%
16種類 35.37%
17種類 35.37%
18種類 36.44%
19種類 36.87%
20種類 37.01%
21種類 37.26%
22種類 36.42%
23種類 35.95%
24種類 34.23%
25種類 34.12%
26種類 33.69%
27種類 33.32%
28種類 31.04%
29種類 30.69%
30種類 30.27%
31種類 28.99%
32種類 28.62%
33種類 28.33%
34種類 26.71%
35種類 26.05%
36種類 24.94%
37種類 24.82%
38種類 23.83%
39種類 23.38%
40種類 22.25%
41種類 21.44%
42種類 20.92%
43種類 20.2%
44種類 19.58%
45種類 19.13%
46種類 18.02%
47種類 17.97%
48種類 17.87%
49種類 17.38%
50種類 16.32%
51種類 15.9%
52種類 15.67%
53種類 15.54%
54種類 14.91%
55種類 14.41%
56種類 14.3%
57種類 13.58%
58種類 13.5%
59種類 13.37%
60種類 12.5%
61種類 12.23%
62種類 12.18%
63種類 11.92%
64種類 11.57%
65種類 11.29%
66種類 10.85%
67種類 10.65%
68種類 10.35%
69種類 10.29%
70種類 10.07%
71種類 9.87%
一番確率の高い種類数 種類数の期待値推測
21種類 34.08種類
〜13: 10回やって9種類入手できた〜

(実験用シートの限界を超えたのでテストできず)

■結論

試行回数に対する入手種類数の割合が大きいと期待値が発散気味になるので、充分に試行回数を重ねるのがよさそうだ(ドヤッ

■……で?

どうせ誰かもうこの手の問題に取り組んでるだろうから探しに行くか……。

*1:だってプログラム組むの手間だし……。ただ、手作業しながら「あれ、これってプログラム組んだ方が楽じゃね?」とか思ったりするし今回も思った。