大数の法則とリスト処理

ジオジェブラで統計をやるためのリスト処理のし方

1、大数の法則

母集団から無作為に抽出された標本の平均は母集団の真の平均に近づく

これをジオジェブラで確かめようとすると、母集団をどう作ったらいいのか問題になります。
例えば母集団を1000人とし、1〜1000の数と考えます。
そこからランダムに取り出し、その平均を求めます。

母集団のリストの作り方
Sequence(floor(10Sum(Sequence(RandomBetween(1, 100), i, 1, n) / (10n))), j, 1, i)

これを解読すると、RandomBetween(1, 100)=1から100までの一様分布の乱数を出す。
Sequence=変数iが1からnまでの乱数のリストを作る。
Sum=その合計。ここでは10倍した。
Floor=その合計を10nで割って平均を求め、小数以下を四捨五入。これがヒストグラムの階級になる。
Sequence=この平均を変数jで1からiまでリストにする。
この一様分布の平均は50になるはずだから、 母集団をこの一様分布そのものとみなすと、 無作為に抽出された標本の平均は母集団の真の平均(50)に近づくはずです。
一様分布だから乱数は散らばっているけど、平均をとると中心に寄ってくる様子がわかります。

さらに、このデータをヒストグラムにします。
DotPlot( <生データのリスト>, <積み重ね true | false (オプション)>, <倍率 (オプション)> )
を使えば、ヒストグラムも簡単にできます。実際に作ってみましょう。これらのコマンドは入力に入れます。
まず、iを増やしてみましょう。次にnを増やしてみましょう。



どうでしょうか。イメージがつかめたでしょうか?
リストは行列とみなしてもOKで、足し算や引き算、かけ算もできます。

2、リスト(sequence)の使い方

ちなみに、Element[ <リスト>, <要素の位置> ]というコマンドがあって、リストの要素を取り出すこともできます。
これを見ると、nとiを変えることで、それぞれのリストがどうなるのかわかります。



こうやって分散の行列も作ることができます。
大数の法則のイメージが沸いてきますね。

3、リストの計算のし方

これらのリストやコマンドを使うと、3つの母集団のそれぞれの平均を求めて、さらに平均との差の二乗を求めるというχ二乗分布も作ることができます。
例を挙げてみましょう。
matrix  : Sequence(Sequence(RandomNormal(50,1),i,1,n),j,1,3)
list    : Sum(matrix)
list1   : list/3
matrix1 : Sequence(Element(matrix, k) - list1, k, 1, 3)
Matrix2 : Sequence(Element(matrix1, k)^2, k, 1, 3)
list2   : floor(10Sum(matrix2)) / 10
list3   : DotPlot(list2,false,0.2)
このアプレットでnを少しずつ大きくしながら、数式バーの数値を確かめてみましょう。
そうすると、少しずつ分かってきます。



これを使えば列をもっと大きくすることができて、4つの母集団、5つの母集団の分布のグラフも作ることができます。

χ二乗分布については⇒【≪ジオジェブラ・ブック≫ 統計・・・χ二乗検定の問題
大数の法則については⇒【≪ジオジェブラ・ブック≫ 大数の法則から中心極限定理へ



     目次へもどる