幾つか統計に関する書籍を読んできましたが、いまいちピンと来なかったので実際に入力などして感覚が掴みやすそうなものを読んでみることにしました。

Rによるやさしい統計学はRと統計学の入門書でRを使いながら統計学に触れてみようという感じの本です。

1~4章を読んだので重要そうな所を簡単にまとめたいと思います。

相関

抽出方法

  • 今回用いられているのは単純無作為抽出
    • 単純無作為抽出が行われる理由としては、抽出方法における分布が関係する
    • 単純無作為抽出の場合、標本の分布は母集団の分布に従うが、他の抽出方法の場合だと、抽出方法によっては母集団の分布と等しくないことが考えられる

不偏性

  • 一般に標本の分散などを取り扱う場合の方法として標本分散と不偏分散がある
  • 標本分散はよくある式の分散の式で求められるもので、不偏分散は割る値が-1になっているものである
  • この不偏性は一般に対象としている標本が母集団全体である場合は標本分散を、一部分である場合は不偏分散が用いられる
  • ここで不偏性をもつ推定量とは、ある標本分布の平均が母集団の平均と一定している場合の推定量のことをいう

標本分布

  • 簡単に言えば標本統計量の分布

    1. 母集団から標本を取ってきて、母数を点推定する場合、その推定値(標本統計量)が本当に母集団を表現することができているかどうかが分からない
    2. なので母集団から繰り返し標本を取ってきて、母数の点推定を行い、その分布を使って標本誤差を判定する
      • 標本統計量の分布が標本分布になる
  • 標本平均の場合、一般にサンプルサイズを大きくすれば、標本平均の標本分布は正規分布に従うと過程することができる

    • 中心極限定理っていうらしい
  • 一般に正規分布に従う母集団から得られる標本平均の標本分布は分散をサンプルサイズで割った正規分布に等しくなる