アンケートのサンプルはいくつ必要か

「お客様のうち何パーセントが当社の製品の満足度に満足しているか」といったアンケートをする場合、サンプル数はいくつ調べればお客様全体の情報が得られるか。仕事上、このような質問されることが多いので、統計的にどう計算すればよいか調べてみました。

計算式としては、式(1)で計算でき、信頼区間と誤差を指定すれば、必要なサンプル数（n）は、信頼区間によってきまる定数（k）、許容する誤差（e）、母比率（P）を指定すれば決まります。

　　 $n=(\frac{k}{e})^{2}P(1-P)$ ・・・(1)

因みに、信頼区間を95％、誤差を5％とすれば、k=1.96、e=0.05になります。Pは不明なので、0.5とすればOKです。そうすると、必要なサンプル数は384となります。
とりあえずは、このくらいの数を調べておけば安心です。ただし、ランダムにサンプリングすることが前提で、これは別途検討が必要です。

実務上はこれだけ覚えておけば十分ですが、厳密な計算をしようと思えば、以下のように考えます。

母集団の数がN個で、そのうちある特性をもつものの割合をPとする。その中からn個を取り出した場合のある特性をもつものの割合をpとすると、pは超幾何分布に従う。
そして、pの信頼区間は、式(2)で表せる。なお、σは標準偏差であり、(3)式で表せる。

　　 $P-kσ＜p＜P+kσ$ ・・・(2)
　　 $σ=\sqrt{\frac{N-n}{N-1}}\sqrt{\frac{P(1-P)}{n}}$ ・・・(3)