とんとんLife Blog

本を読んだり、ニュースを見て考えたことを皆様と共有していきたいと思っています。

アンケートのサンプルはいくつ必要か

「お客様のうち何パーセントが当社の製品の満足度に満足しているか」といったアンケートをする場合、サンプル数はいくつ調べればお客様全体の情報が得られるか。仕事上、このような質問されることが多いので、統計的にどう計算すればよいか調べてみました。

計算式としては、式(1)で計算でき、信頼区間と誤差を指定すれば、必要なサンプル数(n)は、信頼区間によってきまる定数(k)、許容する誤差(e)、母比率(P)を指定すれば決まります。

   n=(\frac{k}{e})^{2}P(1-P)・・・(1)

因みに、信頼区間を95%、誤差を5%とすれば、k=1.96、e=0.05になります。Pは不明なので、0.5とすればOKです。そうすると、必要なサンプル数は384となります。
とりあえずは、このくらいの数を調べておけば安心です。ただし、ランダムにサンプリングすることが前提で、これは別途検討が必要です。

実務上はこれだけ覚えておけば十分ですが、厳密な計算をしようと思えば、以下のように考えます。

母集団の数がN個で、そのうちある特性をもつものの割合をPとする。その中からn個を取り出した場合のある特性をもつものの割合をpとすると、pは超幾何分布に従う。
そして、pの信頼区間は、式(2)で表せる。なお、σは標準偏差であり、(3)式で表せる。

   P-kσ<p<P+kσ・・・(2)
   σ=\sqrt{\frac{N-n}{N-1}}\sqrt{\frac{P(1-P)}{n}}・・・(3)

許容できる誤差が信頼区間の幅に等しいとすると、式(4)が成立する。

   2kσ=2e
   2k\sqrt{\frac{N-n}{N-1}}\sqrt{\frac{P(1-P)}{n}}=2e・・・(4)

式(4)をnについて解くと、式(5)が得られる。

   n=\frac{N}{(\frac{e}{k})^2\times\frac{N-1}{P(1-P)}+1}・・・(5)

厳密には式(5)でサンプル数を計算しますが、nNの10分の1以下の場合は、式(1)に近似できます。
現実的には、サンプル数は母集団の10分の1以下の場合が多いので、式(1)の計算で十分です。