アンケートのサンプルはいくつ必要か
「お客様のうち何パーセントが当社の製品の満足度に満足しているか」といったアンケートをする場合、サンプル数はいくつ調べればお客様全体の情報が得られるか。仕事上、このような質問されることが多いので、統計的にどう計算すればよいか調べてみました。
計算式としては、式(1)で計算でき、信頼区間と誤差を指定すれば、必要なサンプル数(n)は、信頼区間によってきまる定数(k)、許容する誤差(e)、母比率(P)を指定すれば決まります。
・・・(1)
因みに、信頼区間を95%、誤差を5%とすれば、k=1.96、e=0.05になります。Pは不明なので、0.5とすればOKです。そうすると、必要なサンプル数は384となります。
とりあえずは、このくらいの数を調べておけば安心です。ただし、ランダムにサンプリングすることが前提で、これは別途検討が必要です。
実務上はこれだけ覚えておけば十分ですが、厳密な計算をしようと思えば、以下のように考えます。
母集団の数がN個で、そのうちある特性をもつものの割合をPとする。その中からn個を取り出した場合のある特性をもつものの割合をpとすると、pは超幾何分布に従う。
そして、pの信頼区間は、式(2)で表せる。なお、σは標準偏差であり、(3)式で表せる。
・・・(2)
・・・(3)
許容できる誤差が信頼区間の幅に等しいとすると、式(4)が成立する。
・・・(4)
式(4)をnについて解くと、式(5)が得られる。
・・・(5)
厳密には式(5)でサンプル数を計算しますが、nがNの10分の1以下の場合は、式(1)に近似できます。
現実的には、サンプル数は母集団の10分の1以下の場合が多いので、式(1)の計算で十分です。