在市場研究中,常常有客戶和研究者詢問:“要掌握市場總體情況,到底需要多少樣本量?”,或者說“我要求調查精度達到95%,需要多少樣本量?”。要解決這個問題,需要考慮的因素是多方面的:研究的對象,研究的主要目的,抽樣方法,調查經費…。本文將策點市場調研過往的經驗,探討在市場研究中確定調查所需樣本量的一些基本方法,相信這些方法對于其他的社會調查研究也有一定的借鑒意義。
確定樣本量的基本公式
在簡單隨機抽樣的條件下,我們在統(tǒng)計教材中可以很容易找到確定調查樣本量的公式:
Z2 S2
n = ------------ (1)
d2
其中:
n代表所需要樣本量
Z:置信水平的Z統(tǒng)計量,如95%置信水平的Z統(tǒng)計量為1.96,99%的Z為2.68。
S:總體的標準差;
d :置信區(qū)間的1/2,在實際應用中就是容許誤差,或者調查誤差。
對于比例型變量,確定樣本量的公式為:
Z2 ( p ( 1-p))
n = ----------------- (2)
d2
其中:
n :所需樣本量
z:置信水平的z統(tǒng)計量,如95%置信水平的Z統(tǒng)計量為1.96,99%的為2.68
p:目標總體的比例期望值
d:置信區(qū)間的半寬
關于調查精度
通常我們所說的調查精度可能有兩種表述方法:絕對誤差數與相對誤差數。如對某市的居民進行收入調查,要求調查的人均收入誤差上下不超過50元,這是絕對數表示法,這個絕對誤差也就是公式(1)中置信區(qū)間半寬d。
而相對誤差則是絕對誤差與樣本平均值的比值。例如我們可能要求調查收入與真實情況的誤差不超過1%。假定調查城市的真實人均收入為10000元,則相對誤差的絕對數是100元。
公式的應用方法
對于公式的應用,一些參數是我們可以事先確定的:Z值取決于置信水平,通常我們可以考慮95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以確定容許誤差d(或者說精度),即我們可以根據實際情況指定置信區(qū)間的半寬度d。因此,公式應用的關鍵是如何確定總體的標準差S。如果我們可以估計出總體的方差(標準差),那么我們可以根據公式計算出樣本量:
例如:要了解該城市的居民收入,假定我們知道該市居民收入的標準差為1500,要求的調查誤差不超過100元,則在95%的置信水平下,所需的樣本量為
n=1.962*15002/1002=8,643,600/10,000=864
即需要調查的樣本量為864個。
最大樣本量
以上公式只是理論上的,在實際調查中確定合理的樣本量,必須考慮多方面的因素。
首先,由于人們通常缺乏對標準差的感性認識,因此對標準差的估計往往是最難的。總體的標準差是123, 還是765?如果沒有一點對樣本的先驗知識,那么對標準差的估計是不可能的。好在我們通常能對變量的平均值進行估計,如我們通過歷史資料估計該地區(qū)目前的年人均收入大致為10,000元,那么根據統(tǒng)計學知識,我們引入變異系數的概念:
變異系數V=標準差S/平均值X<= 1 <>
因此,我們知道人均收入的標準差應該小于平均值,就是說標準差應該在10000以下。當然,這對于我們確定樣本量還不能起太大的作用。然而如果我們采用相對誤差表述的精度,對公式(1)變形,我們有:
Z2(S2/X2) Z2V2 Z2
n = --------------------= -------------<= ---------- <>
d2/X2 P2 P2
其中P表示相對誤差
根據上述公式,我們可以計算在相對誤差一定的情況下,所需的最大樣本量。以下是在置信程度95%的水平下,在不同相對誤差下的最高樣本量:
相對誤差 1% 2% 3% 4% 5% 10% 20%
樣本量 38416 9604 4268 2401 1537 384 104
通常,變異系數為1的情況是很少見的,根據本人對市場研究中經常遇到的情況,變異系數多在50%以下,因此,實際所需要的樣本量可以進一步縮小。
對于比例型變量,在事先缺乏對比例的估計時,我們可以采用最保守的估計法,即p=0.5,以下是比例p在不同絕對誤差程度下,所需的最大樣本量(95%置信水平):
p的絕對誤差 0.01 0.02 0.03 0.04 0.05 0.10
所需最大樣本量 9604 2401 1067 600 384 96
雖然我們根據公式可以從理論上確定樣本量的上限,但是由于實際工作的經費和時間限制,使用最大樣本量的可能性很小;而且,實際研究的情況通常要復雜得多,因為一個研究往往都要考慮多個目標的,即要求對多個指標的誤差進行控制,而不是簡單地考慮一個指標。因此我們在實際的市場研究中,我們要綜合考慮,采用多種方式來確定樣本量。
實際調查樣本量的確定原則
1、調查的主要目標
一個現(xiàn)實的市場調查往往有多個目標,對于一些目標單一的調查,調查的樣本量往往可以很少:100個,甚至50個就足夠了。而對于具有多個目標的研究,必須考慮這些目標中變異程度最大,要求精度最高的目標。
2、分類比較的程度
分類是市場研究中一個最基本的方法,研究者往往是通過分類來發(fā)現(xiàn)細分市場,確定產品的市場定位等。假定對同一變量(研究目標),在一定精度與置信程度下,只要100個樣本量就足夠了,如果我們僅僅希望了解不同性別的消費者市場,則確定樣本量時只需要考慮兩類消費者的樣本量,這樣調查的總樣本量可能需要200個以上,如果希望了解不同年齡層的消費者,則可能要將消費者分為多類,如分為:20歲以下,20-35,35-50,50歲以上等四類,這樣的樣本量需要400個以上。也就是說,確定樣本量時必須考慮到每一類別的樣本量。
3、調查區(qū)域的大小
根據常識,調查區(qū)域越大,所需要的樣本量可能越大,因為大區(qū)域內的樣本變異程度我們通常較難掌握。此外,在實際研究中,我們還往往需要對大區(qū)域進行進一步分類,以尋求更加準確的市場細分。因此,對于同一調查目標,在上海進行調查所需要的樣本量通常是要大于蘇州的。
實際研究中的一些經驗
根據一些學者的研究,以及個人在市場研究中的經驗,市場調查中確定樣本量通常的做法是:
1、通過對方差的估計,采用公式計算所需樣本量,主要做法有:
?用兩步抽樣,在調查前先抽取少量的樣本,得到標準差S的估計,然后代入公式中,得到下一步抽樣所需樣本量n;
?如果有以前類似調查的數據,可以使用以前調查的方差作為總體方差的估計。
2、根據經驗,確定樣本量,主要方法有:
?如果以前有人做過類似的研究,初學者可以參照前人的樣本。
?如果是大型城市、省市一級的地區(qū)性研究,樣本數在500-1000之間可能比較適合;而對于中小城市,樣本量在200-300之間可能比較適合;如果是多省市或者全國性的研究,則樣本量可能在1000-3000之間比較適合。
?作為一個常識(主要是為了顯著性檢驗),要進行分組研究的每組樣本量應該不少于30個。
?通過試驗設計所作的研究,可以采用較小的樣本量。如產品試用(留置)調查,在經費有限的情況下,可以將每組的樣本量降低至15個左右,最好每組在30以上。此外,我們在多次的實際研究中發(fā)現(xiàn),每組超過50個可能是一種資源浪費。