因子分析
研究從變量群中提取共性因子的統(tǒng)計技術(shù)。最早由英國心理學(xué)家C.E.斯皮爾曼提出。他發(fā)現(xiàn)學(xué)生的各科成績之間存在著一定的相關(guān)性,一科成績好的學(xué)生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學(xué)生的學(xué)習(xí)成績。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質(zhì)的變量歸入一個因子,可減少變量的數(shù)目,還可檢驗變量間關(guān)系的假設(shè)。
因子分析的主要目的是用來描述隱藏在一組測量到的變量中的一些更基本的,但又無法直接測量到的隱性變量(latentvariable,latentfactor)。比如,如果要測量學(xué)生的學(xué)習(xí)積極性(motivation),課堂中的積極參與,作業(yè)完成情況,以及課外閱讀時間可以用來反應(yīng)積極性。而學(xué)習(xí)成績可以用期中,期末成績來反應(yīng)。在這里,學(xué)習(xí)積極性與學(xué)習(xí)成績是無法直接用一個測度(比如一個問題)測準(zhǔn),它們必須用一組測度方法來測量,然后把測量結(jié)果結(jié)合起來,才能更準(zhǔn)確地來把握。換句話說,這些變量無法直接測量。可以直接測量的可能只是它所反映的一個表征(manifest),或者是它的一部分。在這里,表征與部分是兩個不同的概念。表征是由這個隱性變量直接決定的。隱性變量是因,而表征是果,比如學(xué)習(xí)積極性是課堂參與程度(表征測度)的一個主要決定因素。
那么如何從顯性的變量中得到因子呢?因子分析的方法有兩類。一類是探索性因子分析,另一類是驗證性因子分析。探索性因子分析不事先假定因子與測度項之間的關(guān)系,而讓數(shù)據(jù)“自己說話”。主成分分析是其中的典型方法。驗證性因子分析假定因子與測度項的關(guān)系是部分知道的,即哪個測度項對應(yīng)于哪個因子,雖然我們尚且不知道具體的系數(shù)。
探索性因子分析
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對角線上的值,采用不同的共同性□2估值。在社會學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法。
主成分分析為基礎(chǔ)的反覆法 主成分分析的目的與因子分析不同,它不是抽取變量群中的共性因子,而是將變量□1,□2,…,□□進(jìn)行線性組合,成為互為正交的新變量□1,□2,…,□□,以確保新變量具有最大的方差:
在求解中,正如因子分析一樣,要用到相關(guān)系數(shù)矩陣或協(xié)方差矩陣。其特征值□1,□2,…,□□,正是□1,□2,…,□□的方差,對應(yīng)的標(biāo)準(zhǔn)化特征向量,正是方程中的系數(shù)□,□,…,□。如果□1>□2,…,□□,則對應(yīng)的□1,□2,…,□□分別稱作第一主成分,第二主成分,……,直至第□主成分。如果信息無需保留100%,則可依次保留一部分主成分□1,□2,…,□□(□<□)。
當(dāng)根據(jù)主成分分析,決定保留□個主成分之后,接著求□個特征向量的行平方和,作為共同性□:
□并將此值代替相關(guān)數(shù)矩陣對角線之值,形成約相關(guān)矩陣。根據(jù)約相關(guān)系數(shù)矩陣,可進(jìn)一步通過反復(fù)求特征值和特征向量方法確定因子數(shù)目和因子的系數(shù)。
因子旋轉(zhuǎn)為了確定因子的實際內(nèi)容,還須進(jìn)一步旋轉(zhuǎn)因子,使每一個變量盡量只負(fù)荷于一個因子之上。這就是簡單的結(jié)構(gòu)準(zhǔn)則。常用的旋轉(zhuǎn)有直角旋轉(zhuǎn)法和斜角旋轉(zhuǎn)法。作直角旋轉(zhuǎn)時,各因素仍保持相對獨立。在作斜角旋轉(zhuǎn)時,允許因素間存在一定關(guān)系。
Q型因子分析上述從變量群中提取共性因子的方法,又稱R型因子分析和R型主要成分分析。但如果研究個案群的共性因子,則稱Q型因子分析和Q型主成分分析。這時只須把調(diào)查的□個方案,當(dāng)作□個變量,其分析方法與R型因子分析完全相同。
因子分析是社會研究的一種有力工具,但不能肯定地說一項研究中含有幾個因子,當(dāng)研究中選擇的變量變化時,因子的數(shù)量也要變化。此外對每個因子實際含意的解釋也不是絕對的。
驗證性因子分析
探索的因子分析有一些局限性。第一,它假定所有的因子(旋轉(zhuǎn)后)都會影響測度項。在實際研究中,我們往往會假定一個因子之間沒有因果關(guān)系,所以可能不會影響另外一個因子的測度項。第二,探索性因子分析假定測度項殘差之間是相互獨立的。實際上,測度項的殘差之間可以因為單一方法偏差、子因子等因素而相關(guān)。第三,探索性因子分析強制所有的因子為獨立的。這雖然是求解因子個數(shù)時不得不采用的機宜之計,卻與大部分的研究模型不符。最明顯的是,自變量與應(yīng)變量之間是應(yīng)該相關(guān)的,而不是獨立的。這些局限性就要求有一種更加靈活的建模方法,使研究者不但可以更細(xì)致地描述測度項與因子之間的關(guān)系,而且并對這個關(guān)系直接進(jìn)行測試。而在探索性因子分析中,一個被測試的模型(比如正交的因子)往往不是研究者理論中的確切的模型。
驗證性因子分析(confirmatoryfactoranalysis)的強項正是在于它允許研究者明確描述一個理論模型中的細(xì)節(jié)。那么一個研究者想描述什么呢?我們曾經(jīng)提到因為測量誤差的存在,研究者需要使用多個測度項。當(dāng)使用多個測度項之后,我們就有測度項的“質(zhì)量”問題,即有效性檢驗。而有效性檢驗就是要看一個測度項是否與其所設(shè)計的因子有顯著的載荷,并與其不相干的因子沒有顯著的載荷。當(dāng)然,我們可能進(jìn)一步檢驗一個測度項工具中是否存在單一方法偏差,一些測度項之間是否存在“子因子”。這些測試都要求研究者明確描述測度項、因子、殘差之間的關(guān)系。對這種關(guān)系的描述又叫測度模型(measurementmodel)。對測度模型的質(zhì)量檢驗是假設(shè)檢驗之前的必要步驟。
驗證性因子分析往往用極大似然估計法求解。它往往與結(jié)構(gòu)方程的方法連用。具體的使用過程與原理可以參看擴展閱讀中的《社會調(diào)查研究方法》。
因子分析在市場調(diào)研中的應(yīng)用
在市場調(diào)研中,研究人員關(guān)心的是一些研究指標(biāo)的集成或者組合,這些概念通常是通過等級評分問題來測量的,如利用李克特量表取得的變量。每一個指標(biāo)的集合(或一組相關(guān)聯(lián)的指標(biāo))就是一個因子,指標(biāo)概念等級得分就是因子得分。
因子分析在市場調(diào)研中有著廣泛的應(yīng)用,主要包括:
(1)消費者習(xí)慣和態(tài)度研究(U&A)
(2)品牌形象和特性研究
(3)服務(wù)質(zhì)量調(diào)查
(4)個性測試
(5)形象調(diào)查
(6)市場劃分識別
(7)顧客、產(chǎn)品和行為分類
在實際應(yīng)用中,通過因子得分可以得出不同因子的重要性指標(biāo),而管理者則可根據(jù)這些指標(biāo)的重要性來決定首先要解決的市場問題或產(chǎn)品問題。