1. 抽樣與代表性

上一課談到抽樣和代表性的問題。要明白抽樣的意思是什麼,必先辨別母群 (population) 和樣本 (sample) 兩個概念。母群是探究的全體對像,樣本則是通過科學程序,實際抽查之對象。

例子 題目 母群 樣本
1 香港中學生對校規的看法 全香港所有中學生 來自10間香港中學的100名學生
2 來自國內之新移民所遇到的歧視問題 來自國內的所有新移民 20個來自國內的新移民
3 香港報章如何報導西藏事件? 有關西藏事件的所有香港報章報導 兩份香港報章於15/3/08至23/3/08間,有關西藏事件的新聞報導

問題是,我們應以什麼準則抽取樣本?以上表為例,我們如何能確保所抽選的100名中學生確能反映全港中學生對校規看法之差異分佈?來自不同年級、性別或成績組別的學生會否在這問題上有顯著的差別?來自不同階層和語言區域的新移民的歧視經驗又會否不同?持不同政治傾向的報章又會否在報導上有系統性的分別?

我們須在探究初階儘量充實我們對這方面的認知,在抽樣時進行適當的程序,以減低任何削弱代表性之偏差。科學抽樣方法主要分機率 (probabilistic) 和非機率 (non-probabilistic) 兩類,基本概念是要增加隨機性 (randomness),儘量減低個人偏見 (bias) 或盲點導致的資料來源偏差。量性分析採用的主要是機率抽樣。在這種情況下,母群中每個成員被抽選的機率是一致,並可計算評估。

例如,我們本能地想先訪問面帶笑容的行人,但由於性別上的偏差,結果可能是大比數地訪問了更多女性。要減少這方的問題並不困難。我們可定下一些簡單的規矩,如每隔五個路人訪問一個,逼使自己減少以貌取人可能帶來的偏差。又假設我們在校內進行訪問,我們可考慮每個級別隨機抽選一班,然後每班內再隨機抽選若干受訪同學。這樣有系統地逐層進行抽樣,遠較隨意在大堂訪問步過的同學來得有代表性。另外,如同學一早已鎖定某些重要的第三變項(如性別),更可如第二課中的例子般,把相關的母群一早分開兩個次類別抽樣。這樣便能更準確地測量目標的相關關係,令結論效度更高。在實際探究中,機率抽樣並不一定可行。在這些情況下,探究員只能進行非機率抽樣,根據便利原則或個人判斷去盡量強化資料的代表性。

有關各種抽樣方法的詳細討論和示範,以及量性和質性抽樣之主要分別,可瀏覽以下連結:

   
1, 2, 3, 4
5
6, 7