
第三節 主要結果
一、測試結果
學生的普通話水平通過卷I和卷II兩方面評估。卷I主要是考核聆聽能力和學生對普通話所記錄的現代標準漢語在語法、詞彙、語音等方面的認識,採用了G檢驗統計分析;卷II主要考核學生的朗讀和說話能力,由國家級普通話測試員就學生的表現評分。
結果學生在卷I的平均得分是54.86分,正確率達45.72%,表明測試卷難度適中;預期標準差為17.93,實際標準差為17.91,範圍為113,表明得分分佈均勻。總體而言,得分分佈呈正偏態,顯示這個測試是評估中學低年級學生普通話能力的可靠工具,標準誤差為+4.9。
卷II考察學生的朗讀和口語表達能力,這部分屬於主觀題型,為了保證評分的公平準確,每份試卷都由三位評卷人評分。
二、普通話等級描述
香港人最熟悉的考試相信就是中學會考了。中學會考的其中一個重要目的,是在高等學位缺乏的情況下選拔優秀的學生升學,考試只要能達到分辨學生優次的目的就可以了,因此在很長的一段時間裏,中學會考都採用「常模參照」的模式,個別考生的成績只顯示他在整體考生中的相對位置,而並非反映特定的能力。過往會考科目一直沒有等級描述,就因為每年的等級主要是根據當年考生的成績分佈來劃分的,例如每年成績最好的5%就評為A級,但是年與年之間的A級可以有不同的分數,也就是說不同年度的同一個等級可以有不同的能力內涵。一直到了2007年,中學會考改為標準參照,考生成績的評定是根據先前所訂定的標準而決定的,只要不同年度所依據的標準相同,考試當局就可以根據所定下的標準為各科提供等級描述了(香港考評局,2009)。
那麼在制定等級描述的時候,研究人員需要考慮些甚麼因素呢?我們知道,通過測試工具來評核一個人的語言水平,情況跟用工具來量度事物的屬性相似。在社會科學裏面,「量度」一般是指根據一定程序和規則對一個人(或一種社會現象)的特性加以量化的過程。這當中牽涉三個因素:量化、特性、程序和規則。量化牽涉到數字的標示,例如我們可以用數字標示一個人的身高或體重;但是並非所有人類的特性都可以用數字來標示,尤其是當我們談到能力的時候,就很難訴諸於數字,更何況有些能力(例如認知能力)是難以直接觀察的(Bachman, 1990)。有學者建議我們可以通過一些智力活動或任務來量度一個人的認知能力或心理能力,因為我們一般人都同意認知能力高的人可以完成比較複雜或困難的智力活動。因此,通過設計不同複雜程度和難度的智力活動讓受試者完成,就可以測試出他們所具備的智力水平(Carroll, 1987)。
此外,程序和規則在量度特性時也至關重要。對於一些複雜的特性,例如語言水平,不同人可以針對不同語言技能、採用不同方法、使用不同工具來對另一個人的語言水平作出評價,因此要評核學生的普通話水平,我們就必須界定清楚所要考核的是哪些方面的語言技能、包含哪些指標、採用的是甚麼量度單位、依據的是甚麼標準,而制訂等級描述時,也必須把這些方面都交代清楚,才能比較立體地描述應試者的語言能力。
就目前我們所見的一些普通話測試來說,對於等級描述的處理各有不同。比較常見的方法是用比較的方式陳述不同等級能力在同一種技能上的不同表現,例如描述口語能力的時候,優異等級是「具備較好的口語能力,能適應一般專業的語言環境,並能順利地達到交際目的。具備較好的普通話語感,熟練地使用規範語句,句式變化較多。」而取得良好水平的,則是「具備基本的口語能力。基本能適應一般的語言環境,基本上能順利地達到交際目的。稍具普通話語感。發音基本正確。能使用規範語句,句式有變化。」(考評局,2010)
誠然,語言能力內涵複雜,要精確地描述具備不同語言能力的人具體有些甚麼表現、級別與級別之間到底有何差異,而這些差異又如何量度,實在不容易。用比較的方式來描述差異,是一種可以考慮的方法。不過,因為這些比較級的形容詞沒有具體的標準,因而何謂「較好」、何謂「基本」,不同人可以有不同的理解。這樣的等級描述實際的作用也就不大了。
為了提供比較具體的說明,有些等級描述還包括每個等級的分數要求。對於分數的表述有兩種方式,一種是得分率,一種是失分率。而與失分率相呼應的,則是根據應試者語言表現中的失誤情況來評定高低,例如說話時是否有方言語調、語法詞彙是否不規範等。國家語委的PSC等級描述就採取這種方法,以下是PSC二級乙等和三級甲等的描述:
二級乙等(測試得分:80分-86.99分之間)朗讀和自由交談時,個別調值不準,聲韻母發音有不到位現象。難點音失誤較多。方言語調不明確。有使用方言詞、方言語法的情況。
三級甲等(測試得分:70分-79.99分之間)朗讀和自由交談時,聲韻母發音失誤較多,難點音超出常見範圍,聲調調值多不準。方言語調較明顯。詞語、語法有失誤。
這大概跟PSC的考試目的相關。PSC要求專業人員能充分掌握標準的普通話語音,因此立足於最高標準,量度應試者離這個標準多遠,因而評分採取扣分制,描述應試者表現的時候,也比較着重其偏離標準的地方。
為香港學生制訂普通話測試,目的跟PSC應該有所不同,着眼點應該在於學生通過學習過程,掌握了甚麼範圍的普通話詞彙、句式,能夠理解甚麼類型的普通話話語,可以使用普通話發揮甚麼語言功能,其普通話表現出一種甚麼樣的面貌。普通話作為一種目標語,是學生通過學習逐漸建立起來的,因此對其能力的評定,應該是從他們建立了多少、掌握了多少,而不是他們甚麼做不到、甚麼做不好來判斷的。也就是說,作為語言水平測試的等級描述,應該是正面描述應試者能顯示的水平,而非他們犯錯的地方。不過到了能力等級較低的時候,由於應試者對普通話掌握不足,所以其普通話中介語仍然帶有濃厚的母語色彩,因而難免要使用小量反面的描述。
此外,我們還希望相關的等級描述可以為考生提供比較具體的信息,因此盡量避免空洞的比較式形容詞;在無可避免抽象說明的時候,盡量加入一些量化的信息幫助說明,例如說明應試者應對不同話語內容能掌握的詞語範圍、能應付的聆聽材料的語速,以及不同項目的得分率。通過這些輔助信息從不同側面來為應試者的普通話能力水平作出定量和定性的描述(見表2.5,頁50),相信可以為考生、學校和用人機構提供比較具體而全面的說明。
三、根據等級描述劃定的學生普通話水平等級
(一)等級分佈
制訂好等級描述以後,研究小組根據等級標準為參與測試的611名學生評定其成績。成績共分為九等(一、二、三、四、五、六、入門一、入門二和不入等),九個等級也可以重新組合為五級(A、B、C、D、X)。
表2.3:測驗得分等級分佈

結果表明,611名學生當中,有18人(A和B級,佔2.95%)成績優秀,189人(30.93%)表現良好(C級),291人(47.63%)處於入門水平,佔總數最多,113人(18.49%)無法以普通話交流。這個結果顯示初中三年級的學生接近五成可以用簡單的普通話進行溝通,而三成學生更加可以使用普通話應付一般的學習和社交活動,並且能應付某些語體的基本需要,普通話運用體現出一定程度的多樣性和得體性。這個成績比起一般大學生還要好。
(二)有關學生語言背景和學習經歷的問卷調查
問卷結果表明,學生背景和其普通話能力有密切關係。
表2.4:學生語言背景和學習經歷問卷結果

* 有少數學生的家庭語言不是粵語和普通話,而是其他方言(如福建話),故在家說粵語和普通話的人數相加佔研究總樣本的比例可能不是100%。
表2.4的A、B、C、D、X代表普通話能力水平由高至低排序。以個人背景為例,A列代表普通話能力優秀的學生,第一格內的「50%(1)」指「在獲得A級水平的2名學生中,有50%(1人)在香港出生」。表格內其他數據均以此方式解讀。
個人背景部分的數據顯示,普通話能力越低,出生於香港的比率越高;能力越高,出身於中國內地的比例越高。這表明兒時開始學普通話的學生在普通話能力的發展方面有優勢。此外,接觸和使用普通話的機會多,自然也就越能提升普通話的水平,因此不論是家庭用語還是學校用語,只要使用比例高,學生的普通話水平也會比較高。不過,除了兩位母語為普通話的A級學生外,其他學生對自己使用普通話的能力認識不足,信心不強。如果教師家長可以多給予正面肯定,相信可以幫助學生增加學習普通話的信心,提高學習普通話的動機。