沒有「一百分」的考試

紐西蘭的國民義務教育有13年。15、16歲之前的學生,約是台灣的國三畢業生,在紐西蘭受教育,其實是沒有很大的「升學」壓力。相較於在台灣,有升高中與升大學這兩個大型的考試關卡。紐西蘭的學生則是從Year 11開始,約為台灣國三或高一的年紀,連續三年,每年都要接受全國性的評量,所謂的「NCEA評量」。


NCEA是The National Certificate of Educational Achievement(教育成就國家證書)的縮寫,從1997年開始計畫,於2002年開始Level 1的評量,之後於2003年與2004年陸續開始Level 2與Level 3的評量。至此,NCEA算是正式上路,是紐西蘭一系列教改的產物之一,也是紐西蘭獨創的教育品牌。

starNCEA源自於對「分數」含義的反思

NCEA的設計,是出自於對「分數」的反思:在傳統的制度上,學生在學期末的成績單上會得到一個分數,例如物理80分。然而,這個數字透露出怎樣的訊息呢?除了知道它比90分低,比70分高之外,還有哪些有意義呢?舉例來說,一位物理拿80分的同學,他比較適合機械系或是光電系呢?
簡單來說,NCEA就是紐西蘭高中生三年的成績單。這份成績單的內容,不僅僅是一堆數字,而更像是一份「學習歷程表」,詳細地記錄著學生在高中三年的學習成就。以英文(這裡的國文課)為例,未來的雇主或大學教授在選才時,可以清楚地看出來,一位「英文好」的學生是口才好,還是文筆好?而文筆好的同學,專長是在論說文或抒情文?是擅長寫詩或是寫小說等等。

評量的具體做法是,由紐西蘭資格審定局(NZQA)負責,依據課綱的學習領域,把每個科目中,學生需要學會的知識或技能,具體的列出各個「成就標準」(Achievement Standard),再依據這些成就標準的性質,決定評量的方式,以及每個評量的學分數(credit)。評量的方式有兩大類,一是在平時在學校內部舉行的考試,稱為「內部評量」(Internal Assessment),例如英文課的演講或讀書心得報告,音樂課的演奏,戲劇課的表演,物理的實驗或研究報告等;另一類在年底時舉行的全國性考試,方式就是傳統的紙筆測驗,稱為「外部評量」(External Assessment)。

NCEA的名稱很簡單,就是Level 1,Level 2與Level 3。紐西蘭國家規定,學生至少需要修畢NCEA Level 1(取得80個以上的Level 1學分)才可以離開中學,去就業或是就讀其它職業學校或大專院校。換句話說,很多學生在讀完Year 11之後,便離開中學了。

star沒有「一百分」的考卷

紐西蘭其實是個很講究「甜言蜜語」的國家,回想我剛在這裡開始寫教師評語時,印象最深刻的就是要如何跟家長「告狀」,譬如說,對於上課愛講話的同學,我們說他「傾向於在不恰當的時機進行社交活動」,對於成績不好的同學,則是說他「潛力還沒有完全發揮」。另一方面,一些稱讚學生的用語,例如:Wow、How smart、Awesome、Good boy/girl等也逐漸成了我的口頭禪。

至於考卷的成績,則不是一個冰冷的數字,而是分為NA、A、M與E四級,分別代表:不及格(Not Achieve)、及格(Achieve)、優秀(Merit)與卓越(Excellence)。如果你稍微留意,這四個等級之中,表達「負面」訊息的只有一個,另外三個都是說「正面」訊息。
接下來,我以去年Level 1 Science的一道力學試題為例,約為台灣國三或高一基礎物理的程度,跟大家分享這裡的考試方式,以及紐西蘭獨創的教育品牌NCEA的評量方式。

問題:游泳池
小明和小華準備跳水。
a.  小明從2 m 高的跳板跳水,0.6 s後抵達水面,他的平均速率為何?
b.  小明(48 kg)在爬上2 m高的跳板之後,共做了多少功?
c.  小華的質量為52 kg。與小明爬上2 m高的跳板相比,為什麼小華爬上5 m高的跳板,所做的功會較大?(此問題不需要計算)
d.  小華從5 m 高的跳板跳水進入游泳池。計算小華在剛剛抵達水面時的速率大小(假設能量守恆)。你的答案應該包括:
· 寫出小華在跳水前所具有的能量名稱,以及他在剛剛抵達水面時所具有的能量名稱。
· 計算小華在剛剛抵達水面時的速率大小。
e.  解釋為何小華在真正跳水時,抵達水面時的速率會較你在(d)小題計算的結果。


為方便讀者閱讀,我只把題目中的人名Chris改成小明,Ian改成小華,其餘則是全文翻譯。讀者可以拿一張白紙,以15-20分鐘為限,先試著回答這一道試題,再對照稍後的評分標準來評分,親身體驗一下紐西蘭的高一物理試題。


star錯綜復雜的階段給分法
這整份力學試卷共有三大題,以A4大小印刷,每頁含試題與答題空間(參見附圖一),含封面以及最後兩頁的額外答題空間,共有15頁,正文部分含題目與答題空間共12頁,因此,每一份紐西蘭的試卷都是「一本小冊子」(參見附圖二)。

附圖一:力學試題範例
     附圖一 力學試題範例  
附圖二:每一份試卷都是一本小冊子
 附圖二 每一份試卷都是一本小冊子
 

評分標準與我們常見的「解答」不同,而是根據每道子題的難易程度,明確地制定出分段給分的的標準,其中的「且」與「或」則是評分時需要特別注意的關鍵字。

表格中的「證據」是指「顯示理解的證據」,類似一般所謂的解答。當然,我們都知道正確的解答與思路往往不只一種,所以老師或閱卷人會有自己專業上的判斷,對於有疑義的部分,則要特別挑出來,再找另一位閱卷人獨立閱卷;這個過程稱為「複審」(Moderation)。
這個複審機制,不僅限於年底的國家考試,包括我們在學校進行的內部考試,在任課老師初次閱卷之後,都會由各科負責人召開複審會議,老師之間會針對有疑義的試卷,互相協調評分的標準。依照評量的等級,每個班級會以亂數產生一份名單,抽樣挑出試卷,依規定送給外校不認識的老師,或是送到紐西蘭資格審定局進行複審,以確保全國的評分標準是統一的。內部評量的試卷,要在學校的檔案室內保存三年,以備抽查複審之用。

每一個題目依難易程度,會有不同的得分等級,以此題為例,(a)小題最多只能得到A;(b)與(c)小題則依學生回答的內容,分段給分,部分正確的為A,完全正確的為M;(d)與(e)小題類似,也是分段給分,最多可獲得到E,如表一。

 

表一
表一 評分標準


這一題的總成績計算方式是:如果學生拿到二個E,得分是E8,這也是這一題的滿分。二個E,但其中有一個小錯誤,則是E7。拿到三個M,得分為M6;二個M是M5。四個A是A4,三個A是A3。二個A,則是屬於不及格的N2,只有一個A,則是N1。全錯的話就是N0。摘要如表二。
表二 總成績計算方式:
 

1ul3-4


值得一提的是,M與E可以「向下」折算,舉例來說:若學生拿到四個A之後,又拿到一個M與一個E,那麼這個E可視為M,所以該題的總分為M5。如果學生拿到四個A與一個M,則因為不到二個M的門檻,只能得到A4,會與只拿到四個A的學生同分。

整份力學試卷,有三道類似這樣的題目,建議答題的時間為一個小時。每一道題的滿分都是E8。因此,整份試卷的滿分是24分,得分介於0與7之間,會在成績單上顯示NA;得分介於8與13之間,會在成績單上顯示A;得分介於14與19之間,會在成績單上顯示M;得分介於20與24之間,會在成績單上顯示E。
這份試卷的官方名稱是「展示對於力學相關問題的理解」(Demonstrate understanding of aspects of mechanics)。對於通過這項「成就標準」的同學,在紐西蘭資格審定局發出的正式成績單上,除了列出他有選修Level 1 Science之外,還會包括這項成就標準的名稱,4學分,以及他在這個成就標準上所獲得的成績(A,M或E),讓他未來的老師或雇主知道,他對於力學問題的理解程度為何,而不只是籠統的一個「高一基礎科學80分」。

star結語:為什麼要這麼麻煩?


如果您是老師,不知道你是否已經感覺到,要改這樣一份卷子的難度,這不僅不能用電腦閱卷,也不是單純的打勾或打叉就好。我剛開始學這種閱卷方式時,其實是有點「痛苦」的,然而,仔細一想,老師用這樣的態度來「審視」學生的學習成果,也是應該的,而不是只想著給他一個分數就好。

我們都知道當老師,給學生適當的「回饋」(Feed back)是很重要的。這也是每位老師都會在考試後講解考卷試題的主要理由,透過試後的檢討,我們希望學生知道自己在哪裡犯錯了,下次可以避免相同的錯誤。然而,很多的時候,學生可能知道「不要這麼做」,但卻未必知道「應該要做什麼」。這也是紐西蘭教育當局發明出來的一個新字:老師不僅要給學生Feed back,更要Feed forth。意思是,除了事後的回饋之外,事前的建議也很重要。這也就是這個「A、M、E系統」的精神:對於一位已經「及格」的同學,透過這份評量,他可以知道自己可以如何去增強、改善自己的理解,讓自己往「優秀」、「卓越」去做提升。

這個方式也為「按部就班」提供了很明確的方向。相對於比較傳統的方式,就是只提供學生一個正確的解答(這裡的E),讓學生自己去摸索出路。這樣的評量方式,可以讓學生很明確的知道自己已經理解到什麼程度,也可以知道該在什麼地方或朝哪個方向去努力。而且也是用「鼓勵」的方式,來取代「責備」的方式,讓學生知道:你已經很好了,如果你可以這樣做,就更好了!