- 評鑑概念的發展:
泰勒和寇力(Taylor & Cowley, 1972)將評鑑概念的發展分為三期:
- 評鑑等於標準化測驗(1930年以前)
- 以試用發展中的方案為主要的評鑑活動,關心高層次的認知目標和情意目標(1935年-1957年)
- 在「史布尼克」號發射之後(1957年)著重「評鑑模式」的發展,使其能夠適用於各種計畫和方案的評鑑(評鑑的領域由測量結果,延伸至科目的改進)
- 課程評鑑(Curriculum Evaluation)的意義
- 課程評鑑的意義
- 指個人或團體對某一事件、人物或歷程的價值判斷歷程
- 有系統的評估某一對象的價值或優缺點
- 評鑑人員蒐集有關課程的資料,用以判斷課程的優劣價值
- 判斷學習經驗是否已達預期教育目標的歷程並辨別課程設的優劣
- 課程評鑑強調的重點
- 評鑑是價值或優點的判斷
- 評鑑包含對現「質」的描述和「量」的描述
- 評鑑是為了做決定
- 評鑑不只是可針對個人的特質,也可針對課程方案或行政措施
- 課程評鑑意義之類別
- 視為成就表現和特定目標間的符合程度
- 視同為教育測量和測驗
- 視同為專業人員判斷,針對課程的優缺點或價值,加以評估
- 視為蒐集與提供資料,讓決策人員從事有效的決策
- 視為一種政治活動,不僅檢視課程的效率及管理課程問題,也理解評鑑所涉及的道德及美學涵義,並探討人會從評鑑獲益
- 課程評鑑的範圍
- 課程評鑑的範圍
- 課程是內容大綱、範圍順序或課程綱要等
- 課程是學生的學習經驗
- 課程是學習的具體目標
- 課程方案在不同發展階段的評鑑方式:規劃、實施、考核、追蹤
- 規劃:在規劃一個新的課程方案時的評鑑
- 實施:在新的課程方案時實施階段的評鑑
- 考核:在新的課程方案時實施時進行考核的評鑑
- 追蹤:在新的課程方案完成後,進行效果追蹤的評鑑
- 評鑑的功能
- 艾斯納(Elliot W. Eisner)認為課程評鑑的功能:蒐集、診斷、預測、建議、決定
- 評鑑的功能
- 需求評估
- 缺點診斷
- 課程修訂
- 課程比較
- 課程方案的抉擇
- 確定目標達成的程度
- 績效判斷
- 課程評鑑的步驟:泰勒 (Ralph Winfred Tyler)明確的指出評鑑學習經驗歷程的八個程序步驟
- 界定目標:擬訂學校教育目標
- 指出情境:指出學生學習的機會、引導學生表現目標行為的情境,以便觀察目標的達成程度
- 檢查現成的評鑑工具:將擬進行評鑑的工具和行為達成的目標相核對,了解此工具是否可到引發目標行為的各種情境
- 選擇或編製評鑑工具:檢視現成工具可能產生的結果
- 發現可靠、適用、適合某目標,且令人滿意的工具,且加以採用
- 修訂
- 重編製
- 試用評鑑情境:
- 記錄情境行為:
- 決定評鑑用語與單位:
- 決定三規準:決定評定等第或總結摘要敘述方法的客觀性、信度與效度
- 課程評鑑的類型
- 目標本位的評鑑(Goal-based Evaluation):測定教育目標在課程與教學的方案中究竟被實現了多少的歷程
- 泰勒 (Ralph Winfred Tyler)將評鑑定義為「目標達成的程度」
- 和社會行為主義取向與科技主義取向的課程設計意識型態相關
- 界定目標的方式:「二元分析表」─以學生的行為及內容界定目標
- 形成性評鑑(Formative Evaluation)與總結性評鑑(Summative Evaluation)
- 史克立芬(Michael Scriven)認為目標本位的評鑑會窄化學習結果,忽視潛在課程,因此主張評鑑人員不應受到課程目標的控制
- 課程評鑑是一種教育的構思設計
- 形成性評量形成性評鑑發生於課程「形成」的過程,包含需求評估、方案設計、課程實施和推廣規劃、師資進修等項目,目的在提供課程設計人員改進的方向
- 總結性評量通常發生於課程草案或原型定稿或定型之後,以決定其教學目標達成的程度與教學目標訂定的適切性
- 形成性評鑑和總結性評鑑的差別正如史鐵克(Robert Stake)所言:「當廚師在嘗湯的味道時,那是形成性評量;當顧客在喝湯時,那是總結性評量」
- 結果本位的評鑑(Outcomes-based Evaluation):是最低底線或清算結帳式(pay-off)的評鑑,著重學科目的或學科知識目標的結果
- 狹義:只著重在學科課程目的,或學科知識目標的結果,由於各課程的內容並不相同,因此比較各學科課程間的狹義結果並不適當
- 廣義:指評鑑的觀點遠超越正式課程目的或學科教育目標,以提供學科課程的主要作用(主要預期的結果)與副作用(過分強調課程某一部分或評鑑部分的偏見)的訊息
- 歷程本位的評鑑(Process-based Evaluation):又稱內在評鑑(Intrinsic Evaluation ),以課程評鑑為工具,用以說明課程目標、內容、教師訓練的要求
- 和經驗主義取向與教學專業取向的課程設計意識型態相關
- 史鐵克(Robert Stake)以先在因素(Antecedents)及交流因素(Transactions)說明以教育歷程為依據的內在評鑑:
- 先在因素(Antecedents):相關的背景資料、情境條件,如:學生特性、教師特性、政府命令、社區期望、可用的資源等
- 交流因素(Transactions):教學過程中,學生與學校的其他人物或教材發生互動時,即產生交流因素,如:閱讀課與圖書館員的互動、與同學間的互動、教室討論、家庭作業等
- 歷程本位評鑑可以補充目標本位的評鑑與結果本位的評鑑的不足之處
- 缺點:未能適切描述結果因素
- 結果因素(Outcomes):教學實施後的影響
- 測驗本位的評鑑(Test-based Evaluation)
- 與科技主義的課程設計意識形態相關,十分關心學生學習的具體行為結果
- 測驗是監控學生學習進步並診斷學生需要的基本科學工具,測驗結果則是學習結果的代表
- 測驗:是一套具有預定正確答案的問題,此設計乃在於蒐集個人特質的資訊,如成就,依答對題數給予計分
- 量表(Scale):是指未具有預測正確答案的問題,用以測量態度、興趣、價值、信念與行為等特徵,如艾斯納(Elliot W. Eisner)的課程理論取向量表
- 標準化(Standardized):指測驗或量表若在一致標準的情境中或步驟程序加以實施計分,不受到施測情境的影響,稱之為標準化的測驗或標準化量表
- 測驗編製的步驟(Tyler, 1949):
- 擬訂課程目標
- 以學生行為界定目標
- 蒐集情境資料,指出學生表現或缺乏該種目標行為
- 把情境呈現給學生
- 以每一個目標來評鑑學生的反應
- 決定評鑑的客觀性
- 必要時改進客觀性
- 決定信度
- 必要時改進信度
- 必要時發展出更實用的評鑑方法
- 評鑑方法:
- 安置測驗:一種於教學前實施的測驗,目的在評量學生起點行為,以便將學生安置在適當的教學計畫中
- 診斷測驗:一種於教學過程中實施的測驗,目的是確定學生學習困難的原因,以作為補救教學的依據
- 總結性測驗︰通常在教學結束後實施,以確定教育目標是否達成,並評定成績
- 常模參照測驗:將個人測驗分數與外在的參照團體分數作比較,如:段考成績排名、心理測驗原始分數轉換成標準分數或是百分等級(percentile rank, PR)
- 缺點: 無法瞭解學生實際學會什麼能力
- 效標參照測驗:是將個人分數與預定的標準比較,如汽車駕照考試,以學生表現是否精熟決定是否及格
- 缺點:實際上對教育的幫助不大,因其注意焦點為最低通過能力,而不是能學多少
- 缺點:測驗本位的評鑑是一種十分技術性的工作,評鑑焦點狹隘且瑣碎,並無法真正考驗學生在實際生活當中利用知識的能力
- 統整評鑑(Integrated Evaluation):為經驗取向的評鑑方法,借用來自人類學、心理治療、認知心理學、社會語言學的理念與觀點,而不受限於行為心理學或心理學測量的技術
- 和經驗主義取向與教學專業理論取向的課程設計意識型態相關
- 俗民誌方法(Ethnography) :從人類學借用 ,是一種蒐集現場紀錄的方法,評鑑者置身於參與觀察的角色,從圈內人的觀點來理解分析教室環境的意義
- 會議方法(Conference Methods) :從心理治療借用,鼓勵自我評鑑,其基本假定認為如果個人沒有一種欲圖改變的信念,就不可能達成個人改變
- 寫作會議(Writing Conference) :教師置身於學生支持者的立場
- 晤談法:從認知心理學借用,包括臨床診斷晤談,以瞭解學生思考歷程的深層理解
- 臨床診斷晤談(Clinical interview):利用問題、情境或疑難等工具,探究學生的概念、推理形式、信念與態度
- 研究方法:借用自社會語言學與社會認知,蒐集行為的自然樣本,其基本假定認為任何歷程的情境脈絡皆會影響到目標及其評鑑
- 統整評鑑的特徵:
- 成長導向(Growth Oriented):統整評鑑乃在促進學生的成長與發展,以協助學生自我實現
- 學生控制(Student Controlled):強調學生的主體性,尊重學生的個人風格、自信、自控,且學應承擔相當的責任義務
- 共同合作(Collaboration):參與的師生從頭到尾皆能分享資訊
- 動態過程(Dynamic):學生的學習進步應該是一種持續的歷程
- 脈絡情境化(Contextised):學校環境的細節有助於學校整體與學生經驗的累積
- 非正式的(Informal):比起測驗本位的評鑑教不正式
- 彈性與行動導向(Flexible and Action-oriented):長短期的目標是動態的,統整評鑑相似於為了決定而作的評鑑,偏向於行動導向的評鑑
- 統整評鑑的出現在於檢討測量本位的評鑑過於簡化評鑑結果及無法解決根本問題的缺失
- 批判本位的評鑑:評鑑並非獨立於課程建構的過程,參與者應有絕對的控制和發言權,隱藏著一套社會所接受並用以判斷教育與學校課程優劣的意識形態與政治道德規則的假設
- 鑑於測驗本位的評鑑與統整評鑑共同的問題─保守的意識形態
- 保守的評鑑只注意個人問題,忽略學生分班分級等團體組織或制度結構的問題
- 甘美思(Stephen Kemmis)提出批判本位評鑑的三個階段:
- 提出問題
- 以一架構整理不同而衝突理論觀點
- 行動階段
- 舉例:美國學校將學生透過「診斷」的方式「標記」出「文化不利兒童」或「經濟不利學生」,並進行特殊教育程式。這便是一保守的處置觀點,因為真正造成問題的可能是更大的社區或社會上的問題
- 真實評鑑(Authentic Evaluation):著重實務生活世界的真實任務工作等學習目標與任務,引導教師協助學生思考與解決實際生活問題,並在生活統整所學的知識與技能
- 建立在比較非學術化科目的學習成就標準的基礎之上,如演奏會、體育競賽等
- 三種主要的形式:
- 紙筆工作(Paper-and-Pencil Task)
- 表演(Performance)
- 作品集(Folios):可分為作品歷程集(Process Folios)與作品成果集(Porfolios)
- 交流評鑑(Transaction Evaluation):指教育評鑑人員將課程方案或實驗試用過程當中的資料,提供課程設計人員,做為回饋的改進依據之一種評鑑途徑
- 強調教育評鑑人員與課程設計人員之間不斷交互作用與回饋互補的歷程,有教室觀察、個案研究、訪談
- 主要參與人員:教室中進行課程實施的教師、教校中的其他相關教師或行政人員,及地方或中央的教育行政與教育視導人員,或政府委託的教育評鑑專家
- 教師可以是課程設計人員,也可以擔任課程評鑑人員
- 麥唐納(Barry MacDonald)的政治觀點評鑑類型:
- 科層體制式的評鑑(Bureaucratic Evaluation):接受政策決定者的既定目標,為執政者提供所需的資料
- 專業自律式的評鑑(Autocratic Evaluation):課程評鑑人員根據倫理道德與科層體制分工的專業制度規章,作成獨立的客觀判斷,並強調評鑑專業人員的原理原則或執業標準與信條
- 民主多元式的評鑑(Democratic Evaluation):課程評鑑人員扮演資訊的仲介者,強調雙向溝通的重要性,評鑑人員要重視聽讀者對資訊的需求,確認社會價值與利益的多元化
- 課程評鑑的模式
- 泰勒評鑑模式(Tyler's Evaluation Model):是一種目標本位的評鑑(Goal-based Evaluation)、目標導向模式(Goal-attainment Model)的典型代表,係由1942年泰勒在美國對中等教育所作的「八年研究計劃」的評鑑方案中,所設計發展出來第一套的課程評鑑方法。其精神在預定目標並檢視目標是否達成
- 泰勒評鑑模式程序包括入下的步驟:
- 擬定一般目標(Goals)或具體目標(Objectives)
- 將目標加以分類
- 用行為術語界定目標
- 尋找並建立能顯示具體目標達成程度的情境
- 在某種情境下,向參與課程方案有關人員解釋評鑑策略的目
- 選擇或發展適當的評鑑技術和方法
- 蒐集學生的行為表現資料
- 將蒐集到的資料與行為目標進行比較
- 故目標是泰勒評鑑模式評鑑時的出發點,也是判別課程設計成敗的主要標準。如果目標能夠達成,課程方案便屬成功,否則便屬失敗
- 優點:將評鑑的焦點從學生的評量轉移到課程方案的目標達成程度,擴大課程評鑑的對象與內容範圍
- 缺失:受預訂目標的束縛,忽略未預期的目標,更忽略隱含不明的學習歷程與教情境中師生互動的教學歷程。不適用於「欣賞」、「沈思」等不易用具體目標界定的認知領與情意領域的學習
- 差距模式(Discrepancy Model):旨在比較「標準」與「表現」,分析兩者的差距,以改進課程方案
- 由普羅佛斯(M. M. Provus)所提倡
- 三種類型的標準:預期結果、先在因素、過程
- 評鑑程序
- 界定課程方案的標準
- 確定課程方案各層面和有關「標準」之間是否有差距
- 使用些一差距資料,改變表現或課程方案的「標準」
- 五個階段
- 設計階段:界定課程方案之標準
- 裝設階段:裝設的方案與原先計畫的符合程度
- 過程階段:中間目標是否達成,判斷是否需要調整
- 產出階段:最終目標是否達成,產出前三階段實際造成的結果
- 比較階段:又稱「成本效益分析」階段,比較其他和當前完成的課程方案
- 優點:強調「標準」,矯正以往評鑑人員只重視課程方案之間的比較,忽略該課程方案內容,避免不夠明確的缺失;可幫助課程評鑑人員作成決定,以進行下一階段的工作
- 缺點:方案的比較階段,不易找到其他相當的課程方案進行兩者的成本效益之比較
- 外貌模式(Countenance Model):課程評鑑兼具描述和判斷的成分,並蒐集先在因素、過程因素或交流因素、以及結果因素的資料
- 由史鐵克(Robert Stake)所提倡
- 外貌(Countenance)的意義,是指評鑑的外貌,是評鑑的整體面貌、輪廓
- 先在因素:學生與教師、學科材料互動前先前存在的情境條件
- 交流因素:或稱過程因素,學生和教師、教材、輔導諮商人員等要素互動時所產生,例如:參觀訪問、班級討論、影片欣賞
- 結果因素:課程方案透過教學實施之後所達到的影響,例如:學生習得的能力、成就、態度或抱負
- 優點:利用描述和判斷的資料,可了解課程方案的理論基礎,並了解其背景及目的,以評鑑其教育理想意圖與實際現象的一致性與關聯性
- 限制:協調教育科技專家、測驗專家、心理學者、教師及人類學者進行協同研究與評鑑,有其實際困難
- CIPP模式:旨在描述、取得及提供資料,以判斷各種課程方案,評鑑的目標在於改善(Improve)而不是在證明(Prove)
- 由史塔夫賓(Stuffbean)提倡
- CIPP評鑑模式
- 背景評鑑(Context Evaluation):旨在提供確定課程目標的依據,屬最基本的評鑑,以促成計畫的決定
- 輸入評鑑(Input Evaluation):旨在確定如何運用資源以達成課程目標,包括課程資源的選擇、設計與發展,資源涵蓋材料、設備、程序、方法、人員、環境等,用來協助設計教學程序的決定
- 過程評鑑(Process Evaluation):旨在課程資源設計完成,付諸實施時即可開始,目的在於提供定期回饋給予負責課程方案實施工作人員,可協助使用、追蹤、改進程序的決定
- 成果評鑑(Product Evaluation):旨在了解教育系統所獲得的課程結果是什麼,以協助課程決策人員決定課程方案是否應告一段落停止、修正或繼續運作;用來判斷教學效果並予以反應的決定
- 對辯式模式(Adversary Evaluation):又稱司法式評鑑在課程評鑑中,成立彼此相互對立的原告與被告的正反方辯論團體,應用司法審判的組織和程序,令其對同一課程問題,呈現不同的課程主張
- 由歐文斯與伍爾夫(T. R. Owens & R. L. Wolf)所倡導
- 實施程序
- 計畫:旨在產生課程爭論問題,並進而選擇課程爭論問題,以準備辯論
- 聽證:在開課程聽證會議之前,由每一課程評鑑小組彼此審閱主要的論點,並在課程聽證官協調下,建立課程聽證規則和程序
- 優點:促成課程政策的公開討論、採取獨特的口頭報告形式、提供各種可用的資料、促進課成發展與設計工作的評鑑
- 缺點:不易找到勢均力敵的對辯雙方,且課程決策人原的偏見易造成錯誤判斷,加上辯論的求勝心態與犀利的言詞會造成解決問題的阻礙,加上參與人士較多,經費開銷大
- 不受目標限制的評鑑模式(Goal-free Evaluation):評鑑時不要先把目標放在腦中,可評鑑到沒有預期的目標;評鑑者應不要事先知悉方案的目標,才不至於忽視方案帶來的其他效應,特別是相反的副作用
- 由史克立芬(Michael Scriven)所倡導
- 具有補充作用
- 評鑑者是沒有偏見的觀察者。所採用的資訊,具有品質客觀
- 評鑑者蒐集資料時,毋須考慮其是否與整個方案預定的效果有關
- 屬於總結性評鑑,以消費者為導向,不提供課程計畫者有用的形成性資料
- 以整個課程相關事務為範圍來進行評鑑,在評鑑課程的過程中,只要想到與課程有關的事項,就可以納入評鑑,而非僅針對事先提出的評鑑目標或表格進行評鑑而已。這就好像餐館老闆並不事先訂定特定的評鑑表,在評鑑廚師所做的菜時,凡是與做菜相關的問題,想到什麼就提出什麼,非常自由
- 闡明式評鑑:闡明式評鑑目的是在倡導人類學研究典範,藉以照亮複雜的教育現象,提供決策所需的資料。重視教學系統(他們認為不論任何教學系統或方案都不是片斷的存在,不可以片斷地描述)和學習環境(學習環境是多元的有文化的、社會的、機構的和心理的變項在作用),因此要整體地評鑑課程方案。闡明式評鑑要發現並記載師生參與的經驗,也要洞察和討論革新方案最重要的特點,以及其中反覆出現的副作用和重要過程
- 由帕雷特與哈米爾頓(Parlett & Hamilton)提倡
- 闡明式評鑑提倡者認為傳統的評鑑有五大缺點:
- 脫離實際教育情境
- 假定課程方案具持久不變性
- 獨斷地限定研究範圍
- 忽略特殊的教育現象
- 忽略各角度的關注和問題
- 評鑑方法有觀察、晤談、問卷和測驗、文件分析
- 實施程序
- 觀察(Observation):評鑑者的觀察
- 探詢(Inquiry):由探索的焦點中選擇進一步觀察的焦點
- 解釋(Explanation):分析各種教育現象有無共通原則?有哪些因果關係?為何會產生這些現象?為何教師對教材會有不同的態度?
沒有留言:
張貼留言