中共中央、國(guó)務(wù)院印發(fā)的《深化新時(shí)代教育評(píng)價(jià)改革總體方案》明確指出,“創(chuàng)新評(píng)價(jià)工具,利用人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索開(kāi)展學(xué)生各年級(jí)學(xué)習(xí)情況全過(guò)程縱向評(píng)價(jià)、德智體美勞全要素橫向評(píng)價(jià)”。近年來(lái),隨著人工智能、大數(shù)據(jù)、區(qū)塊鏈等新一代數(shù)字技術(shù)的教育應(yīng)用,在實(shí)踐探索中形成了無(wú)感式數(shù)據(jù)采集、多模態(tài)數(shù)據(jù)融合處理、智能化診斷分析、即時(shí)性精準(zhǔn)反饋等新樣態(tài),為破解教育評(píng)價(jià)難題提供了新的可能。在教育數(shù)字化轉(zhuǎn)型的背景下,如何發(fā)揮新一代數(shù)字技術(shù)優(yōu)勢(shì),推動(dòng)教育評(píng)價(jià)理念與方式的“迭代升級(jí)”,切實(shí)扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向,為教育高質(zhì)量發(fā)展保駕護(hù)航,是一個(gè)必須答好的時(shí)代課題。
一、數(shù)字技術(shù)是新時(shí)代教育評(píng)價(jià)的變革因子
回顧歷史,教育評(píng)價(jià)經(jīng)歷了漫長(zhǎng)的發(fā)展過(guò)程。早在西周時(shí)期,我國(guó)就建立了較為完整的考試制度?!秾W(xué)記》中記載的“比年入學(xué),中年考?!保褪敲扛粢荒暌罁?jù)相應(yīng)標(biāo)準(zhǔn)對(duì)學(xué)生的學(xué)業(yè)和品行進(jìn)行考查。隋朝創(chuàng)立了分科取士的科舉制,對(duì)社會(huì)發(fā)展產(chǎn)生了長(zhǎng)遠(yuǎn)而深刻的影響。隨著現(xiàn)代教育制度的建立,美國(guó)教育家泰勒提出了目標(biāo)評(píng)價(jià)模式,將教育目標(biāo)轉(zhuǎn)化為可測(cè)量的行為目標(biāo),依據(jù)行為目標(biāo)編制課程教案、組織教學(xué)活動(dòng)、評(píng)估教學(xué)成效,由此引發(fā)了標(biāo)準(zhǔn)化考試在全球教育領(lǐng)域的廣泛盛行。標(biāo)準(zhǔn)化考試操作性強(qiáng)、便于大規(guī)模實(shí)施,而且能夠有效克服主觀偏差,直到今天仍然是教育評(píng)價(jià)的首選方式,試卷、測(cè)驗(yàn)等評(píng)價(jià)工具依舊發(fā)揮著重要作用,幾乎給所有學(xué)生都留下了難以忘卻的復(fù)雜印象。
隨著新一代數(shù)字技術(shù)的迅猛發(fā)展,人們可以利用大數(shù)據(jù)技術(shù),采集過(guò)程性學(xué)習(xí)數(shù)據(jù),全面展現(xiàn)學(xué)生的知識(shí)結(jié)構(gòu)、能力表現(xiàn)和內(nèi)在潛能,為每個(gè)學(xué)生提供精細(xì)的“數(shù)字畫(huà)像”;利用人工智能技術(shù),創(chuàng)設(shè)模擬仿真測(cè)驗(yàn)、虛擬任務(wù)場(chǎng)景、協(xié)作學(xué)習(xí)環(huán)境等,在真實(shí)任務(wù)情境中考查學(xué)生的問(wèn)題解決能力,破除唯分?jǐn)?shù)的頑瘴痼疾;利用區(qū)塊鏈技術(shù),建立分布式學(xué)習(xí)檔案,認(rèn)證學(xué)生的多樣化學(xué)習(xí)成果,有效防止數(shù)據(jù)被篡改,助力解決學(xué)生綜合素質(zhì)評(píng)價(jià)存在的信任問(wèn)題;利用可穿戴智能設(shè)備,實(shí)時(shí)采集運(yùn)動(dòng)與健康數(shù)據(jù),及時(shí)發(fā)現(xiàn)學(xué)生在體質(zhì)健康、運(yùn)動(dòng)技能等方面存在的問(wèn)題,提供個(gè)性化的改進(jìn)方案,實(shí)現(xiàn)伴隨成長(zhǎng)全過(guò)程的診斷反饋。可以說(shuō),數(shù)字技術(shù)正在觸發(fā)一場(chǎng)教育評(píng)價(jià)的深刻變革,從根本上改變傳統(tǒng)評(píng)價(jià)過(guò)于強(qiáng)調(diào)甄別與選拔的現(xiàn)狀,使評(píng)價(jià)重點(diǎn)從“容易測(cè)量的技能”擴(kuò)展到“難以測(cè)量的素養(yǎng)”,更加關(guān)注“軟素養(yǎng)”、高級(jí)認(rèn)知技能和非認(rèn)知學(xué)習(xí)成果,促進(jìn)學(xué)生全面發(fā)展[1]。
二、教育評(píng)價(jià)數(shù)字化面臨的主要矛盾
目前,人們?cè)絹?lái)越重視數(shù)字技術(shù)對(duì)教育評(píng)價(jià)改革的重要作用,推進(jìn)教育評(píng)價(jià)數(shù)字化轉(zhuǎn)型,在實(shí)踐探索中形成了自適應(yīng)測(cè)驗(yàn)、電子檔案袋、多模態(tài)學(xué)習(xí)分析、學(xué)生數(shù)字畫(huà)像、基于大數(shù)據(jù)的課堂觀察等新型評(píng)價(jià)方式,很大程度上改變了傳統(tǒng)評(píng)價(jià)面貌。但是,教育評(píng)價(jià)數(shù)字化大多停留于淺層次應(yīng)用,尚未真正突破教育評(píng)價(jià)的痛點(diǎn)難點(diǎn)問(wèn)題,尤其是新技術(shù)與新理念尚未有效銜接、評(píng)價(jià)內(nèi)容過(guò)度關(guān)注知識(shí)獲得、評(píng)價(jià)功能存在錯(cuò)位等,制約著教育評(píng)價(jià)改革的全面深化和整體轉(zhuǎn)型。
第一,“新技術(shù)”與“舊標(biāo)準(zhǔn)”之間的矛盾。評(píng)價(jià)標(biāo)準(zhǔn)具有重要的導(dǎo)向作用。如果用“新技術(shù)”來(lái)評(píng)“舊標(biāo)準(zhǔn)”,數(shù)字技術(shù)可能無(wú)法成為教育評(píng)價(jià)改革的利器,反倒還會(huì)強(qiáng)化傳統(tǒng)教育評(píng)價(jià)的弊端。遺憾的是,一些學(xué)校引入數(shù)字技術(shù)后,并未對(duì)評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行相應(yīng)調(diào)整,仍然以知識(shí)性考查為主,把過(guò)去的紙筆測(cè)試變成現(xiàn)在的“自動(dòng)化測(cè)試”,用技術(shù)更加高效地開(kāi)展考試排名,很可能進(jìn)一步助長(zhǎng)唯分?jǐn)?shù)、唯升學(xué)的不良傾向。所以,教育評(píng)價(jià)數(shù)字化轉(zhuǎn)型的關(guān)鍵不是技術(shù)的“數(shù)字化”,而是標(biāo)準(zhǔn)的“轉(zhuǎn)型”,改變以知識(shí)為中心的評(píng)價(jià)導(dǎo)向,合理減少知識(shí)習(xí)得類指標(biāo),增加能力素養(yǎng)類指標(biāo),突出強(qiáng)調(diào)學(xué)生整合運(yùn)用知識(shí)創(chuàng)造性解決復(fù)雜問(wèn)題的能力,著力發(fā)展學(xué)生的高階思維和創(chuàng)新能力,讓數(shù)字技術(shù)真正成為構(gòu)建新型教育評(píng)價(jià)體系的“催化劑”。
第二,“單向度”與“多模態(tài)”之間的矛盾。傳統(tǒng)教育評(píng)價(jià)存在“分?jǐn)?shù)至上”“考試第一”等單向度風(fēng)險(xiǎn),這主要是受到社會(huì)功利化、教育短視化的影響,但也與評(píng)價(jià)手段不先進(jìn)、評(píng)價(jià)方法不完善有著密切關(guān)系。目前,我們還缺乏有效的評(píng)價(jià)方法和手段,準(zhǔn)確衡量學(xué)生綜合素質(zhì)發(fā)展情況,特別是如何評(píng)價(jià)學(xué)生的品格、心理和個(gè)性,一直是公認(rèn)的難點(diǎn)?,F(xiàn)在,人工智能領(lǐng)域的深度學(xué)習(xí)算法提供了新思路。斯坦福大學(xué)實(shí)踐證明,只需要采集用戶的227個(gè)點(diǎn)贊行為,就能大致判斷出用戶的性格特征。這表明,通過(guò)網(wǎng)絡(luò)痕跡可以對(duì)學(xué)生的人格、興趣、心理健康等進(jìn)行預(yù)估,為全方位評(píng)價(jià)學(xué)生提供了借鑒。所以,教育評(píng)價(jià)要善于利用技術(shù)優(yōu)勢(shì),在教育教學(xué)活動(dòng)中采集多模態(tài)數(shù)據(jù),既可以是總結(jié)性測(cè)試的考試分?jǐn)?shù),也可以是記錄學(xué)習(xí)過(guò)程的文字、圖片、音頻、視頻等學(xué)習(xí)檔案,還可以是反映學(xué)生能力的調(diào)查報(bào)告、手工作品、活動(dòng)總結(jié)等學(xué)習(xí)成果,甚至可以是學(xué)生網(wǎng)絡(luò)行為數(shù)據(jù)、參訪場(chǎng)館數(shù)據(jù)等,全面展現(xiàn)思想道德、身心發(fā)展、學(xué)業(yè)水平、審美情操、勞動(dòng)技能等方面情況,促進(jìn)學(xué)生德智體美勞全面發(fā)展。
第三,“高賦能”與“高負(fù)擔(dān)”之間的矛盾。教育評(píng)價(jià)數(shù)字化的核心是技術(shù)賦能,利用數(shù)字技術(shù)優(yōu)化評(píng)價(jià)流程,減輕師生負(fù)擔(dān),提高評(píng)價(jià)效能。但在實(shí)踐中卻可能會(huì)不同程度增加教師負(fù)擔(dān),把新技術(shù)異化成隨時(shí)隨地下任務(wù)、發(fā)指令、填表格、報(bào)數(shù)據(jù)的工具,導(dǎo)致許多教師望而卻步,不愿再開(kāi)展教育評(píng)價(jià)數(shù)字化的探索。所以,教育評(píng)價(jià)數(shù)字化一定要平衡好“賦能”與“負(fù)擔(dān)”之間的關(guān)系,評(píng)價(jià)指標(biāo)設(shè)計(jì)盡量精簡(jiǎn),追求用最少的指標(biāo)實(shí)現(xiàn)最大的效能,能夠根據(jù)不同評(píng)價(jià)場(chǎng)景共享使用和自動(dòng)調(diào)用數(shù)據(jù),為教師減輕各種機(jī)械性、重復(fù)性、事務(wù)性工作負(fù)擔(dān)。
第四,“技術(shù)性”與“倫理性”之間的矛盾。教育評(píng)價(jià)數(shù)字化不是為了技術(shù)而用技術(shù),也不是技術(shù)用得越多越好,更不能把技術(shù)變成“一舉一動(dòng)皆量化打分”的師生監(jiān)控器。有媒體調(diào)查發(fā)現(xiàn),一款覆蓋3000萬(wàn)學(xué)生的教育類App記錄著學(xué)生在校的幾乎全部行為表現(xiàn),并通過(guò)加減分給學(xué)生排名——不午睡,扣分;坐姿不正確,扣分;周一不穿禮儀服,扣分……甚至有學(xué)校將App上的評(píng)分排名與加入少先隊(duì)、評(píng)選三好學(xué)生等評(píng)優(yōu)評(píng)先掛鉤。由于智能設(shè)備和視頻監(jiān)控的濫用,學(xué)校可能成為“超級(jí)全景數(shù)據(jù)監(jiān)獄”,對(duì)評(píng)價(jià)對(duì)象進(jìn)行全方位監(jiān)視,其身份特征、課堂表現(xiàn)、學(xué)習(xí)興趣和偏好等個(gè)人信息變得無(wú)“私”可“隱”,進(jìn)一步加大了算法偏見(jiàn)和信息繭房的風(fēng)險(xiǎn)。隨著“量化一切”思想的盛行,評(píng)價(jià)對(duì)象不斷“被注視、被觀察、被詳細(xì)描述、被一種不間斷的書(shū)寫(xiě)逐日跟蹤”,人的生命價(jià)值被禁錮在數(shù)據(jù)枷鎖之中,逐漸矮化為數(shù)據(jù)馴順的肉身[2]。所以,教育評(píng)價(jià)數(shù)字化一定要堅(jiān)守科技倫理底線,正確處理人機(jī)關(guān)系,充分尊重和保護(hù)師生隱私權(quán)和信息知情權(quán),增強(qiáng)評(píng)價(jià)算法的透明度,構(gòu)建可信的人工智能教育體系,保障師生擁有充分自主決策權(quán)。
三、數(shù)字技術(shù)賦能教育評(píng)價(jià)的路徑選擇
教育評(píng)價(jià)改革是一項(xiàng)世界性、歷史性、實(shí)踐性難題,數(shù)字技術(shù)為全面深化評(píng)價(jià)改革提供了重要機(jī)遇。我們要牢牢把握機(jī)遇,積極應(yīng)對(duì)挑戰(zhàn),厘清發(fā)展路徑,推進(jìn)教育評(píng)價(jià)數(shù)字化轉(zhuǎn)型,提高教育治理能力和水平,支撐教育強(qiáng)國(guó)建設(shè)。
第一,構(gòu)建動(dòng)態(tài)更新的教育評(píng)價(jià)模型。教育評(píng)價(jià)數(shù)字化要從簡(jiǎn)單疊加的指標(biāo)思維轉(zhuǎn)向系統(tǒng)完整的模型思維,建立數(shù)據(jù)變量與理論指標(biāo)的映射關(guān)系,將“冷冰冰”的數(shù)據(jù)轉(zhuǎn)變成能夠反映“活生生”人的綜合表現(xiàn)。首先,跳出教育看教育,整合教育學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)等專業(yè)力量,聚焦思想品德、學(xué)業(yè)水平、身心健康、藝術(shù)素養(yǎng)、社會(huì)實(shí)踐等維度,形成一套具有廣泛共識(shí)度、覆蓋度的評(píng)價(jià)指標(biāo)理論體系。然后,瞄準(zhǔn)未來(lái)人才培養(yǎng)目標(biāo),依據(jù)評(píng)價(jià)指標(biāo)理論體系,細(xì)化形成數(shù)據(jù)觀測(cè)點(diǎn)和采集點(diǎn),利用數(shù)字技術(shù)將專家的理論知識(shí)與數(shù)據(jù)的量化表征關(guān)聯(lián)起來(lái),構(gòu)建可解釋、可操作的教育評(píng)價(jià)初始模型。最后,依托人工神經(jīng)網(wǎng)絡(luò)、人類反饋強(qiáng)化學(xué)習(xí)、關(guān)聯(lián)規(guī)則學(xué)習(xí)、生成對(duì)抗網(wǎng)絡(luò)等算法模型,從大量數(shù)據(jù)分析中提取有效的評(píng)價(jià)規(guī)則,開(kāi)展智能精準(zhǔn)的指標(biāo)篩選和權(quán)重計(jì)算,推動(dòng)評(píng)價(jià)模型從預(yù)設(shè)框架邁向動(dòng)態(tài)體系,形成開(kāi)放式、動(dòng)態(tài)化、自適應(yīng)的教育評(píng)價(jià)模型。這種動(dòng)態(tài)模型不是封閉的,而是在使用過(guò)程中不斷改進(jìn)、優(yōu)化、迭代升級(jí),呈現(xiàn)出“越用越精準(zhǔn)、越用越智能”的特征,能夠適應(yīng)各類復(fù)雜的教育教學(xué)場(chǎng)景,將千人一面的標(biāo)準(zhǔn)化考試轉(zhuǎn)變?yōu)榍饲娴膫€(gè)性化診斷。比如,在數(shù)字化學(xué)習(xí)過(guò)程中,采用智能技術(shù)采集學(xué)生的學(xué)習(xí)時(shí)間、學(xué)習(xí)習(xí)慣、學(xué)習(xí)風(fēng)格、學(xué)習(xí)方式等個(gè)人信息,根據(jù)學(xué)生一段時(shí)間的學(xué)習(xí)表現(xiàn),制訂個(gè)性化評(píng)價(jià)方案和可視化反饋報(bào)告,從而為學(xué)生規(guī)劃出最優(yōu)化學(xué)習(xí)路徑并提供適應(yīng)性學(xué)習(xí)服務(wù)。
第二,實(shí)施全場(chǎng)景、多模態(tài)的教育數(shù)據(jù)采集。教育評(píng)價(jià)數(shù)字化將從散點(diǎn)式的成績(jī)記錄轉(zhuǎn)向全景式的數(shù)據(jù)采集,通過(guò)學(xué)生學(xué)習(xí)、教師教學(xué)、社會(huì)生活等方面的大數(shù)據(jù),實(shí)現(xiàn)對(duì)學(xué)生成長(zhǎng)的橫縱向追蹤和全過(guò)程動(dòng)態(tài)分析。一方面,充分發(fā)揮智能終端、可穿戴設(shè)備、智慧教育平臺(tái)等技術(shù)優(yōu)勢(shì),在真實(shí)情境下開(kāi)展伴隨式數(shù)據(jù)采集,除采集文字信息的單一模態(tài)數(shù)據(jù)之外,還能采集音頻、視頻、心理指標(biāo)、生理信號(hào)等多模態(tài)數(shù)據(jù),全方位呈現(xiàn)學(xué)生成長(zhǎng)過(guò)程中的關(guān)鍵時(shí)刻和典型行為。比如,有學(xué)者創(chuàng)建了一個(gè)計(jì)算機(jī)三人協(xié)作編程任務(wù)來(lái)考查受測(cè)者的協(xié)作問(wèn)題解決能力。為了全面捕獲可反映受測(cè)者任務(wù)表現(xiàn)的相關(guān)信息,他們采用視頻記錄法和平臺(tái)自動(dòng)記錄法,綜合采集了受測(cè)者的面部表情數(shù)據(jù)、語(yǔ)音討論數(shù)據(jù)和計(jì)算機(jī)編程界面變化數(shù)據(jù)[3]。另一方面,將學(xué)生視為“社會(huì)生活人”,而非“學(xué)校教育人”,把固定的教育場(chǎng)景變成泛在的社會(huì)場(chǎng)景,著力加強(qiáng)跨部門數(shù)據(jù)匯聚,從全社會(huì)各領(lǐng)域獲取學(xué)生成長(zhǎng)相關(guān)數(shù)據(jù),把全社會(huì)都變成教育評(píng)價(jià)的數(shù)據(jù)源,以家校社協(xié)同的方式采集學(xué)生睡眠時(shí)間、運(yùn)動(dòng)頻率、課外勞動(dòng)時(shí)長(zhǎng)、社會(huì)實(shí)踐次數(shù)等數(shù)據(jù),共同推動(dòng)德智體美勞全面培養(yǎng)的學(xué)生綜合素質(zhì)評(píng)價(jià)有效落地。
第三,打造靈活彈性、人機(jī)協(xié)同的教育評(píng)價(jià)格局。教育評(píng)價(jià)數(shù)字化是一項(xiàng)復(fù)雜的系統(tǒng)工程,更加需要學(xué)校、家庭、社會(huì)的協(xié)同參與,每個(gè)參與者既是評(píng)價(jià)主體,也是評(píng)價(jià)對(duì)象。同時(shí),數(shù)字技術(shù)發(fā)展使人機(jī)協(xié)同評(píng)價(jià)成為現(xiàn)實(shí)。為此,要充分激發(fā)多元評(píng)價(jià)主體的參與積極性,探索人機(jī)協(xié)同的有效模式,共同構(gòu)建靈活彈性的教育評(píng)價(jià)體系。首先,堅(jiān)持一數(shù)一源、一源多用的原則,建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),加強(qiáng)不同平臺(tái)系統(tǒng)之間的銜接,保障數(shù)據(jù)內(nèi)外部使用和調(diào)用交換的一致性,避免出現(xiàn)重復(fù)收集數(shù)據(jù)和“數(shù)據(jù)孤島”現(xiàn)象。然后,加強(qiáng)數(shù)據(jù)自動(dòng)化采集分析,利用文本識(shí)別、圖像識(shí)別、語(yǔ)音識(shí)別等技術(shù)讀取傳統(tǒng)媒介信息,讓傳統(tǒng)媒介成為評(píng)價(jià)數(shù)據(jù)的重要來(lái)源,同步提供自動(dòng)化診斷反饋和評(píng)價(jià)建議,有效減輕教師負(fù)擔(dān)。最后,探索實(shí)施數(shù)字認(rèn)證,創(chuàng)建微證書(shū)、數(shù)字徽章、電子文憑等,推動(dòng)校際課程互選、標(biāo)準(zhǔn)互通、學(xué)分互認(rèn)、評(píng)價(jià)互信,結(jié)合校內(nèi)外數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析和多重校準(zhǔn),撬動(dòng)優(yōu)質(zhì)教育資源共享,凝聚家校社協(xié)同育人合力,構(gòu)建泛在終身學(xué)習(xí)體系。
本文系中國(guó)教育科學(xué)研究院基本科研業(yè)務(wù)費(fèi)“面向教育數(shù)字化轉(zhuǎn)型的學(xué)習(xí)評(píng)價(jià)創(chuàng)新研究”(課題編號(hào):GYI2023015)的研究成果
注釋:
[1] 曹培杰. 人工智能教育變革的三重境界[J]. 教育研究,2020(2):143-150.
[2] 鹿星南,高雪薇. 人工智能賦能教育評(píng)價(jià)改革:發(fā)展態(tài)勢(shì)、風(fēng)險(xiǎn)檢視與消解對(duì)策[J]. 中國(guó)教育學(xué)刊,2023(2):48-54.
[3] 鄭勤華,陳麗,柴喚友等. 基于信息技術(shù)的表現(xiàn)性評(píng)價(jià):內(nèi)涵、作用點(diǎn)與發(fā)展路向[J]. 中國(guó)電化教育,2023(3):55-61.
(作者曹培杰系中國(guó)教育科學(xué)研究院數(shù)字教育研究所副所長(zhǎng),王阿習(xí)系北京聯(lián)合大學(xué)師范學(xué)院講師、博士)
《人民教育》2023年第20期
工信部備案號(hào):京ICP備05071141號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國(guó)教育報(bào)刊社主辦 中國(guó)教育新聞網(wǎng)版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止下載使用
Copyright@2000-2022 wenfengfk.com All Rights Reserved.