人機協作:AI時代教學的新樣態

王者之聲
创建于2024-02-01
阅读 390
收藏TA

需扫码在手机上打开
文章后点击更新提醒

決策不是基於數據或直覺,

而是基於數據和直覺。

~ 艾維.羅斯 ~

2022年11月OpenAI公司發佈ChatGPT-3,它能理解問題並以通順的語句回答,使用起來比Google等搜尋引擎更方便,人與機器間的溝通更自然。一時間AI風潮席捲全球,提供AI算力的晶片公司nVIDIA輝達CEO黃仁勳更稱2023為AI元年。

這股AI風潮自然也吹向教育界。

以人為本AI

美國國家工程院、醫學院、文理學院院士,史丹佛大學教授李飛飛在她的最新著作《AI科學家李飛飛的視界之旅》中提出以人為本AI的理念,這是她從建立ImageNet開始一連串AI研究後所總結出來的重要觀點,她說:「AI作為工具十分強大,它跟我們過去發明的所有工具一樣,對人類而言是一把雙刃劍——用得好,便能改善我們的生活和工作;用得不好,便會帶來有意或無意的傷害。關鍵在於人。」

以人為本AI理念對於教學上應用AI有著非常重要的指導作用。

Artificial Intelligence(AI)一詞源於1955年達特茅斯大學助理教授約翰.麥卡錫(John McCarthy)等人向洛克菲勒基金會申請發起達特茅斯會議的計畫書上,在近70年的發展過程中,不同技術路線帶領人工智能經歷上下起伏。人工神經網路(artificial neural network)是目前的技術主力,它是「受到生物學所啟發,將一系列相連的決策單元採階層式的排列」,最早出現於上世紀40年代,到了60年代末由於沒有太多突破而逐漸沉寂下來。1975年反向傳播演算法(Backpropagation)的問世使它再次復興,但沒多久由於數據的缺乏而又沉寂了下去,「到了2010年代,神經網路技術早就像是布滿灰塵的文物。」

神經網路技術植基於數據、算法和算力。李飛飛通過網路眾籌方式創建了有1400萬張標註圖片的數據集ImageNet,提供AI研究人員開發圖片識別演算法之用。在ImageNet每年一度的大規模視覺辨識挑戰賽中,2012年AlexNet團隊的卷積神經網路(convolutional neural network)技術取得重大突破,較第二名團隊的辨識錯誤率低了10個百分點,奠定了日後以多階層神經網路為基礎的深度學習AI技術路線。

為什麼要不厭其煩地介紹神經網路技術的發展呢?因為唯有我們理解它,才知道怎麼用,如何用好它。

深度學習採用各種不同演算法在深層神經網路進行運算,演算法是大量的數學計算,需要多顆高速運算晶片同時工作來“生成”結果。要讓AI能夠生成結果,事先必須使用大量數據對多達數百層,每層包含成千上萬個連接點(也被稱為神經元)的神經網路進行訓練(這是深度學習這個名稱的由來),而要能正確生成結果就需要有高質量的訓練數據(這也是ImageNet那1400萬張經過人工標註圖片數據集具有里程碑價值所在)。比如說,如果將圖片中的「貓」標記成「狗」丟進神經網路訓練,最終可能使AI將圖片中的貓辨識成狗,對AI來說是正確的,但對人則是錯誤的。換句話說,訓練AI模型是「垃圾進、垃圾出」(garbage in, garbage out)。

至於AI是如何辨識圖片(包括生成文字等),如同李飛飛所說:「雖然我們能用某種理論、超然的角度來討論神經網路,但神經網路內部究竟在每次調用時發生了什麼事,卻完全不透明。」換言之,神經網路就像個黑盒子,沒有人能清楚說明AI認識、分辨和取得結果的過程。

正因如此,使用ChatGPT等生成式AI才會時不時地發現它會“一本正經的胡說八道”。

帶著對AI的認識,再來看看教學場景中的AI應用。

教學中常見的AI應用

ChatGPT使用語言模型技術,屬於生成式AI。在它爆火之後,各種大型語言模型(Large Language Model)如雨後春筍般冒出頭來。我們其實不知道這些大語言模型是不是做了足夠的人工標記訓練而成,但這卻是風險所在!

課堂上讓學生在電腦、平板等設備上使用生成式AI的前提是,學生要懂得分辨AI生成結果是否是可信賴的,而這需要足夠的知識儲備和判斷能力,否則「盡信書不如無書」。教師必須在教學中讓學生充分體會和理解人與機器一起工作的方法,習得人機協作的技能,這比通過AI獲得問題解答更重要。

對教師來說,生成式AI固然可以自動生成一份教學活動設計,但全盤照收恐怕不見得合適,因為教學實際上是非常個性化的,每個班級的學生組成不同,教學起點和課堂反應可能天差地別,直接引用AI教學設計很難適合不同班級的學生需求。當然教師也可以先提出清晰、明確的要求(也稱為AI提示語),讓AI生成一份初始教學設計,再依據學情自己動手修改、優化。

如果請AI幫忙設計特定的課堂環節,則通常會得到不錯的效果。比如課堂上想讓學生練習後上台表演,並讓全班同學給予評價,但一時想不出比較全面、有效的評價標準,這時就可以請AI來幫忙想想辦法:

教師:

請提供一個評價五年級學生在英語課堂上表演的評價標準,至多5項,5項的總分為9分。每項標準若占分超過1分,請說明如何的表現得1分,如何得2分等。

ChatGPT:

當評價五年級學生在英語課堂上的表現時,以下是至多5項,總分為9分的簡化標準:

口語表達 (2分):

1分:表達含糊,發音和語法錯誤頗多,難以理解。

2分:表達相對清晰,有些許發音或語法小錯誤,但不影響基本理解。

語言運用 (2分):

1分:詞彙和句型使用不當,語言表達能力有待提高。

2分:語言使用基本正確,能恰當運用詞彙和句型。

溝通能力 (2分):

1分:溝通效果不佳,缺乏與觀眾建立聯繫的能力,可能缺乏肢體語言和表情。

2分:能有效傳達信息,與觀眾建立一定聯繫,使用了適當的肢體語言和表情。

表演技巧 (2分):

1分:表演技巧不足,生硬呆板,缺乏生動感,聲音、表情和動作不夠豐富。

2分:能夠較生動自然地表演,利用了聲音、表情和動作,但還有進步的空間。

準備與自信 (1分):

1分:準備還算充分,表現時有些緊張,但展現出一些自信的態度。

這樣的標準可以依照學生的實際表現,對每項標準進行評分。得分可以在每個標準的描述中找到相對應的表現特點。

ChatGPT的這份評價標準基本上已經能直接在課堂上使用,當然也可以進一步優化它,讓它更符合預設的教學目標。

與AI教學決策助理協作

除了課前利用生成式AI助力教學設計外,課中與“AI教學決策助理”協作也能提高教學效率和學習成效。

“AI教學決策助理”用於課堂上教師提問學生答題後,教師根據反饋數據決定接下來的教學活動安排。教師執行教學策略後,學生的答對率提高,可以視為這是一個質量較佳的決策,答對率提高越多表示決策的效果越好。例如下圖中教師提問後學生答對率是僅略高於一半的52%,此時教師可以採取不同的教學策略,包括①自己把正確的解答和解題方法講一遍;②選擇不同答案的學生把自己的答案和理由說給全班同學聽,由同學自己思考判斷;③採用同儕教學法,組織學生開展小組研討,輪流把自己的答案和想法說給小組同伴聽,再一起交流研討。圖中這段課堂記錄顯示老師採用的是③:倒計時3分鐘的同儕教學,再進行二次作答。從結果可以看到正確率由52%提高到95%,效果非常好。

教學決策效果會顯示在答題正確率的變化上

删除 删除

“AI教學決策助理”和生成式AI不同,它不生成文字、語音或繪圖,而是提供教學步驟建議。它的訓練是從課堂教學行為大數據中篩選出優質的決策數據,經過人工標記後,採用深度學習技術訓練而成。為什麼需要人工標記呢?因為教學決策除了單純從數據的角度審視外,還須同時思考與認知科學和教學法的結合。

訓練好的“AI教學決策助理”好似具有吸星大法一般,把許許多多具備高效優質決策經驗的教師吸納在一起,在適當時候提供決策建議。至於AI建議的教學步驟是否採納,或只部分採納,要由教師在現場參酌學情來決定。

AI助理根據答題數據推算教學決策建議

删除 删除

即使課堂上未採用AI建議,課後也可以從課堂記錄中再次查看AI提供的教學步驟,對比並反思自己當時的決策與AI建議的差異,從中積累更多更好的決策經驗,提高未來教學決策質量。

課後可調閱課堂記錄中保存的AI建議

删除 删除

諾貝爾獎得主丹尼爾.康納曼在他的新作《雜訊》中指出人總是自信地作出決策,但研究顯示「自信並不能保證準確,而且很多自信的預測結果都是錯誤的。」而「好的決策必須以客觀、準確的預測性判斷作為基礎,完全不受希望和恐懼的影響,或是受偏好和價值觀左右。」AI助理能提供客觀判斷的決策建議,通過人機協作模式,結合數據和經驗,提高教學決策的準確性和成效,打造AI時代教學的新樣態。



註:李飛飛在《AI科學家李飛飛的視界之旅》一書的開頭寫道:「在目前這個時期,並不足以『人工智慧』的中文意義來表達現在AI所能做的事,且易引起不必要的恐懼。所以,本書將譯AI為『人工智能』。AI目前仍與人類的智慧有相當大的差距,它們雖然能高速運算,但若因此認為AI已達到某種智慧程度,那可能太過抬舉而不符現實。」這段說明文字讓人更準確地看待AI,因此本文同樣將AI譯為『人工智能』。

阅读 390
文章由 美篇工作版 编辑制作
投诉