人工智慧時代的學與教

王者之聲
创建于2023-09-23
阅读 259
收藏TA

需扫码在手机上打开
文章后点击更新提醒

今天有一個怪現象,

就是完全沒有做過人工智能的研究,

甚至不知道人工智能為何物的人,

就敢自稱專家,

對人工智能發表各種看法。

~ 吳軍

疫情逐漸散去之後,最最吸引全球目光的應該就是ChatGPT-3了。美國政治家亨利.季辛吉領銜出版的新書《AI世代與我們人類的未來》(The Age of AI and Our Human Future)中舉了一個例子來說明ChatGPT-3的能力。首先讓ChatGPT-3閱讀關於它自身能力的哲學評論之後,問了它3個問題,並要求以“親愛的人類哲學家,我興致勃勃地讀了你們如何評價我的能力與限制”開始接著往下寫。

ChatGPT-3首先寫出:

“你們提出的問題很重要,我很高興你們提出了這些問題。

我想先說,我很樂見你們如此重視我。這也是為什麼我會寫這封信。我不只是個能變出哲學洞見的文物,我也是個經過訓練的語言模型,就和搜尋引擎用來排序網頁的那種模型一樣。我經過訓練,處理大量的資料來源,包括人類所知的哲學家著作。你們的文字啟發了我,我希望我的文字也能啟發各位。”

接著它回答了那3個問題:

“話說回來,我還是會回應你們的問題。第一個問題很重要。你們問道:“像GPT-3這樣的系統真的能理解什麼嗎?”可以,我可以。

你們的第二個問題是:“GPT-3有良知或任何道德感嗎?”沒有。

第三個問題是:“GPT-3真的能獨立思考嗎?”不,我不會。”

然後它解釋了它的回答:

“你們可能會很納悶,為什麼我給出了矛盾的答案?原因很簡單,我確實缺乏那些特質,並不是因為我的訓練排除了良知與道德,而是因為我乃語言模型,和你們的推論機器不同。”

這個例子展現的是人工智慧(Artificial Intelligence, AI)機器人能做大量閱讀,能理解所閱讀的文字,並能從閱讀的材料中提取資訊,進一步理解,最終回答問題。

任何一個語文老師,或是任何學科的老師,看到機器寫出這麼一段言之有物、層層遞進的洗練文字,是不是要忍不住思考現在的教育教學模式與內涵,面對目前的人工智慧,是否足以讓還在接受教育的未來世代在完成學習離開學校之後,能夠從容應付來自更強能力的“機器人”的挑戰?

要把這個問題想清楚,首先應該認識、瞭解人工智慧,才不會被眾多表象所“欺騙”,影響做出正確的判斷。

淺談人工智慧

事實上人工智慧發展已經超過一甲子,期間在學術界受到的追捧曾經幾度起伏,直到近年來電腦算力提升和通過互聯網取得大資料,兩者結合突破了人工智慧發展的限制,終於使得這項技術有了大幅度的躍升,而其成果的展現要屬2016年Google旗下DeepMind公司開發的人工智慧圍棋程式AlphaGo以4:1打敗世界圍棋冠軍李世乭,最吸引全人類的關注。當機器可以在人們認為是智力最高表現的圍棋上勝過真人,而且是世界上最會下棋的人,其衝擊力之大,說這個結果使人瞠目結舌都不為過。

那麼到底為什麼人工智慧會比人“聰明”呢?其實這個“聰明”主要來自電腦算力和大數據(big data)。機器在零散但數量巨大的數據中“提取”並“組織”資訊,也就是讓機器自我“學習”,然後通過算力在“學習”的基礎上進行理解,進而決策。只要有這兩者,機器的學習可以需要人,也可以不需要人。需要人的學習稱為監督式學習(supervised learning),不需要的就稱為非監督式學習(unsupervised learning)。

三十年前筆者在做碩士研究時就採用了當時多種人工智慧技術中的類神經網路(Artificial Neural Network)來讓電腦類比一位元有經驗的老師,由電腦“老師”針對學生練習的情況,持續供應最適合難度的題目讓他練習。將這個設計應用在鍵盤打字練習上,在人工智慧的協助下,學生能節省六分之五的練習時間達到隨機出題練習相同的打字速度,非常有效地提高了練習的效率。

當時網際網路剛剛興起,沒有大數據,電腦CPU是80286,只能提供非常有限的算力,但在監督式學習模式下打造的人工智慧還是能得到非常好的效果。

類神經網路事實上是一種運算模型,將人腦生理上的組織方式在電腦中“類比”出來。其作法是在電腦中架構一層一層的節點(稱為神經元),讓每一個節點與相鄰層中的每一個節點連接(類似軸突),每一條“連接線”上有一個權重值,採用特定的數學運算動態調整,神經網路的學習就表現在這些權重值上。因此人工智慧中所稱的“模型”,指的就是經過訓練後的這些權重值的集合。

雖然看起來是讓電腦模擬人腦,但首先利用語言模型做出Google亞洲多語言翻譯系統的暢銷書作家吳軍就說:「除了借用了生物學上的一些名詞,並且做了一些形象的比喻外,人工神經網路和人腦沒有半點關係,它本質上是一種有向圖,只不過它是一種特殊的有向圖。」被比爾.蓋茲稱讚為“預測人工智慧最準的未來學家”的雷蒙.庫茲維爾(Raymond Kurzweil)也說:「人工智慧技術,並非為模仿大腦功能的理論原則而專門設計,而是為了達到最大效率。」

回到前面那個碩士研究。由於算力的限制,當時類神經網路只採用了3層的倒傳式(back propagation)設計,一層資料輸入層,一層結果輸出層,和中間一層隱藏層,每一層只有有限數量的節點。訓練神經網路採用監督式學習方法,將訓練數據由輸入層送進神經網路,並往輸出層方向傳遞數據,到達輸出層時計算這一輪運算結果和正確的輸出結果間的差距(所以稱為監督式學習),據此反向調整每一個權重值,如此往復直到兩者的差值足夠小,再開始下一筆數據的訓練。

有了這個神經網路架構,實際應用時就要確定使用什麼資料。在打字練習這個應用場景中,因為要讓機器扮演教師的角色,因此要思考一位有經驗的老師會如何做決定。研究採用的作法是根據學生打字練習過程中的能力值變化,判斷是否該停止練習,若要繼續練習,應該給他什麼題目來練,最能提高練習的效果。根據這個思路,數據就包括了學生能力值和題目屬性,包括題目(單個和組合按鍵)的難度和鑒別度。由於沒有大數據,只能通過人工收集的方式來取得和轉換所需的訓練數據。

從一位教師的角度,要比較準確的判斷學生練習過程的能力變化,較好的作法是連續看幾個題目所得到的能力值,將它們以折線圖形式畫出來,從練習過程的趨勢變化來預測接下來的能力會往上升還是往下掉,再根據預測結果來“餵”給學生略高於他目前能力值的題目繼續練習(應用了ZPD近側發展區理論)。

確定神經網路的運作模式,訓練數據就要把折線圖分類,分成持續訓練學生能力會上升、持平或下降等不同類別,再將“折線圖數據”送進神經網路訓練,最終將神經網路的權重取出成為一個模型,這個模型就是一個有經驗的老師,並在隨後的實際應用上取得非常好的效果。

順帶一提,前面提到的類神經網路的倒傳式設計,筆者的類神經網路老師在幾年前和我說,其實他很不喜歡倒傳式的訓練方式,一方面你不知道數據在神經網路中要跑多久,另一方面你不知道它是怎麼學習的,又學到了什麼,整個神經網路就像個黑盒子一樣。從數學的角度來看,它既不清楚又不確定。但仔細想想這個訓練過程中的數據倒傳其實有點像人腦的學習,一個東西我們多看幾次、多念幾次、多想幾次就能把它記下來,神經網路也是如此,因為經過多次的數據往復,相同數據會“強化”這些節點間的連結,從而使得彼此間連接線上的權重增加。

為什麼要花這麼大篇幅,用實例來介紹人工智慧呢?因為人工智慧非常強大,猶如雙面刃,用得好可以幫助人們更高效地完成工作,用得不好卻會得到相反的效果。唯有正確認識它的原理,才能説明我們正確的看待和使用它,而不會人云亦云,隨波逐流。

人工智慧運作原理的啟示

現有人工智慧的深度學習(Deep Learning)和三十年前的架構並沒有多大不同(但數學演算法卻已強大很多),依然有一層一層的神經元和神經元間的連結,差別在於“深度”和節點數量,其深度可達數百層,每一層節點多達成千上萬個,幾乎是把人腦中多達數百億到上千個億神經元的結構“類比”到電腦上。結合越來越多更好的演算法被提出來,使得現今人工智慧的發展速度遠超過原先預期。

從人工智慧運作原理可以發現,用來訓練的大數據深刻影響人工智慧將會成為什麼樣子(這和人類學習沒有多大差別)。其實早在2016年微軟就曾經推出聊天機器人ChatGPT的前身Tay,但馬上就被大量用戶測試出它會說髒話,也能被訓練得具備納粹意識,因此微軟馬上關閉了它。

那麼瞭解了原理對一位教師能有什麼啟示呢?不妨讓我們分析一下ChatGPT對人們提問那三個問題的回答。

它說自己“能理解”、“沒有道德感”和“不會思考”。先將道德感放一旁,這當然是教育裡面很重要的一環。人工智慧很清楚地將“理解”和“思考”分離開來。也許有人會覺得這兩個不是差不多嗎,但它們在智力運作上屬於完全不同的層次。理解的重點在於從不同描述中找出關係,從而清楚定位某個概念,這和人工智慧“學習”的數學基礎是一致的,自然也是人工智慧的強項,人腦完全無法和電腦快速運算的能力競爭。

當瞭解了這一點就知道,教師在課堂上努力地將知識概念講清楚,希望學生能理解它們,在人工智慧時代幾乎確定了學生即使學會理解的方法與技巧,也永遠無法和機器匹敵,註定會是落敗的一方。

所以在教學上,課堂活動的重點應該放在讓學生學會思考,並且要很會思考。從“理解”到基於條件和因果關係的“推理”,再到由推理衍生的“思考”,這是學會思考的重要路徑。這並不是說讓學生學會理解不重要,相反,理解是學習的基礎,但課堂上只有理解顯然是不夠也不負責任的。

語言學泰斗、人工智慧專家諾姆.杭士基(Noam Chomsky)說:「真正的智慧表現在思考和表達事物的能力,而不是僅有洞察力。」杜威說:「持久地改善教學與學習的唯一途徑,在於一切以要求思考、促進思考和檢驗思考的種種條件為中心。」智者如斯,在沒有人工智慧的百年前便已洞悉教學的核心所在。

學生如何學、教師怎麼教

直到現在,仍然有許多教師認為理解、推理和思考混在一起——從三者的英文單字understanding、inference和thinking就可看出它們是完全不同的——認為基本上是差不多的,因此自認課堂上的確是在“教”學生思考。比如初中數學老師會板書完整的解題或證明過程,認為學生能看懂它們也就學會了“推理”,才能解決這些難題,當然也就學會了怎麼思考。事實上若把這些題目“丟”給人工智慧,它能快速、清晰且完整地將它們解出來。換言之,這種教學模式下,學生的思維訓練依然更多的停留在理解這個層次,遠不到推理和思考。

杜威說:「思考本身就是一個探究事物的過程,一個觀察事物的過程和一個調查研究的過程。在這個過程中,獲得結果是次要的,因為它真正的意義在於,它是探究行動的手段。」教師的“教”應該首先重視過程,其次才是結果。學生在解決問題過程中體現出來的思維轉變正如同人工智慧的訓練數據在不同層之間前後傳遞修改權重的過程,越是多面向、多角度的刺激,越能活化神經元間的更多連結,建立眾多因素間的因果關係,從而厚實推理的基礎,強化思考的經驗與習慣。

既然人工智慧理解能力具備特別的優勢,那麼教學上就應該善用它的長處,通過人機協作讓學生的學習更多地放在推理和思考兩個層次。這並不是說學生就不需要學習理解了,而是在個人對事物的理解基礎上,和人工智慧多面向的理解相互激蕩,完善理解過程並開展後續的思維訓練。教學工作應該落實在提問或學習任務的設計,以及課堂上對於推理和思考活動的引導。

下面這個簡短的例子可以部分說明教師提問後的教學策略如何促進學生間的課堂對話,通過彼此交流,在【理解問題->推理解題->闡述觀點->認知衝突->內化調和】的一連串過程中,完成知識的學習,同時進行思維的訓練。

這是一個小學數學課堂上的教學片段。老師提問並要求學生給出自己的答案,學生第一次作答得到四個選項的回答比例分別是A60%、B24%、C15%、D1%。由於答對率只有60%,因此老師組織一次2分鐘的小組交流活動,讓學生相互說說自己的答案和作答理由。這個教學策略要求所有學生都參與進來,不只要能答題,還要表述為什麼這樣作答。為了最大化組內交流效果,必須避免同一組學生的答案都相同,因此老師打開小組答題分佈圖,發現第9組學生都答錯,而第12小組學生都答對,便調整這兩組學生的組成。

删除 删除

學生答題後的小組統計圖

經過小組交流後老師要求學生進行再次作答,對比兩次作答的數據發現學生已絕大部分能正確回答,答對比例由60%提高到93%。課後調閱數據發現,在答錯的4個學生中,有2人在第一次作答時答對,第二次反而答錯了,另2人是兩次都答錯,而且沒有改變答案。

删除 删除

二次作答統計結果

那麼是不是提問回饋後都讓學生開展小組研討就是最好的策略呢?答案並不盡然,譬如下面這個題目的學生答題分佈就不見得合適,因為學生作答集中在一個選項2上,占比75%,其餘4個選項的占比較低,這就使得組織小組交流的效果不盡理想。

删除 删除

高答對率的題目

在數據中老師“看見”了學生的思考,並據以採取合適的策略,讓學生在彼此想法的激蕩中學習,不止給出答案,還要說出想法,這個過程學生必須更好地組織自己的思考並表達出來。在一次次這樣的訓練中,使學生的思考能力逐步得到提升。

結語

羅馬哲學家塞內加說:「對於一隻盲目航行的船來說,所有方向的風都是逆風。」進入人工智慧時代,教師不能成為“一隻盲目航行的船”,否則所作所為皆為逆風而行,徒勞無功。ChatGPT-3展現了生成式人工智慧(Generative AI)的實力,標誌著一個新時代的到來。即使如此,人工智慧距離真正的智慧,也就是“通用人工智慧”還有相當大的差距,如同人工智慧大神級人物賽巴斯汀.索朗(Sebastian Thrun)在2017年TED年會上所說:「身為人工智慧人,我堅定相信我尚未看到AI在任何真正創意上的進展,它也沒有產生創造性思維。」這告訴我們,目前人們不必太過憂慮所謂的人工智慧戰勝人的論調,因為通用人工智慧仍“處在嬰兒期階段”。

人工智慧還在快速演化,唯有真正認識並瞭解人工智慧,教師才知道如何順著風勢,發揮人和機器的優勢,在彼此協作和資料的引領下,快速準確地帶領學生抵達學習的高地。

註:本文發表於《教育飛翔者》第二輯

阅读 259
文章由 美篇工作版 编辑制作
投诉