從編程到論文,AI 無處不在!一項針對百萬條學生對話的分析顯示,AI 不僅能調試代碼,還能潤色文章,甚至生成學習資料。但這背后,學術誠信的邊界在哪里?
如今,AI 不再只是專業的研究工具,它已成為大學生日常學習的好幫手。
隨著 AI 越來越深入地融入教育環境,需要思考一系列關于學習、評估和技能培養的重要問題。
目前,大多數相關討論都基于調查和對照實驗,卻缺乏學生在真實學習場景中自然融入 AI 的直接證據。
為了填補這一空白,Anthropic 開展了一項針對高等教育中 AI 實際使用的大規模研究,分析了 Claude.ai 平臺上 100 萬條匿名學生對話記錄。
報告的主要發現如下:
理工科學生是 Claude 等 AI 工具的早期使用者,其中計算機專業尤為突出。計算機專業僅占美國學位的 5.4%,但在 Claude.ai 的對話中,占比卻高達 36.8%。相比之下,商科、健康科學和人文學科的學生,Claude 的使用率相對較低。
總結了學生與 AI 交互的四種模式,每種模式在數據中的占比大致相同(各占對話總數的 23-29%),分別是直接解決問題、直接生成內容、協作解決問題和協作生成內容。
學生使用 AI 主要是為了創造新知識和進行分析,如創建編程項目或分析法律概念。這與布魯姆分類法中的高階認知功能相契合。不過,這也引發了人們的擔憂:如何防止學生過度依賴 AI,而放棄自身關鍵認知能力的鍛煉?
教育領域的 AI 使用情況研究人們如何使用 AI 模型時,保護用戶隱私是重中之重。
Claude Insights and Observations(簡稱 Clio)是一款自動分析工具,能幫助了解人們使用 Claude 的具體情況。
Clio 能深入挖掘用戶與 Claude 的對話內容,將其提煉成諸如「調試代碼」「解釋經濟概念」等高層次的總結,從而發現 AI 的使用模式。
研究中,Clio 分析了來自 Claude.ai 免費和專業賬戶約 100 萬條匿名對話。
然后,進一步篩選出與學生學業緊密相關的對話,如課程作業、學術研究,最終得到 574,740 條有效對話。
接著,Clio 對這些對話進行分類匯總,從不同角度得出有價值的見解,包括不同學科在對話中的占比、學生與 AI 交互方式的差異,以及學生交給 AI 完成的任務類型等。
學生用 AI 做什么?研究發現,學生使用 Claude 的主要目的,是跨學科地創建和優化教育內容,這類對話占比達到 39.3%。
具體為設計練習題、潤色論文、總結學術資料等。
33.5% 的對話是讓 Claude 為作業提供技術解答,如幫學生調試代碼、修復編程錯誤、實現算法和數據結構,或解答數學難題。
其中部分行為可能存在作弊嫌疑,后面會詳細討論。
另外,還有一部分學生用來分析和可視化數據(11.0%)、輔助研究設計和工具開發(6.5%)、繪制技術圖表(3.2%),以及進行翻譯和校對(2.4%)。
下圖是各學科常見請求的詳細分類。
通過對比 Claude.ai 的使用模式和美國各學科頒發學士學位的數量,發現計算機專業使用 Claude 的比例極高。
雖然計算機專業在學士學位中僅占 5.4%,但在 Claude.ai 的對話中卻占了 38.6%。這可能是因為 Claude 在編程方面的獨特優勢。
自然科學和數學專業 Claude.ai 的使用占比,也高于這兩個專業的學生人數的占比(分別為 15.2% 和 9.2%)。
理工科學生,特別是計算機專業的學生,可能更早地將 Claude 用于學習。
這可能是因為計算機學生對 Claude 更熟悉,同時 AI 系統在處理 STEM 任務時,也更出色。
商科相關的對話在 Claude.ai 上僅占 8.9%,而商科學位在美國學士學位中占比高達 18.6%,可見 Claude 在商科領域的使用率較低。
分析學生與 AI 的交互時,識別出了四種不同的交互模式,按照兩個不同維度分類,具體如下圖。
第一個維度是「交互模式」,包括:
(1)直接對話,指的是用戶期望盡快得到問題的答案,解決自己的疑問。
(2)協作對話,即用戶主動與模型展開交流,通過對話來實現自己的目標。
第二個維度是交互的「期望結果」,分為:
(1)解決問題,也就是用戶尋求問題的解決辦法或解釋。
(2)生成輸出,意味著用戶想要生成像演示文稿、論文這類較長的內容。
這 4 種交互在對話中的占比相近(均在 23%-29% 之間),體現了學生對 AI 的多元應用。
傳統的網絡搜索通常只能提供直接答案,而 AI 支持更為豐富的交互方式,為教育帶來了新的機遇。
以下是一些用于學習的案例:
闡釋哲學概念與理論,幫助理解其內涵。
打造全面的化學學習資料,助力化學知識的學習。
為作業講解肌肉的解剖結構、生理機能和功能概念。
與此同時,AI 也帶來了新的難題。
一個備受關注的問題是:「學生在多大程度上利用 AI 作弊?」
這個問題很難給出確切答案,因為并不清楚 Claude 的每一個回復在具體學習場景中的實際用途。
比如「直接解決問題」的對話,既可能是學生在居家考試中作弊,也可能只是在檢查練習題答案。
「直接生成成果」的對話,也許是學生想直接生成一篇論文,也可能是為進一步研究總結知識要點。
至于協作對話是否屬于作弊,也取決于具體的課程規定。
實際上,近一半(約 47%)學生與 AI 的對話屬于直接對話,即參與度較低,只是單純尋求答案或內容。
雖然很多對話是出于合理的學習目的(如詢問概念性問題、生成學習指南),但還是發現了一些令人擔憂的情況:
讓 AI 提供機器學習選擇題的答案。
直接獲取英語測試題的答案。
借助 AI 改寫營銷和商業文本,以躲避抄襲檢測。
這些現象引發了關于學術誠信、批判性思維能力培養,以及如何有效評估學生學習效果的思考和討論。
即使是協作對話,學習成果也可能存在爭議。
比如「求解概率和統計作業問題并給出解釋」,雖然涉及學生與 AI 的多次交流,但大部分思考過程是由 AI 完成的。
Anthropic 會持續關注這些交互情況,努力甄別哪些真正有助于學習和批判性思維的養成。
特定學科的 AI 使用模式不同學科的學生與 AI 的互動方式存在差異。
在自然科學與數學領域,學生的對話多圍繞解決問題展開,常見的如「通過逐步計算求解特定概率問題」「為學術作業或考試題目提供詳細解答」。
計算機科學、工程以及自然科學與數學專業的學生,更傾向于選擇協作對話。而人文、商業和健康領域的學生,在協作對話和直接對話之間的選擇相對均衡。
教育領域的對話中,生成輸出的需求最為突出,占比達到 74.4%。不過,這可能是由于篩選方法不夠完善。
這表明,針對不同學科制定專門的 AI 教育策略,或許能取得更好的效果。
團隊還研究了學生將哪些認知任務交給 AI 處理。
研究采用了布魯姆分類法,這是一種在教育領域用于將認知過程從簡單到復雜進行分類的框架。
雖然該框架最初是針對學生思維設計的,對其進行調整,用來分析 Claude 與學生對話時的回復。
研究結果顯示,Claude 主要承擔高階認知功能,創造(39.8%)和分析(30.2%)是最常見的操作。
低階認知任務的占比相對較低,應用(10.9%)、理解(10.0%)和記憶(1.8%)。
生成學術文本摘要、撰寫論文反饋等生成任務,更多涉及創造。而解決微積分問題、解釋編程基礎知識等任務,則更多運用分析功能。
雖然 AI 具備這些能力,但這并不意味著學生不能自己運用這些技能。
比如,學生可以和 AI 共同完成項目,或者在其他場景中利用 AI 生成的代碼來分析數據集。
不過,這確實引發了人們的擔憂,學生是否會過度依賴 AI,導致自身認知能力發展受阻。
畢竟,如果基礎技能得不到鍛煉,就如同倒金字塔一樣,難以穩固支撐高階思維的發展。
參考資料:
https://www.anthropic.com/news/anthropic-education-report-how-university-students-use-claude
https://x.com/AnthropicAI/status/1909626720476365171
本文來自微信公眾號:新智元(ID:AI_era)
本文鏈接:http://www.tebozhan.com/showinfo-45-12279-0.htmlAI 席卷校園:百萬條對話揭秘“Claude 是代碼救星還是作弊工具”
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com