10 月 12 日消息,從中國移動官方獲悉,在今天召開的 2024 中國移動全球合作伙伴大會期間,中國移動聯合電子標準院及 16 家重點央企共同開展大模型評測體系建設工作,并發布《通用大模型評測標準》。
據介紹,該標準是大模型評測體系建設的重要成果,為產業界遴選優質大模型提供重要參考依據。第一階段將圍繞通用領域和 4 個重點行業領域,從評測標準制定、評測基地建設、評測試點應用等方面開展工作。
通用大模型評測標準基于“2-4-6”框架如下:
“2”:兩類評測視角,以重點行業實際使用需求為導向,與國標對模型能力要求拉齊,將評測任務劃分為理解和生成兩類視角。
“4”:四類評測要素,從評測全生命周期中提取出評測工具、評測數據、評測方式和評測指標四類關鍵要素,確保評測工作可實施性。
“6”:六大評測維度,綜合考慮大模型應用過程中的核心能力,設定功能性、準確性、可靠性、安全性、交互性和應用性六大維度。
本文鏈接:http://www.tebozhan.com/showinfo-45-9066-0.html中國移動、電子標準院及 16 家重點央企發布《通用大模型評測標準》
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com