“以5G、人工智能、大模型等為代表的數(shù)字技術(shù)迅速發(fā)展,今年前兩個月數(shù)字產(chǎn)業(yè)業(yè)務(wù)收入同比增長8.2%?!惫I(yè)和信息化部總工程師謝少鋒介紹,我國已形成了覆蓋基礎(chǔ)層、框架層、模型層、應(yīng)用層的完整產(chǎn)業(yè)體系,建成鋼鐵、煤炭等高質(zhì)量行業(yè)數(shù)據(jù)集,培育出一批競爭力強的通用大模型和行業(yè)大模型,國產(chǎn)大模型登頂全球主流開源社區(qū)下載量榜單。
人工智能的發(fā)展離不開數(shù)據(jù)資源開發(fā)利用。高質(zhì)量數(shù)據(jù)作為人工智能應(yīng)用底座,對通用大模型和行業(yè)大模型都具有很強的保障支撐作用。今年的《政府工作報告》提出,加快完善數(shù)據(jù)基礎(chǔ)制度,深化數(shù)據(jù)資源開發(fā)利用,同時也強調(diào)支持大模型廣泛應(yīng)用。
作為數(shù)據(jù)要素市場化價值化的主陣地,企業(yè)對于數(shù)據(jù)資源開發(fā)利用具有較強需求。據(jù)經(jīng)濟合作與發(fā)展組織測算,數(shù)據(jù)流動對各行業(yè)利潤增長的平均促進率在10%左右,在數(shù)字平臺、金融等行業(yè)可達32%?!拔覀児膭钇髽I(yè)在不違反法律法規(guī)、不危害國家安全和公共利益前提下,充分開發(fā)利用其在生產(chǎn)經(jīng)營過程中形成或合法獲取、持有的數(shù)據(jù)?!眹覕?shù)據(jù)局副局長陳榮輝說。
近年來,中國電信通過加強企業(yè)數(shù)據(jù)和外部數(shù)據(jù)匯聚,形成海量多源數(shù)據(jù)優(yōu)勢,在企業(yè)數(shù)智化轉(zhuǎn)型應(yīng)用上取得顯著成效。在用戶服務(wù)方面,利用網(wǎng)絡(luò)資源數(shù)據(jù)、網(wǎng)絡(luò)感知數(shù)據(jù)和歷史投訴數(shù)據(jù),主動修復(fù)客戶感知;在反詐識別方面,通過話務(wù)、漫游行為、終端等數(shù)據(jù),構(gòu)建反詐模型,甄別潛在“涉詐”號碼并及時處置;在民生服務(wù)方面,根據(jù)運營商位置數(shù)據(jù)及政務(wù)公共數(shù)據(jù),構(gòu)建應(yīng)急通知、民生關(guān)懷等能力,已為超過300家政企用戶提供大數(shù)據(jù)短信提醒服務(wù)。
“數(shù)據(jù)要素與人工智能技術(shù)深度融合是驅(qū)動產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型的關(guān)鍵動能,數(shù)據(jù)是訓(xùn)練和優(yōu)化人工智能模型的核心要素。”中國電信集團有限公司副總經(jīng)理黃智勇介紹,基于50萬小時的脫敏音頻數(shù)據(jù)集,中國電信打造了業(yè)界首個支持50種方言自由混說的語音大模型。同時,面向教育、交通等領(lǐng)域,聯(lián)合用戶共同建設(shè)99個行業(yè)數(shù)據(jù)集,涵蓋語義、語音、圖像、視頻等類型,推出50余款行業(yè)大模型。例如,通過知識庫和工單數(shù)據(jù)開發(fā)的星辰政務(wù)熱線大模型,已在上海等地的12345市民服務(wù)熱線應(yīng)用,一次性解決率提升30%,派單準(zhǔn)確率提升15%。
同樣在政務(wù)領(lǐng)域深耕多年的科大訊飛,近期再度升級其星火X1大模型。由于融入了更多場景復(fù)雜類型數(shù)據(jù),模型的泛化性得到進一步提升,在教育、醫(yī)療、司法等多個重點行業(yè)擴大應(yīng)用范圍。以司法行業(yè)為例,大模型根據(jù)材料總結(jié)案件事實以及判決理由,精準(zhǔn)把握用戶指令,詳細分析爭議點,快速定位關(guān)鍵信息,并輸出準(zhǔn)確內(nèi)容,為用戶提供專業(yè)、可靠的智能支持。
訊飛星火X1升級背后,是一系列技術(shù)創(chuàng)新與理念突破。首先,提出了基于問題難度的大規(guī)模多階段強化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語言理解等場景提升模型效果。其次,統(tǒng)一模型下的快慢思考混合訓(xùn)練方法,能夠充分發(fā)揮數(shù)據(jù)相互促進作用,支撐用戶更高效便捷地部署使用。
此外,大模型在電子、原材料、消費品等行業(yè)也加快落地,在研發(fā)設(shè)計、中試驗證、生產(chǎn)制造、運營管理等環(huán)節(jié)得到應(yīng)用?!拔覀冊诘湫桶咐骷噙x中發(fā)現(xiàn),北京一家平板顯示企業(yè)利用大模型一鍵生成排產(chǎn)計劃,產(chǎn)線排產(chǎn)的時間降低了75%。”謝少鋒表示,下一步,工信部將加強通用大模型和行業(yè)大模型的研發(fā)布局,加快建設(shè)工業(yè)領(lǐng)域高質(zhì)量數(shù)據(jù)集,夯實基礎(chǔ)底座。(記者 李芃達)
本文鏈接:http://www.tebozhan.com/showinfo-16-147384-0.html筑牢人工智能數(shù)據(jù)底座
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 加快人形機器人從舞臺走向工廠