中國(guó)經(jīng)濟(jì)導(dǎo)報(bào)、中國(guó)發(fā)展網(wǎng)訊 4月23日,商湯科技在上海舉辦技術(shù)交流日活動(dòng),發(fā)布行業(yè)首個(gè)“云、端、邊”全棧大模型產(chǎn)品矩陣,以滿足不同規(guī)模場(chǎng)景的應(yīng)用需求。同時(shí)還全新升級(jí)“日日新SenseNova 5.0”大模型體系,其綜合能力全面對(duì)標(biāo)GPT-4 Turbo,技術(shù)領(lǐng)跑加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,實(shí)現(xiàn)大模型按需所取。
在人工智能發(fā)展的最基本法則——尺度定律(Scaling Law)的準(zhǔn)則下,商湯持續(xù)尋求最優(yōu)數(shù)據(jù)配比并建立數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,推動(dòng)自身大模型研發(fā)的同時(shí),也為行業(yè)伙伴提供大模型訓(xùn)練、微調(diào)、部署和各類生成式AI的能力及服務(wù)。商湯科技董事長(zhǎng)兼CEO徐立表示,商湯在尺度定律的指導(dǎo)下,會(huì)持續(xù)探索大模型能力的KRE三層架構(gòu)(知識(shí)—推理—執(zhí)行),不斷突破大模型能力邊界。
自去年4月首次發(fā)布,商湯“日日新SenseNova”大模型體系已正式推出五個(gè)大版本迭代。基于超過10TB tokens訓(xùn)練、覆蓋大量合成數(shù)據(jù),全新的“日日新SenseNova 5.0”(以下簡(jiǎn)稱:日日新5.0)采用混合專家架構(gòu),推理時(shí)上下文窗口可以有效到200K左右。
據(jù)悉,本次更新主要聚集增強(qiáng)了知識(shí)、數(shù)學(xué)、推理及代碼能力,全面對(duì)標(biāo) GPT-4 Turbo,主流客觀評(píng)測(cè)上達(dá)到或超越 GPT-4 Turbo。在文科能力方面,“日日新5.0”的創(chuàng)意寫作能力、推理能力以及總結(jié)能力均大幅提升,相同的中文知識(shí)注入后,可以獲得更好的理解總結(jié)及問答,為教育、內(nèi)容產(chǎn)業(yè)等垂直應(yīng)用場(chǎng)景提供有力輔助。在理科能力方面,“日日新5.0”數(shù)理能力、代碼能力及推理能力達(dá)到業(yè)內(nèi)領(lǐng)先水平,為金融、數(shù)據(jù)分析等場(chǎng)景落地提供堅(jiān)實(shí)基礎(chǔ)。
此外,本次發(fā)布的“日日新5.0”另一核心指標(biāo)就是多模態(tài)能力,商湯多模態(tài)大模型的圖文感知能力達(dá)到全球領(lǐng)先水平,在多模態(tài)大模型權(quán)威綜合基準(zhǔn)測(cè)試MMBench中綜合得分排名首位,在多個(gè)知名多模態(tài)榜單MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得領(lǐng)先成績(jī)。同時(shí),還在應(yīng)用產(chǎn)品層面也實(shí)現(xiàn)了更卓越的多模態(tài)能力,支持高清長(zhǎng)圖的解析和理解以及文生圖交互式生成,還可以實(shí)現(xiàn)復(fù)雜的跨文檔知識(shí)抽取及總結(jié)問答展示,還具備豐富的多模態(tài)交互能力。
前瞻洞察中心化算力需求向端側(cè)擴(kuò)展的未來趨勢(shì)及企業(yè)級(jí)在邊緣側(cè)的AI需求,商湯科技領(lǐng)先業(yè)內(nèi)首次推出“云、端、邊”全棧大模型產(chǎn)品矩陣,其中包括應(yīng)用于終端設(shè)備的“商湯端側(cè)大模型”,以及面向金融、代碼、醫(yī)療、政務(wù)等多個(gè)領(lǐng)域的邊緣產(chǎn)品“商湯企業(yè)級(jí)大模型一體機(jī)”。
今年是端側(cè)大模型應(yīng)用的元年,為了滿足移動(dòng)終端用戶對(duì)大模型技術(shù)的應(yīng)用需求,商湯推出日日新·端側(cè)大模型,性能實(shí)現(xiàn)同等尺度性能最優(yōu),跨級(jí)尺度全面領(lǐng)先。同時(shí),還推出端云協(xié)同解決方案,可以通過智能化判斷協(xié)同發(fā)揮端云各自優(yōu)勢(shì),需要聯(lián)網(wǎng)搜索或處理復(fù)雜場(chǎng)景時(shí)分流至云端處理,部分場(chǎng)景端側(cè)處理占比超過80%,從而顯著降低推理成本。
據(jù)了解,商湯日日新·端側(cè)大語言模型的推理速度達(dá)到了業(yè)內(nèi)最快,可在中端平臺(tái)實(shí)現(xiàn)18.3字/s的平均生成速度,旗艦平臺(tái)更是達(dá)到了78.3字/s。擴(kuò)散模型同樣可在端側(cè)實(shí)現(xiàn)業(yè)內(nèi)最快的推理速度,端側(cè)LDM-AI擴(kuò)圖技術(shù)在某主流平臺(tái)上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬像素及以上的高清圖片,支持在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能。
對(duì)于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的AI應(yīng)用需求,商湯推出企業(yè)級(jí)大模型一體機(jī),可同時(shí)支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負(fù)載50%。
當(dāng)天,商湯科技董事長(zhǎng)兼CEO徐立還帶來了三段完全由大模型生成的視頻,并強(qiáng)調(diào)文生視頻平臺(tái)對(duì)于人物、動(dòng)作和場(chǎng)景的可控性。通過商湯打造的智能算力中心,可以不斷賦能于大模型的訓(xùn)練,目前,日日新大模型體系在自然語言處理、視頻生成和深度學(xué)習(xí)優(yōu)化等多個(gè)方面取得創(chuàng)新。未來,通過輸入一段文字或一個(gè)完整的描述,就可以生成一段視頻,而且人物的服飾、發(fā)型、場(chǎng)景都可以根據(jù)預(yù)先設(shè)定,保持視頻內(nèi)容的連貫性和一致性。(倪珺)
本文鏈接:http://www.tebozhan.com/showinfo-28-7983-0.html商湯科技發(fā)布行業(yè)首個(gè)“云、端、邊”全棧大模型布局 實(shí)現(xiàn)AI自由
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com