快科技10月17日消息,今天,NVIDIA悄然開源了名為Nemotron-70B的AI模型。
這款模型一經(jīng)發(fā)布便在多個基準(zhǔn)測試中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內(nèi)的140多個開閉源模型,僅次于OpenAI的新模型o1。
對此AI社區(qū)驚呼,新的開源王者又來了?業(yè)內(nèi)更是表示,用Llama 3.1訓(xùn)出小模型吊打GPT-4o,簡直是神來之筆。
從命名上可以看出,Nemotron-70B基于Llama-3.1-70B開發(fā),在沒有專門提示和額外推理token的情況下,Nemotron-70B也能答對復(fù)雜的推理問題,如“草莓有幾個r”的經(jīng)典難題。
業(yè)內(nèi)人士評價,NVIDIA在Llama 3.1基礎(chǔ)上訓(xùn)練出的這個不太大模型,能夠超越GPT-4o和Claude 3.5 Sonnet,是一次技術(shù)上的飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經(jīng)可以在線體驗。
此外,英偉達(dá)還開源了Nemotron的訓(xùn)練數(shù)據(jù)集 HelpSteer2,包括如下:
構(gòu)建了21362個提示響應(yīng),使模型更符合人類偏好,也更有幫助、更符合事實、更連貫,并且可以根據(jù)復(fù)雜度和詳細(xì)度進(jìn)行定制;
構(gòu)建了20324個用于訓(xùn)練的提示響應(yīng),1038個用于驗證。
本文鏈接:http://www.tebozhan.com/showinfo-17-123695-0.html全新開源王者!NVIDIA悄然推出70B AI模型:力壓GPT-4o、僅次于OpenAI o1
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com