快科技10月17日消息,今天,NVIDIA悄然開源了名為Nemotron-70B的AI模型。
這款模型一經發布便在多個基準測試中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內的140多個開閉源模型,僅次于OpenAI的新模型o1。
對此AI社區驚呼,新的開源王者又來了?業內更是表示,用Llama 3.1訓出小模型吊打GPT-4o,簡直是神來之筆。
從命名上可以看出,Nemotron-70B基于Llama-3.1-70B開發,在沒有專門提示和額外推理token的情況下,Nemotron-70B也能答對復雜的推理問題,如“草莓有幾個r”的經典難題。
業內人士評價,NVIDIA在Llama 3.1基礎上訓練出的這個不太大模型,能夠超越GPT-4o和Claude 3.5 Sonnet,是一次技術上的飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經可以在線體驗。
此外,英偉達還開源了Nemotron的訓練數據集 HelpSteer2,包括如下:
構建了21362個提示響應,使模型更符合人類偏好,也更有幫助、更符合事實、更連貫,并且可以根據復雜度和詳細度進行定制;
構建了20324個用于訓練的提示響應,1038個用于驗證。
本文鏈接:http://www.tebozhan.com/showinfo-17-122729-0.html全新開源王者!NVIDIA悄然推出70B AI模型:力壓GPT-4o、僅次于OpenAI o1
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com