近期,日語AI領域迎來了一項重要突破,一家名為Shisa.AI的東京初創公司發布了其最新日英雙語模型——Shisa V2405B,這一成果迅速吸引了業界的廣泛關注。Shisa.AI專注于為日本市場開發先進的開源AI語言和語音模型,而此次發布的模型更是被譽為日本有史以來訓練的最強大型語言模型。JXJ28資訊網——每日最新資訊28at.com
據了解,Shisa V2405B是基于Llama3.1構建的,不僅在日語任務上表現出色,還保留了強大的英語處理能力。測試數據顯示,該模型在多項日語基準測試中超越了GPT-4及GPT-4Turbo,與最新的GPT-4o和DeepSeek-V3在日語任務上的表現不相上下。這一突破性進展標志著日本本土AI實驗室在全球AI競爭中邁出了重要一步。JXJ28資訊網——每日最新資訊28at.com
Shisa.AI在模型開發過程中,放棄了昂貴的持續預訓練和分詞器擴展,而是聚焦于優化后訓練流程。通過合成數據驅動的方法,他們顯著提升了模型性能。其核心數據集ultra-orca-boros-en-ja-v1經過精心處理,被認為是目前最強大的日英雙語數據集之一。這一數據集已在Apache2.0許可證下免費開放,為全球開發者提供了寶貴的資源。JXJ28資訊網——每日最新資訊28at.com
Shisa V2系列模型涵蓋了從7B到405B參數的不同規模,滿足多樣化需求。在日語語法、角色扮演、翻譯等任務上,這些模型均表現出色。特別是在shisa-jp-ifeval(日語指令遵循測試)、shisa-jp-rp-bench(日語角色扮演基準)和shisa-jp-tl-bench(日英翻譯基準)等測試中,Shisa V2系列模型均優于各自的基礎模型。Shisa V2405B在訓練中融入了少量韓語和繁體中文數據,進一步增強了其多語言能力。JXJ28資訊網——每日最新資訊28at.com
Shisa.AI的開源精神不僅推動了日語AI的發展,還為全球AI社區帶來了積極影響。他們公開了Shisa V2系列的訓練日志,訓練過程使用了AWS Sagemaker的4節點H100集群,并結合了Axolotl、DeepSpeed和Liger Kernel等先進技術。Shisa.AI還計劃開源其日語專用基準測試工具,助力日語大型語言模型的研究和評估。JXJ28資訊網——每日最新資訊28at.com
Shisa.AI的成功展示了日本在AI領域的創新實力。對于需要處理復雜日語任務的開發者來說,Shisa V2系列模型無疑是一個強大的工具。隨著Shisa.AI不斷更新其模型和資源,日本在全球AI領域的競爭力將得到進一步提升。JXJ28資訊網——每日最新資訊28at.com
舉報 0收藏 0打賞 0分享 0 更多>同類資訊
原菜鳥驛站掌門人梅鋒峰或將重返老東家06-05

長城皮卡5月銷量飄紅:國內稱霸,海外加速布局06-05

維立志博港股上市路:年虧3億,正心谷資本等股東加持能否破局?06-05

天富龍將登陸上交所主板,年營收近40億,朱大慶夫婦持股超九成06-05國產大飛機C919南陽支線機場商業首航成功,開啟新篇章!06-05

Mac版ChatGPT新功能上線:AI錄音轉錄+云文件智能分析,生產力大幅提升!06-05Reddit指控Anthropic違規訪問超十萬次,AI版權糾紛再升級06-05谷歌調查:Z世代與千禧一代更傾向通行密鑰,無密碼未來指日可待?06-05

英偉達推出Llama Nemotron Nano VL:視覺-語言模型處理文檔更高效06-05貴州茅臺5月底累計回購股份331萬股,斥資超50億貴州茅臺公告,2025年5月,公司累計回購股份1,292,602股,占公司總股本的比例為0.1029%,購買的最高價為1,639.99元/股、最低價為1,527.30元/股,支付的金額為2,061,096,5…06-05海天味業H股全球發售,香港聯交所上市計劃獲董事會批準海天味業公告稱,公司第六屆董事會第六次會議于2025年6月3日召開,審議通過關于公司H股全球發售并在香港聯交所上市的相關安排,并修訂《公司章程(草案)》。董事會同意刊發符合相關法律法規要求的招股說明書及其他相…06-05

小紅書一周攔截超3萬條網暴信息,嚴懲惡意泄露隱私行為新榜訊 6月3日,小紅書發布公告披露,近一周內,平臺強力開展網絡暴力信息治理工作,成功攔截涉網暴信息達31780條,清理此類信息4288條,并對17個違規賬號作出處置。特別值得關注的是,在此次治理中,發現涉及…06-05

邁凱倫750S勒芒特別版來襲!致敬傳奇,限量50臺,性能爆表06-05

Meta攜手迪士尼等,為新智能眼鏡Loma爭取獨家流媒體內容?06-05云海肴餐廳涉字節跳動食物中毒案,將面臨罰款與整改06-05點擊查看更多 +
全站最新
尋找“地球2.0”,超級地球發現意義何在?

宜居帶“超級地球”被發現,或藏類地生命奧秘

大眾汽車大重組:2萬員工將自愿離職,轉型之路如何走?

長城皮卡5月銷量飄紅:國內稱霸,海外加速布局

大眾汽車德國重組:2萬名員工自愿離職,轉型加速

比亞迪刀片電池助力,電摩續航500公里,每年能省多少油錢?
熱門內容- 夸克AI升級新高度,深度搜索Pro將解鎖專業領域難題
- 夸克深度搜索:AI大腦再進化,復雜問題也能一鍵解鎖滿分答案!
- 騰訊員工工位曝光:個性十足,寬敞舒適引熱議!
- 臺灣核電時代落幕:最后一座核電站正式停運
- 綠地張玉良全票連任,70歲再出發引領“二次創業”征程
- BOSS直聘緊急下架“秀恩愛”招聘:違規信息秒處理
- 華為Pura 80系列6月11日震撼發布
- 于東來劉強東強強聯手!京東物流胖東來供應鏈基地6月運營,年產值25億
- Cursor大放異彩!學生可免費享一年Pro會員,AI編程教育迎來新機遇
- UU跑腿高管午休跑腿接單,創始人:為讓他們體驗基層艱辛
- 5月19日油價調整在即,92號汽油能否順利回歸6元時代?
- 劉強東日本街頭變“豬豬俠”,京東外賣二維碼搶鏡外賣大戰
- 阿里2025財年Q4財報出爐:營收穩增,凈利潤大漲22%,AI+云成新引擎?
- 2025年淘寶天貓京東618活動時間正式公布:從5月13日開始到6月18日結束
- 比特幣價格飆升至10.65萬美元,日內漲幅超3.39%!
本欄最新
原菜鳥驛站掌門人梅鋒峰或將重返老東家

長城皮卡5月銷量飄紅:國內稱霸,海外加速布局

維立志博港股上市路:年虧3億,正心谷資本等股東加持能否破局?

天富龍將登陸上交所主板,年營收近40億,朱大慶夫婦持股超九成

Mac版ChatGPT新功能上線:AI錄音轉錄+云文件智能分析,生產力大幅提升!

英偉達推出Llama Nemotron Nano VL:視覺-語言模型處理文檔更高效
本文鏈接:http://www.tebozhan.com/showinfo-16-156637-0.html日本AI新突破!Shisa V2405B開源,日語處理能力超越GPT-4
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: ChatGPT新功能來襲:打造職場高效協作新體驗!
下一篇: 原菜鳥驛站掌門人梅鋒峰或將重返老東家