在科技日新月異的今天,來自各大科創巨頭的大語言模型 (LLM)* 的涌現象征著人工智能 (AI) 正邁向一個嶄新的紀元,人工智能技術正成為驅動經濟發展、促進生產效能提升以及優化用戶體驗的重要引擎。作為全球前沿科技先行者,理光以其前瞻性的視野和卓越的科研實力,在人工智能領域銳意進取,持續突破。2024 年 6 月 3 日,理光攜手日本理化學研究所創新智能綜合研究中心,利用共同研發的指令數據,成功優化了其日語大語言模型,顯著提升了模型的指令遵循性能。這一日語大模型研發領域里程碑式的突破再次彰顯了理光在人工智能領域的領先地位。
銳意創新,攻克日語大語言模型難關
攻克日語大語言模型發展道路上的重重難關,理光展現了令人矚目的科研成果。相較于英語大語言模型 (LLM) 的迅猛發展,日語 LLM 的研發曾因語言特性和數據收集難題而相對滯后。日語獨特的語法和表達方式,使得基于英語的模型難以直接遷移應用。同時,日語數據資源的稀缺、品質參差不齊以及多樣性不足,也為研發工作增添了難度。
然而,理光憑借其在科技領域的深厚積累和開拓進取的創新精神,成功克服了這些難題。通過與日本理化學研究所的緊密合作,理光獲得了適用于日語大模型訓練的指令數據,并巧妙地將其融入 LLM 的訓練中。理光使用指令數據集“ichikara-instruction”(包含 10329 條指令) 對其研發的 130 億參數日語大語言模型進行了指令調優。這一調優過程旨在減少模型預測與用戶期望之間的偏差,確保模型能夠更準確地遵循人類的指令。通過表 1 數據可以了解到,經過調優,LLM 的指令遵循性能得分從 1.19 分躍升至 3.02 分。對理光最初開發的 3556 條理光制造數據集的調優結果顯示,該模型在同一基準測試中的得分同樣顯著增長。這一進展體現了模型在理解和執行人類指令方面的巨大進步,也證明了數據質量對于提升 LLM 性能的重要性。
此外,表 2 數據對摘要任務的獨立評估進一步彰顯了理光數據集的優越性,特別是在長文本摘要方面。為了滿足客戶對人工智能摘要生成功能的高需求,理光將這一領域作為研發重點,并在數據開發上取得了顯著成果。截至 2024 年 5 月底,理光已成功開發超過 5000 個教學數據集,這些數據集將廣泛應用于公司提供的各類人工智能解決方案中,為客戶提供更加卓越、高效的服務體驗。這一系列的突破不僅彰顯了理光在前沿科技領域的強大實力,也為日語大語言模型的探索、優化與創新樹立了新的行業標桿。
照亮未來,專用 LLM 啟示企業數字化轉型方向
在數字化轉型的浪潮中,理光憑借其在數字化服務領域的深厚積累和對前沿技術的敏銳洞察,專注于為企業提供全面、高效的數字化解決方案。面對日本社會勞動力減少與老齡化的挑戰,眾多企業開始尋求運營創新,而人工智能的引入成為這些企業提高生產率和實現工作方式升級的關鍵。為此,理光致力于為企業量身定制專屬的人工智能模型 (專用 LLM), 這一模型深度結合行業知識、業務細節以及企業特定的專業術語和短語,經過大量數據訓練,確保能精準理解并滿足企業的業務需求,從而在數字化轉型的征程中為企業提供強有力的支持。
理光憑借其日語大語言模型的研發實力,結合企業的獨特信息與知識,已成功開發出適用于不同領域的高精度專用 LLM。這些模型不僅易于定制,且高度適應日語語法,答案準確性高,能夠充分發揮日本公司信息資產的價值。自 2024 年 4 月起,理光開始在云環境中提供這些專用 LLM, 助力客戶在辦公室和工作場所實現數字化轉型。展望未來,理光將繼續致力于為客戶提供符合其業務需求、可靈活應用于各行業的人工智能服務,并不斷結合具體工作場景,開發更多基于專用 LLM 的人工智能工具,為企業的數字化轉型之路提供堅實的保障。
在日語大語言模型研發領域的探索與突破中,理光展現出了其深厚的技術底蘊和卓越的創新能力,這一成就不僅鞏固了其在人工智能科技領域的領先地位,更為那些尋求數字化轉型、渴望在數字時代中脫穎而出的企業提供綜合解決方案。展望未來,理光將持續深化與各界的戰略合作,積極拓寬人工智能技術的應用邊界,推動科技與產業的深度融合,攜手全球合作伙伴共同描繪一幅更加智能高效、人人“悅享工作”的數字藍圖。
*LLM:Large Language Model (大型語言模型)。通過理解句子中相隔較遠的單詞之間的關系,結合上下文的語言環境,來處理自然語言中存在的有多重含義和有歧義的內容。這項技術可以像人類一樣精確地執行“回答自然句子問題”和“文檔摘要提煉”等指令過程,而且也很容易學習。
本文鏈接:http://www.tebozhan.com/showinfo-26-99924-0.html數字化轉型新動力:理光研發專用 LLM,助力企業提升數字化轉型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com