AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

來源: 責編: 時間:2025-04-24 14:45:58 11觀看
導讀 4 月 22 日消息,最新報告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構,實現精準的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。注:谷歌于 3 月 25 日向付費用戶和開發者發布 Gemi

4 月 22 日消息,最新報告指出,谷歌旗下的 Gemini 2.5 Pro 模型能準確解析 PDF 文檔的視覺結構,實現精準的視覺引用功能,成為首款能完全理解 PDF 布局的 AI 模型。SrD28資訊網——每日最新資訊28at.com

注:谷歌于 3 月 25 日向付費用戶和開發者發布 Gemini 2.5 Pro 實驗模型,僅隔 4 天時間,谷歌便通過免費 Web 應用向全球用戶開放。SrD28資訊網——每日最新資訊28at.com

Gemini 2.5 Pro 不僅能提取 PDF 文檔中的文本內容,還能理解其視覺布局,包括圖表、表格和整體排版。SrD28資訊網——每日最新資訊28at.com

谷歌在開發者文檔中表示,該模型具備“原生視覺”(Native Vision)能力,支持處理最多 3000 個 PDF 文件(每個文件上限為 1000 頁或 50MB),同時擁有 100 萬 token 的超大上下文窗口,未來計劃擴展至 200 萬 token。SrD28資訊網——每日最新資訊28at.com

AI 初創公司 Matrisk 的聯合創始人 Sergey Filimonov 特別贊揚了 Gemini 2.5 Pro 在 PDF 視覺引用上的表現。SrD28資訊網——每日最新資訊28at.com

Filimonov 指出,傳統的文本分割方法會切斷用戶與原文的視覺聯系,導致無法直觀驗證信息的來源。甚至在 ChatGPT 中,點擊引用也只能下載 PDF,迫使用戶自行判斷模型是否“幻覺”,這嚴重損害了用戶信任。SrD28資訊網——每日最新資訊28at.com

過去,引用文檔內容往往只能高亮大段無關文本,精準度極低。Gemini 2.5 徹底改變這一現狀,它不僅能將提取的文本片段映射回原始 PDF 的確切位置,還能以前所未有的精度鎖定特定句子、表格單元甚至圖像。SrD28資訊網——每日最新資訊28at.com

這種技術突破為用戶提供了直觀的視覺反饋,例如在詢問房屋費率變化時,系統能直接高亮文檔中相關數據(如 15.4% 的費率變化),并標注來源依據。SrD28資訊網——每日最新資訊28at.com

這種清晰度和交互性是現有工具無法企及的。Gemini 2.5 不僅優化了現有流程,更開啟了全新的文檔交互模式。SrD28資訊網——每日最新資訊28at.com

SrD28資訊網——每日最新資訊28at.com

相比之下,Gemini 2.5 以 0.804 的 IoU(交并比)精度大幅領先其他模型,如 OpenAI 的 GPT-4o(0.223)和 Claude 3.7 Sonnet(0.210),展現出驚人的空間理解能力。SrD28資訊網——每日最新資訊28at.com

提供商模型IOU簡評Gemini2.5 Pro0.804非常優秀Gemini2.5 Flash0.614有時表現不錯Gemini2.0 Flash0.395OpenAIgpt-4o0.223OpenAIgpt-4.10.268OpenAIgpt-4.1-mini0.253Claude3.7 Sonnet0.210

Gemini 2.5 的潛力遠不止于文本定位。它還能從 PDF 中提取結構化數據,同時明確標注每個數據的來源位置,解決下游決策中因數據來源不明而產生的信任障礙。SrD28資訊網——每日最新資訊28at.com

SrD28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-12558-0.html力壓群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精確引用

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI時代瀏覽器大戰:Chrome命運懸而未決,OpenAI欲收入囊中?

下一篇: 智能軟體仿生觀賞魚“金鱗”亮相,在水族館、公園有望“以假亂真”

標簽:
  • 熱門焦點
  • 網易音樂、理想申請元宇宙商標被駁回,“啫喱”暫停新用戶進入

    【《原神》開發商米哈游宣布創立元宇宙品牌】《原神》開發商米哈游宣布推出元宇宙品牌 HoYoverse,旨在通過各種娛樂服務為全球玩家創造并提供沉浸式虛擬世界體
  • 中國區塊鏈產業生態地圖報告(2021)

    區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新,以服務實體經濟、政務民生以及公共服務等領域為落腳點,以期實現整個地區和產業的資
  • Web3 去中心化身份管理系統的歷史、現狀與展望

    身份、數字資產和在線資料的映射最近在區塊鏈行業獲得了極大的關注。新技術正在形成架構,這將進一步為去中心化和以用戶為中心的機制鋪平道路。本文將討論以下
  • 中國銀保監管委提示:謹慎投資,勿做接盤俠

    中國銀保監管委,發布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • 2030年的元宇宙產業將會如何發展?

    對互聯網巨頭傳統業務的反壟斷政策倒逼互聯網企業顛覆創新,尋找新的增長點,移動互聯網流量空間見頂之際,元宇宙時代紅利已然開啟。序章:元宇宙應用場景大猜想元宇
  • Kitten Coup社區反轉Cool Kittens NFT騙局

    當狂熱的加密愛好者將金錢投入到NFT圖片時,渾水摸魚的騙局隨之而來,Cool Kittens NFT便是其中一個作惡者,該項目于去年11月在Sonala鏈上啟動小貓形象的NFT鑄造及
  • 頭像類NFTs的統治能持續多久?

    在過去的一兩年里,NFTs在互聯網世界中掀起了一場風暴。今天,當我們想到NFTs時,我們主要想到的是那些充斥著我們的社交媒體屏幕的數字卡通--無聊猿、punks 和介于
  • MR——元宇宙平臺的下一代入口

    作為“元宇宙”的領頭羊,Meta的一舉一動都受到業內的高度關注。華爾街見聞提及,2月17日周四,Facebook母公司Meta在透露,其混合現實技術(MR)將在幾年后實現,讓人們對元
  • 元宇宙專題二:GameFi 深度解析,元宇宙內容雛形顯現

    GameFi=Game(游戲)+DEFI(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
Top