當前位置：首頁 > 元宇宙 > AI

DeepSeek 新專利公布：減少數據采集時網絡資源消耗

來源：責編：時間：2025-04-05 09:27:50 76觀看

導讀 4 月 2 日消息，從國家知識產權局中國專利公布公告網獲悉，DeepSeek 關聯公司杭州深度求索人工智能基礎技術研究有限公司申請的“一種廣度數據采集的方法及其系統”專利于 4 月 1 日公布。專利摘要顯示：該發明的有

4 月 2 日消息，從國家知識產權局中國專利公布公告網獲悉，DeepSeek 關聯公司杭州深度求索人工智能基礎技術研究有限公司申請的“一種廣度數據采集的方法及其系統”專利于 4 月 1 日公布。

專利摘要顯示：

該發明的有益效果在于：發現盡可能多的網頁鏈接，并減少對網站的流量沖擊；對已經下載的內容進行分析，對未下載的鏈接進行質量推斷，通過擇優下載分配額度的方式，減少低質量網頁下載和重復下載，提高數據質量及下載效率，減少在數據采集過程中網絡資源的消耗；采用單獨的信息回灌隊列，保證網頁元信息庫修改操作的原子性和穩定性。

背景技術稱：近年來，隨著人工智能技術的進展，NLP 自然語言領域取得了巨大的進步。許多大語言模型 (LargeLanguageModels,LLMs) 被訓練應用于自然語言處理領域，用于研究實現人與計算機之間用自然語言進行有效通信的各種理論和方法。

大語言模型的訓練需要構建一個高質量、多樣化的大語言模型數據集，這需要將網頁數據采集并處理后得到大量高質量的文本信息作為模型的輸入，用于大語言模型進行訓練。

然而，現有的數據采集技術存在諸多問題，比如對復雜站點進行采集時，無法獲取完整鏈接；容易過量下載，造成對方網站崩潰；對下載頁面不進行內容質量分析和推斷，造成重復下載或低質下載、影響數據采集的效率。

因此，在大量網頁數據獲取的過程中，如何快速、精準、安全、高效地采集互聯網數據變得至關重要。

本文鏈接：http://www.tebozhan.com/showinfo-45-11935-0.htmlDeepSeek 新專利公布：減少數據采集時網絡資源消耗

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：馬斯克 AI 超算細節曝光：已投資 4 億美元，百萬 GPU 電力缺口大

下一篇：多名作家致信英國政府，敦促追究 Meta 用有版權書籍訓練 AI 的侵權責任

標簽：

熱門焦點

這一超級富豪“逆襲”，身價大增4330億

來源：侃見財經互聯網的突圍沒有“終點”。在快節奏的商業環境下，不斷的試錯成了互聯網企業的標配，一年一個風口，一個風口造就一個熱點，但是回頭來看，最終受益的還是身處
百度元宇宙希壤是什么？（附下載）

百度元宇宙希壤是什么，最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入？今天小編帶你來全面了解一下?！跋Ｈ馈笔前俣扔?021年12月27日于百度AI開
以太坊升級將會帶來的5個改變

以太坊自2015年誕生以來就廣受歡迎，但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用，用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
重溫 1602 年：DAO 是新的企業范式嗎？

作者：Andrew Singer“ 將你的選票委托給行業有能力的專家，將使所有者在這些公司的管理中擁有更強大、更清晰的話語權 ?！?602 年，荷蘭東印度公司成立，許多人認為
NFT也有黃牛？這家公司專門對付外掛作弊機器人

澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一，Sam是一名出生于紐卡斯爾的黑客，他的職業生涯始于為國防
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當前數字景觀
虛擬鄧麗君后，數字人賽道開啟3.0時代

“如果右腦時代來臨，虛擬世界將是對人類才華的無限放大?！?郭曉喆稱，開發數字人形象時，自己的團隊在內部“卷”了一下：“當我們翻閱大量歷史典籍的時候，蘇小妹找到
電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現的術語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模
售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

Everydays: the First 5000 Days/Beeple去年三月，一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是，這個拍賣作品不是出自哪位藝術大

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek 新專利公布：減少數據采集時網絡資源消耗

這一超級富豪“逆襲”，身價大增4330億

百度元宇宙希壤是什么？（附下載）

以太坊升級將會帶來的5個改變

重溫 1602 年：DAO 是新的企業范式嗎？

NFT也有黃牛？這家公司專門對付外掛作弊機器人

元宇宙存在的意義和價值

虛擬鄧麗君后，數字人賽道開啟3.0時代

電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

最新推薦

元宇宙里賣酸奶，好炸裂的操作！

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

冰墩墩的NFT暴漲千倍？真相則是價格暴跌、成交遇冷

百度虛擬人——AI手語主播首次亮相冬奧會！

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

猜你喜歡

熱門推薦

相關資訊