在看刑偵片的時候,每當(dāng)破案遇阻,你是否想象過,一種能夠僅基于一張嫌疑人出現(xiàn)的場景照片,就即刻定位到場景所在地的具體經(jīng)緯度的技術(shù)呢?
現(xiàn)在,這種想象,已然成為現(xiàn)實!
初創(chuàng) AI 公司 graylark 發(fā)布了一項名為「GeoSpy」的系列產(chǎn)品,因其是一個革命性的照片地理定位系統(tǒng),近來引發(fā)熱議。
照片地理定位是指僅根據(jù)圖像的視覺內(nèi)容確定圖像拍攝地點的過程。它已成為計算機(jī)視覺中的一個關(guān)鍵領(lǐng)域,其應(yīng)用范圍涵蓋安全、導(dǎo)航、社交媒體等多個方面。
早期照片地理定位方法主要關(guān)注簡單任務(wù),例如識別著名地標(biāo)或使用嵌入圖像中的元數(shù)據(jù),如 GPS 坐標(biāo)。
然而,研究人員很快意識到更廣泛應(yīng)用的潛力 —— 從不含標(biāo)志性地標(biāo)的普通場景中確定位置。隨著技術(shù)的進(jìn)步,研究人員超越了元數(shù)據(jù),開始分析圖像的視覺內(nèi)容,包括建筑風(fēng)格、植被和道路標(biāo)記。
照片地理定位背后的原理包括分析圖像特征,如紋理、顏色以及植被、建筑和標(biāo)牌等上下文元素。隨著時間的推移,人工智能的進(jìn)步和更大數(shù)據(jù)集的獲取顯著提高了這些系統(tǒng)的準(zhǔn)確性和速度。
GeoSpy 支持在參考數(shù)據(jù)集中沒有匹配的圖像時也能提供近似位置,非常適合千米范圍內(nèi)的更廣泛地理定位任務(wù)。
而基于 Superbolt 的 GeoSpy Pro 則支持上傳一張不帶有任何標(biāo)簽數(shù)據(jù)(如地理位置、拍攝時間)的照片,就能定位到照片中的拍攝所在地,并結(jié)合地圖給出 3D 實景。
體驗鏈接:https://superbolt.geospy.ai/
如下圖,用戶上傳了一張車內(nèi)視角的照片后,它就可以直接定位到對應(yīng)的地理位置,報告出所在城市和經(jīng)緯度,甚至能直接給出對應(yīng)建筑的 3D 實景地圖。
而且還支持給出所查圖片的相似圖,以形成遷移連接。
看起來這么神奇的效果,是怎么做到的呢?
核心思想其實很簡單:如果你用足夠多的與真實地點相關(guān)的照片來訓(xùn)練一個 AI 系統(tǒng),AI 就可以學(xué)會識別需要人類花費數(shù)年才能掌握的微妙線索。
例如一些城市消防栓上使用的獨特油漆顏色。雖然這個細(xì)節(jié)本身并不特別有用,但將其與照片中的可見街道名稱或咖啡店招牌結(jié)合起來,可能就會讓人更肯定地猜測出位置。而將這個過程重復(fù)應(yīng)用于圖像中的數(shù)千個元素。隨著時間的推移,AI 比人更有效地識別這些模式。GeoSpy 就是利用這一能力,成為了地理定位的強(qiáng)大工具。
進(jìn)階版的 GeoSpy:SuperboltSuperbolt 是 GeoSpy 的高端產(chǎn)品 GeoSpy Pro 的關(guān)鍵組件。GeoSpy Pro 融合了 Superbolt 視覺位置識別(VPR)的高精度與 GeoSpy 的照片估算技術(shù),打造出的地理定位系統(tǒng)具備以下能力:
精準(zhǔn)定位:利用 Superbolt 的參考數(shù)據(jù)庫,能將圖像匹配精度控制在數(shù)米之內(nèi)。
廣泛位置推斷:在缺乏匹配參考數(shù)據(jù)時,也可將位置估算范圍縮小至數(shù)公里以內(nèi)。
Superbolt 并非普通的升級,而是地理定位領(lǐng)域的一次范式變革。憑借無可比擬的數(shù)據(jù)集、前沿的嵌入技術(shù)以及精準(zhǔn)的性能,Superbolt 助力 GeoSpy 成為視覺位置識別與地理定位技術(shù)領(lǐng)域的領(lǐng)軍者。
Superbolt 首先是用 4600 萬張全球分布的街景圖像大規(guī)模數(shù)據(jù)集,訓(xùn)練出一個 SOTA 嵌入模型。接著與覆蓋全球城市的大規(guī)模參考數(shù)據(jù)庫相結(jié)合,最終使得 Superbolt 成為地理定位技術(shù)的一次突破性進(jìn)步。
Superbolt 在視覺地點識別領(lǐng)域取得突破,原因如下:
穩(wěn)健性:它對相機(jī)角度變化、光照條件,甚至因翻新、新涂漆或老化導(dǎo)致的建筑物外觀改變都具有很強(qiáng)的抗性。
可擴(kuò)展性:該嵌入模型能夠在保持準(zhǔn)確性的同時擴(kuò)展到數(shù)十億個向量,非常適合實際應(yīng)用場景。
高效性:與以往依賴大量向量的頂尖模型不同,Superbolt 采用緊湊的嵌入方式。這些較小的向量不僅更節(jié)省內(nèi)存,處理速度也更快,從而能夠?qū)崿F(xiàn)大規(guī)模的實時性能。
同時,其私有參考數(shù)據(jù)集也具有以下優(yōu)勢:
全球規(guī)模:覆蓋世界上幾乎所有主要城市以及無數(shù)較小的地區(qū),提供廣泛的地理覆蓋范圍。
高精度:從街角到地標(biāo),數(shù)據(jù)庫提供詳細(xì)的嵌入,使精度達(dá)到幾米。
動態(tài)更新:數(shù)據(jù)庫持續(xù)更新新鮮圖像,確保其反映現(xiàn)實世界的變更,如新建筑或更新的標(biāo)志。
這個豐富的參考數(shù)據(jù)集,與 Superbolt 的高效嵌入模型相結(jié)合,實現(xiàn)了無與倫比的地理定位精度和可擴(kuò)展性。
Superbolt 的先進(jìn)功能也為眾多應(yīng)用領(lǐng)域開辟了道路,如新聞追蹤、案件破獲等。
隱私還能保得住嗎?GeoSpy 在之前的幾個月是面向公眾開放的,任何人都能免費使用照片定位服務(wù)。
但在發(fā)生了一些隱私安全問題后(非法尾隨跟蹤),GeoSpy 暫時停止開放對公眾的訪問,轉(zhuǎn)為只面向政府、公安等專業(yè)業(yè)務(wù)平臺提供定位服務(wù),以助力情報調(diào)查與案件破獲。
總的來說,GeoSpy 在處理地理位置的方式上帶來了一次范式轉(zhuǎn)變。憑借其無與倫比的數(shù)據(jù)庫、前沿的嵌入技術(shù)和精確的性能,GeoSpy 已是視覺地點識別和地理位置技術(shù)的領(lǐng)導(dǎo)者。
但對于公眾來講,更為關(guān)鍵的是,企業(yè)需要對于技術(shù)進(jìn)行負(fù)責(zé)任的發(fā)展,而道德考量也將始終是確保這些強(qiáng)大工具造福社會又不會侵害隱私的關(guān)鍵。
參考資料:
https://www.404media.co/the-powerful-ai-tool-that-cops-or-stalkers-can-use-to-geolocate-photos-in-seconds/
https://x.com/josephfcox/status/1881343994212614335
本文來自微信公眾號:新智元(ID:AI_era),原標(biāo)題《AI 看照片,幾秒就能地理定位!因太危險被公司主動關(guān)閉,正向警方推銷》
本文鏈接:http://www.tebozhan.com/showinfo-45-10904-0.htmlAI 看照片幾秒就能地理定位:GeoSpy 技術(shù)因太危險被公司主動關(guān)閉,正向警方推銷
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com