亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

谷歌Gemini新技能:AI深度解析網(wǎng)頁,RAG技術(shù)迎來新挑戰(zhàn)

   時間:2025-09-04 00:23 作者:顧青青

谷歌在其AI技術(shù)的征途上邁出了新的一步,這次它瞄準(zhǔn)的是讓AI能夠像人類一樣“閱讀”網(wǎng)頁內(nèi)容。這一創(chuàng)新體現(xiàn)在Gemini API最新推出的URL Context功能上,該功能于5月28日在Google AI Studio中首次亮相。

據(jù)谷歌產(chǎn)品負(fù)責(zé)人Logan Kilpatrick介紹,URL Context是他極為推崇的Gemini API工具,他甚至建議用戶將其設(shè)置為默認(rèn)開啟的便捷選項。那么,這一功能與日常將鏈接直接丟進(jìn)AI對話框中相比,有何本質(zhì)不同呢?

關(guān)鍵在于處理深度和工作機制的不同。以往,當(dāng)我們向AI發(fā)送鏈接時,它通常通過通用的瀏覽工具或搜索引擎插件來“瀏覽”網(wǎng)頁,可能只讀取了網(wǎng)頁的摘要或部分文本。而URL Context則是一個專為開發(fā)者設(shè)計的編程接口(API),當(dāng)開發(fā)者在程序中調(diào)用此功能時,它會指示Gemini將URL中的全部內(nèi)容(上限為34MB)作為回答下一個問題的唯一且權(quán)威的上下文。Gemini會進(jìn)行深入的文檔解析,全面理解文檔的結(jié)構(gòu)、內(nèi)容和數(shù)據(jù)。

URL Context的能力清單令人印象深刻:它能深度解析PDF中的表格、文本結(jié)構(gòu)乃至腳注;能處理PNG、JPEG等圖片,并理解其中的圖表和圖示;還支持HTML、JSON、CSV等多種網(wǎng)頁文件格式。

在Google AI Studio中,開發(fā)者可以直接體驗這一功能,官方API文檔也提供了詳細(xì)的配置教程。一篇發(fā)表在Towards Data Science上的文章對URL Context Grounding給予了高度評價,作者Thomas Reid甚至將其視為給RAG(檢索增強生成)技術(shù)的又一重?fù)簟?/p>

RAG技術(shù)過去幾年中一直是提升大語言模型回答準(zhǔn)確性、時效性和可靠性的主流手段。由于大模型的知識局限于其訓(xùn)練數(shù)據(jù),RAG通過引入外部知識庫來提供最新、最具體的信息。然而,傳統(tǒng)的RAG流程相對復(fù)雜,包括內(nèi)容提取、分塊、矢量化、存儲、檢索以及增強與生成等多個步驟。

相比之下,URL Context Grounding省去了這些繁瑣的步驟。對于處理公開網(wǎng)絡(luò)內(nèi)容這一常見場景,它提供了一個極為簡潔的替代方案。開發(fā)者無需再花費大量時間和精力去搭建和維護(hù)一個由多個組件組成的復(fù)雜管道,只需幾行代碼就能實現(xiàn)更精準(zhǔn)的效果。

例如,Gemini僅憑一個指向特斯拉50頁財報PDF的URL,就能準(zhǔn)確無誤地提取出位于第4頁表格中的“總資產(chǎn)”和“總負(fù)債”數(shù)據(jù),這是僅靠摘要無法完成的任務(wù)。在PDF的末尾,有一封寫給即將離職員工的信,其中退出日期被星號標(biāo)記,屏蔽原因在腳注中給出。URL Context也能準(zhǔn)確識別出腳注中的內(nèi)容。

URL Context采用兩步檢索流程以平衡速度、成本和對最新數(shù)據(jù)的訪問。當(dāng)用戶提供一個URL時,該工具會首先嘗試從內(nèi)部索引緩存中獲取內(nèi)容以提高速度和成本效益;如果URL不在緩存中,它會進(jìn)行實時抓取。然而,它也有能力邊界:無法訪問需要登錄或付費的內(nèi)容;不會涉足有專門API處理的內(nèi)容(如YouTube視頻、Google Docs等);且單次請求最多處理20個URL,單個URL內(nèi)容上限為34MB。

在價格方面,URL Context的計費方式直觀明了:按處理的內(nèi)容Token數(shù)量計費。這意味著開發(fā)者需要精確地提供所需的信息源,以避免不必要的成本增加。盡管如此,URL Context的出現(xiàn)并非RAG技術(shù)的終結(jié),而是對其應(yīng)用場景的重新劃分。在處理企業(yè)內(nèi)網(wǎng)的海量私有文檔、需要復(fù)雜檢索邏輯和極致安全性的場景中,構(gòu)建自主可控的RAG系統(tǒng)依然至關(guān)重要。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容