-
日期: 2025-09-04 | 來源: 鳳凰網 | 有0人參與評論 | 專欄: 哈佛 | 字體: 小 中 大
第贰個特點是其能讓 AI 獲得所有需要的內容。AI 所需要的不僅是壹篇文章的鏈接和標題,而是需要盡可能地獲得每個結果的信息。而 Exa 能為每個信息都提供完整的頁面內容,以便 AI 處理所有必要的信息。
第叁個特點是更快速。相比人類,AI 需要更快的搜索速度。與此同時,AI 語音助手等 AI 產品對於延遲非常敏感,甚至說每壹毫秒都至關重要。AI 在工作時通常會在單個請求中調用多個工具,而搜索引擎只是其調用的工具之壹。那麼,在調用多個工具的時候就會積累延遲。Jeffrey Wang 等人認為,要想構建全球最快的搜索 API,就不能成為包裝器,即不能在搜索 API 的底層封裝谷歌,因為這意味著服務器集群中的瀏覽器會接受用戶查詢,並通過在谷歌搜索中進行處理來提供結果。而這需要超過 700 毫秒的中位數延遲(P50,The 50th Percentile Latency),因此其指出任何封裝谷歌的搜索 API 的 P50 時間至少為 700 毫秒。AI Agent 會進行大量的搜索調用,如果壹個 Deep Research 代理進行 50 次搜索調用,每當每次調用的速度快 200 毫秒,那麼就能為真人用戶節省 10 秒時間。為了構建“全球最快的搜索 API”,Jeffrey Wang 等人爬取了網絡數據,並訓練模型進行搜索,以及開發了自己的矢量數據庫。通過掌控整個技術棧的每個部分,從而能夠緩解延遲。通過此,其構建了壹款名為 Exa Fast 的搜索 API,Jeffrey Wang 等人表示其速度低於 450 毫秒。在壹項實驗中,他們針對美國北加州數據中心的數千次隨機查詢進行了基准測試,結果發現其網絡延遲約為 50 毫秒。
(來源:資料圖)
第肆個特點是高計算。對於 AI 來說它並不關心延遲,而是只想進行最全面的搜索,對於那些異步應用程序來說更是如此,為此 Jeffrey Wang 等人打造了壹款名為 Websets 的高計算搜索產品,並稱其是“迄今為止全球最全面的搜索引擎”,能讓 AI 獲取海量的人員信息、公司信息或其他信息。
第伍個特點是可定制。由於每個 AI 應用都有特定的用例,因此如能針對特定應用程序進行搜索定制,效果無疑會更好。而 Exa 這壹 AI 搜索引擎基於定制化的理念,可以做到通過排除數千個域名來獲取數百個結果,同時也能創建自定義分類器以便在每次搜索時運行。
第六個特點是零數據保留。來自企業的查詢數據往往非常敏感,因此企業更傾向於擁有具備零數據保留特點的搜索 API,這意味著 AI 的查詢內容永遠不會被存儲在任何地方。對於實現完全的數據隱私保護的企業來說,零數據處理是壹個黃金標准。對於搜索服務商來說,要想提供零數據處理,無論在主服務器還是子處理器中,都絕對不能存儲用戶的查詢數據。Jeffrey Wang 等人在壹篇博文中指出,大多數搜索提供商實際上無法提供零數據處理,並指出這也是搜索領域中壹個鮮為人知的秘密。之所以會出現這種情況,是因為絕大多數搜索服務商都會在後台抓取谷歌數據。當查詢達到搜索服務商時,查詢會被路由到全球某個在瀏覽器中運行谷歌搜索的匿名服務器,然後谷歌搜索結果會被發回給搜索服務提供商。由於谷歌搜索是壹個基於用戶查詢進行訓練的消費級搜索引擎,所以它並沒有零數據處理。因此,任何以子處理器身份在後台抓取谷歌搜索數據的搜索服務提供商都無法擁有零數據處理能力。而由於 Exa 是從頭開始構建的搜索引擎,因此該公司表示它可以為所有產品端點提供零數據保留。為了煉就這壹能力,其通過爬取網絡數據,訓練了專門的 AI 搜索引擎,並通過設計海量數據庫來為模型提供服務。這讓其不僅能為客戶提供准確的搜索結果,還能確保每個查詢都保留在零數據處理系統中,當搜索結束之後查詢數據就會被刪除。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見