-
日期: 2025-05-22 | 來源: AI未來指北 | 有0人參與評論 | 專欄: 谷歌 | 字體: 小 中 大
可以看到,現在基本上所有的AI流行視頻都是有台詞和聲音的,但在這之前,需要用戶掌握多種AI工具的混合使用能力。但現在,Gemini App裡就可以直接用上Veo 3,生成帶聲音的視頻,再加上Flow的簡單剪輯,壹下子門檻拉到底,很有可能能再現GPT-4o生圖帶來的全民創作熱潮。
然而普及的關鍵瓶頸在於谷歌的訂閱策略設計。在本次I/O大會上公布的Ultra訂閱方案中,用戶需支付高達249美元/月的費用才能解鎖Veo 3全功能、完整版Flow剪輯、Deep Think及Mariner 10多任務並發能力。相比之下:
●14.9美元/月的Pro訂閱僅提供Veo 2基礎版和Flow簡化剪輯
●免費用戶則完全無法使用視頻生成功能
●即便是Pro用戶,也只能訪問Gemini 2.5 Pro基礎模型和Deep Research功能
這種將最具破圈潛力的視頻生成能力嚴格限制在高階訂閱的策略,與OpenAI逐步開放GPT-4o多模態能力的做法形成鮮明對比。
至於大家都很關注的Agent能力,谷歌這次I/O並沒有特別激進的布局。
去年 I/O 還在做“認桌角橡皮擦”實驗的 Project Astra,今年學會了給修車鋪打電話。壹段現場視頻裡,用戶把爆胎的自行車推到攝像頭前,Gemini 標出破洞、調用 Astra 撥號附近車行詢價,並完成下單購買。
這是谷歌為“最終AI私人助手”畫的餅。它的其中壹部分能力會逐步通過Gemini Live實現。
當前實際落地的是谷歌版的Computer Use / Operator——Project Mariner。除了可以瀏覽網頁,完成壹些基礎工作外,它還可以幫用戶購買棒球比賽門票或在線購買雜貨,而無需訪問第叁方網站——他們只需與谷歌的 AI 代理聊天,它就會訪問網站並為他們采取行動。
不過在這次發布會上,谷歌倒是明確了自己的to C Agent戰略,它把這壹切概括成叁個 P:Personal(個性化),Proactive(預測性),Powerful(能力)。
- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見