本文來自微信公眾號: 硅星2人Pro ,作者:郭海惟,題圖來自:視覺中國
今天,我們可能已經站在了中國互聯網歷史上最大規模“武裝械斗”的前夜。無論是它討論的問題,牽扯的利益,參戰的規模,涉及的范式競爭,對未來商業世界的格局塑造,都遠超曾經的“3Q大戰”。
12月1日,豆包手機助手發布,也碰巧是GPT誕生的三周年紀念日。
據硅星人不完全統計,在它發布的48個小時內,疑似對豆包手機助手采取“技術對抗”措施的公司已經可以列出一個長長的名單:
微信:如果檢測到使用AI會強制下線,甚至面臨賬號被暫時凍結的情況。
淘寶:可能頻繁跳人機驗證提示,或者閃退或強制賬號登出。
支付寶、高德、京東、拼多多、快手等:可能出現登錄頁面卡死+觸發強制賬號登出。
王者榮耀:可能觸發禁止排位賽懲罰+掉星。
以建行、招行為代表的銀行類APP:公告提示在錄屏等狀態下無法使用APP,點擊確認后強制退出。
目前,微信相關人士對媒體的公開回復是,“沒有什么特別的動作,可能是中了本來就有的安全風控措施”。
從公開資料來看,無論是在豆包開發,還是在媒體內測的過程中,上述軟件的所有功能執行都是沒有任何問題的。因此,大概率是以上安全團隊臨時加入的技術對抗策略,來防止豆包AI助手繼續使用自己的功能。而根據豆包團隊的官方公告顯示,他們團隊已經緊急停止了對微信所有相關功能的調用支持。值得一提的是,抖音似乎此前也出現了類似的強制退出情況,而豆包手機助手在昨天也禁止了部分AI違反抖音政策的指令。
這些大廠軟件批量強制閃退和賬號登出,至少有三個原因:
第一,豆包手機助手的權限實在是太高了。
與其說豆包手機“助手”,不如說它是一個比OS更像OS的AI Agent,屬于一個龐大的字節系統工程的重要組成部分。
該款手機搭載的系統并不是努比亞傳統的星云OS或者MyOS,而是一個獨立推出的Obrit UI。在第二天,便有博主在該系統的代碼中發現了Smartisan的代碼痕跡。后者是字節此前從羅永浩手中收購的系統資產。
而作為自家系統的AI手機助手,其獲取的權限也是頂配。
在豆包手機助手的官方回復中,其承認了該團隊獲得了injection-event的權限。injection-event是手機系統中的頂級敏感權限,這讓豆包可以在手機系統中模擬全局的輸入、點擊等操作。有媒體報道稱,此前榮耀等其他手機助手也具備類似的權限。但不知道為何,這個消息是從開發者側流出來的,《豆包手機助手隱私安全白皮書》完全沒有專門提及該權限的調用介紹。
從技術角度上來說,與過去的API合作不同,APP軟件開發者沒有主動關閉或者調整權限的權力。因此在超高權限的加持下,APP開發者沒有任何博弈的余地,處于極度被動的技術局面,因此“技術對抗”路徑也只能變成非常極端的“停用”。
第二,從更本質的角度而言,豆包手機助手確實有可能徹底顛覆以上廠商的生意模式。
一旦語音交互變成入口,過去賴以為生的所有APP邏輯都會不復存在。
大部分的實際用戶不大可能對手機指定渠道名字,比如“你幫我用‘淘寶’買一部豆包手機”,而是只會提出“買一部豆包手機”;他們不會說“幫我用高德導航去公司”,“用滴滴打車去學校”,而是只會說“幫我打車去學校”。那么系統的默認入口就變得很重要。
這有點像蘋果和谷歌的關系,谷歌每年要為蘋果支付200億美元,僅僅只是為了獲得在Safari瀏覽器中的默認入口。
三大外賣巨頭,在過去一年時間里,為了一個外賣入口燒掉了近千億人民幣。結果一覺醒來,發現最后終局可能都是給豆包打白工,自己變成一個底層工具服務商。這自然是不可接受的。
第三,目前的豆包手機助手確實“摧毀”了各大廠商的隱私和安全政策格局。
超高的權限+很好的泛化能力+較少的敏感場景控制,三者產生的化學反應,便是讓普通用戶可以擁有過去要靠專門編寫腳本,才能實現的“作弊能力”。
我們在用戶群和社交媒體上中,總結了目前豆包手機助手出現的一些問題,而這些行為在過去幾乎不大可能出現。
必須強調的是:由于豆包助手一直在迭代和完善它的安全功能,以及大模型能力本來也可能導致一些場景無法復用或者出現幻覺導致規則越獄的情況,以下的案例不能代表當下和未來的豆包手機助手的安全情況,也不代表豆包產品的安全政策。
微信由于技術對抗下場較早,很多風險場景找不到對應的視頻Demo。
但據硅星人了解,豆包手機助手此前至少可以實現一些微信官方至今沒有上線的功能,比如“定時發送微信”、“AI代回微信”、“操作微信小程序執行任務”等功能,整體的方式跟此前打擊的“外掛助手”類似。區別在于,外掛助手的執行頻次高且精準,而豆包手機助手整體的節奏還是偏慢的,有時候甚至還不如人直接點擊來得快。
此外,豆包手機助手可以在微信內部深度讀取數據。
比如在《愛范兒》的測評中,測評老師成功讓豆包手機助手去微信的收藏夾里,找到自己的護照照片,然后提取出文字,再發送到微信自己的文件傳輸對話框里。
一、起義,還是暴動?
豆包手機助手的一套組合拳,給我留下的最深刻的印象就是一個字:莽。
從目前大面積的APP風控反彈,雙方圍繞機器人定義展開的技術攻防戰來看,豆包團隊很有可能從一開始就沒有跟APP生態中的伙伴做有效溝通。一些高度敏感,對安全政策是常年高壓線的場景,如銀行、微信、支付寶等,在出廠時沒有做任何防護措施。
從始至終,豆包在安全和隱私方面給出的唯一的系統性的公眾溝通,幾乎只有那個僅12頁的《豆包手機助手隱私安全白皮書》。但這個白皮書只是豆包單方面的技術呈現和安全承諾,沒有任何第三方機構參與,沒有監管背書,更沒有對技術落地的監督。你很難想象,銀行的風控團隊會看完那12頁紙就大徹大悟,為豆包接下來的屏幕讀取+模擬點擊開路。
或許先干再迭代,本身也是字節長期以來行事風格;再者,或許強勢本身也是豆包團隊的策略之一,把局面頂到極致,再向后退步談判,可能可以獲得更好的位置。
但如果我們不把目光放那么長遠,畢竟今天豆包手機助手還遠未到“取代”一切OS的成熟程度。如果只局限于當下的產品影響的話,會發現首先最有可能被改變的將是過去一系列增加用戶黏性的促活套路。
第一,簽到機制將失效了。
豆包手機助手可以設置多個功能,在指定時間去幫用戶簽到領取獎勵,無需人主動介入。
與之對應的,小游戲促活也可能被AI助手取代。畢竟這類游戲簡單、易懂,也無需太高的及時性響應要求。
第二,用戶時長獎勵也將失效。
比如,我們看到豆包可以實現在后臺刷抖音極速版來賺錢;很多用戶讓手機掛著斗地主,也是為了賺取活躍時長發放的獎勵。
第三,開屏廣告和彈窗可能也會面臨挑戰。
在視頻演示中,豆包團隊對彈窗廣告采用手動點擊的方式進行。在實測中,確實有一些彈窗可能被攔截。但并不意味著豆包沒有類似的能力。如果政策允許,彈窗廣告可能是最容易被消滅的變現方式。
以上案例中,除了“游戲掛機”可以被視作是不道德的外,其他三項更多是生態變現方式的變化。
如果以促進日活的角度來評判技術創新,“簽到”可能是本世紀最偉大的發明。但從用戶角度來說,這是沒有任何用戶體驗增量的“陋習”;時長獎勵也是如此,他們的共同目標,就是讓用戶消費他們本來不再需要的內容,在特定APP中投入更多他們本來可以花在其他地方的時間。
而當手機平均使用時間已經超過5個半小時且還在不斷增長的時候,類似運營策略的最后結果就是不斷靠近軟件生態的無效內卷。
二、超級AGI助手應該是什么樣的?
如果必須將這場巨大的沖突做一個總結,那只能說:
豆包希望將LUI(自然語言人機交互)的能力,強行塞入到一個已經極度成熟的GUI(圖形人機交互)生態里,所以必然會帶來大量動作的扭曲和斗爭的張力。
當我們期待一個AGI的設備時,沒有人認為它應該是一個像今天這樣的超級智能助手,緩慢謹慎地一個個點擊屏幕上的按鈕。
對于用戶來說,我們可能省了一點時間、薅了一點羊毛,但付出的代價是巨大的隱私和數據安全潛在風險;對于開發者來說,加入一個手機助手,在交互上也同樣受制于屏幕點擊,也無法釋放軟件生態在AGI生態中的潛力。
我們期待的是一個語言交互入口能夠解決足夠多的東西,能夠拋棄掉冗雜累贅的GUI交互邏輯,從而獲得一種新生。
這意味著,我們需要的是LUI原生的應用,而不是強行改造的GUI的軟件。
正如我們開頭所說,豆包手機助手本質是一個比OS更像OS的agent。而我們的每一個OS都應該有單獨適配他們的原生應用,這其實原本是我們今天對OS這件事情的常識,但卻在豆包這件事情上遺忘了。
或許有一天LUI體系和GUI體系上都有自己的AI助手,兩個體系可以是互通的,各自都有各自的功能。
否則像現在這樣打來打去,最終受到損失的不止是花了3499元買機子的用戶,我們所有人都會與一個更好用的智能時代漸行漸遠。
