前沿科技
年度25位企業家告訴你:AI時代最重要的資產是……
編輯|米娜 成立50周年之際,微軟做了一次特別的圓桌對話,嘉賓分別是公司的三代CEO——比爾·蓋茨、史蒂夫·鮑爾默和薩提亞·納德拉,主持人則是微軟研發的人工智能助手Copilot。 此時,所有企業正在主動或被動地卷入AI浪潮中。2014年接任第三任CEO的納德拉將微軟帶入了這片海域,但即便他自己,也無法確知潮水最終將走向何方。這一點,或從他們給人工智能助手起的名字就能看出來——Copilot,也就是“副駕駛”的意思。但現在,這位“副駕駛”反過來問納德拉,“你有沒有擔心過,對AI的熱情有一天會讓它掌控一切,而你只能陪跑?”后者給出了一個假設性的答案,“如果有一天AI能像我最喜歡的板球運動員那樣打出100分,那它就可以接管一切。” AI或許會取代很多工作,但它真的能取代企業家嗎? 來源:AI生成 技術變革必然會引發生產力和生產關系的變遷,并進一步重塑管理模式和領導者角色。波士頓咨詢公司對此進行過專門梳理:在前工業化時代,企業的領導者是“亦師亦父”的工匠。到了以蒸汽機帶動的第一次技術革命時代,領導者成為初具管理意識的“工廠主”,這種意識在隨后的電氣時代進一步強化,誕生了領導意志高度集中、近乎全能的企業家。隨后以計算機為首的各種技術突破帶來了第三次技術革命,“經理人階層”成為企業管理的中堅力量,而在互聯網技術引發的第四次變革浪潮中,“去中心化”的組織形態漸成主流。 如今,技術變革正以颶風般的速度席卷而來。一方面,AI大模型在各路玩家的“軍備競賽”中獲得了爆發性增長。短短兩年,全球發布的大模型將近4000個,而且在相互追趕中飛速迭代,甚至讓360集團創始人周鴻祎有了“度日如年”的感慨——“AI發展太快了,一天等于過去一年。任何產品的領先期只有三四周”;另一方面,AI技術已經滲透到企業經營管理的各個場景中:京東某分揀中心90%的人工工作被機器替代,明年4月還將在全球建成首個全無人配送站;萬華化學集團將AI技術應用到了催化劑、EOD產品(生態環境導向的開發)、電子材料、合成生物、電池材料、分析測試等多個業務領域的29個試點場景中;美的人形機器人一上崗就成了“車間主任”,接手了工廠安全巡檢、設備巡檢、品質首檢等多項工作。 科幻作家威廉·吉布森說過,“未來已來,只是尚未分布均勻。”盡管AI對企業家的替代可能性仍處于“暗箱”之中,但對領導力的挑戰已經擺在了桌面上:當技術變革日新月異,如何構建一個時刻擁抱變化并創造變化的組織?當碳基人與硅基人同臺“聯袂”,如何進行協同管理?在AI幻覺和信息輸出同質化的干擾下,如何做出正確且不流于平庸的判斷和決策? “我們無法左右變革,我們只能走在變革的前面。”彼得·德魯克的這句忠告依然適用,而這也是企業穿越周期、持續進化的唯一出路。那些先行一步的企業家和領導者,已經跨上了AI這匹快馬——也只有這樣,才能逃離時代滾滾向前的車輪碾壓。 “生成式”領導力 2024年開始,AI就成為海爾集團董事局主席、首席執行官周云杰口中的“高頻詞”,工作、生活中遇到什么事,他也會習慣性地“用AI工具查一查”,后來更是推動海爾全員、全流程應用AI。在周云杰看來,“這場AI革命沒有旁觀者,只有幸存者和淘汰者”“要么與AI同進化,要么被AI邊緣化”。 在企業的重大轉型節點,“一把手”的遠見和頂層戰略部署尤為重要,就像一位美的高管所說的,“雖然不是提重要性就能解決問題,但不提是肯定解決不了問題的。”但接下來更關鍵的一點在于,領導者的決心如何才能落地為全員行動? 馬凱特船長剛剛被委派負責圣塔菲號潛艇時,就面臨這樣一個挑戰。他接手的是一艘在當時所屬艦隊里排名墊底的潛艇,即將在6個月內被調用(離開母港執行軍事行動),如何在如此短的時間實現一個如此大的轉變——把一個人心渙散、士氣低落的隊伍改造成一支技術出色、操作專業的兵團?馬凱特用的方法,簡單概括成兩個字,就是他所著書的名字——《授權》,通過自下而上的“領導—領導”模式,替代傳統的“領導—跟隨”模式,以此調動了每一位船員的積極性,激發了一群人的首創精神。 實際上,這種模式創新來自于他經歷的一次失敗的管理“噩夢”:潛艇上的任務繁多復雜,內外部的風險因素數不勝數——這是管理者每時每刻都要面對的,“雖然我想規避更多的重大問題,但所有事情都取決于我的最終決定。我多次發現問題,但我并不為自己發現了問題而感到自豪……讓我備感憂慮的是:當我累了、困了或錯了的時候,將會發生什么?” 這是發生在20多年前的故事。但聽上去,馬凱特船長的“內心吶喊”恰恰與當下AI時代的管理者形成共鳴——技術一日一變、信息轟炸從不間斷,讓他們疲于應對;而他所提出的“領導—領導”管理框架,也像是開給現代領導者的管理“良方”。 “AI技術變化太快了,無論是企業家自己,還是各個層級的管理者,都無法通過個人跟進這種變化,肯定需要更廣泛的團隊能力,尤其是自下而上的反饋通路,因為相比之下,肯定是年輕人對于AI的嗅覺更靈敏,AI應用更主動。”在波士頓咨詢公司全球資深合伙人阮芳看來,相比于互聯網時代,AI時代“去中心化”、自下而上的創新驅動會更強。 一直“想證明自己并非只是電商公司,而是AI驅動的科技公司”的阿里巴巴,進行了又一次的組織和人事調整,2023年9月正式上任阿里巴巴集團CEO的吳泳銘做出了兩項決定:一是化繁為簡,將多線匯報砍成直線;二是堅決實行團隊年輕化,4年內要讓85后、90后作為主力管理者。2025年也成為阿里大模型競速的一年,目前,千問大模型已在全球開源模型中站到了第一梯隊。 提出“All in Agent”的周鴻祎更是提出,建議AI轉型的企業要形成“AI文化”,做到從上到下“人人都會用AI”;一定要堅持業務主導,鼓勵一線員工熟練運用AI,自下而上探索各種應用可能。 “我們的組織要成為內部高度協同、去中心化的組織,能夠迅速感知到危機和變化。”這句話,美的集團董事長兼總裁方洪波從互聯網時代就開始提。在美的,每一塊業務都有獨立總裁直接負責,除了“一號位”的任命、資金管理,以及重大并購事項需要集團統籌之外,子公司的事項都交由其全權處理;當然,與分權治理相對應的,他們也要自負盈虧。而這幾年,除了高管層級,美的進一步將權力下放到更接近用戶的一線,相關人員透露,“從去年開始更加徹底了,放權力度也更大了。” “現在來看,‘數字原生’企業是轉換最快的,其次跟進的是數據量比較大、數字化變革比較快的企業。”但在阮芳看來,拋開AI技術的限定,領導力模式的轉變也是所有企業都需要特別重視的,“只要企業還想創新,還要面對不確定性,就必然要進行領導力的迭代,這種變化是不可逆的。” 一方面,AI時代的變化多點、多發,自下而上的發動全員智慧,更有利于在各個節點捕獲創新;而另一方面,每個員工都能借助AI實現自我賦能,上面的權放下去,下面的人能接得住、用得好。就拿山東魏橋創業集團為例,他們搭建了專屬智能組織平臺,10萬名員工都可以應用AI,從學習到再創造,也就是半年的時間,內部就產生了800多個一線自主開發的智能應用。這也讓魏橋創業集團董事長張波由衷感嘆,“一線員工最懂業務痛點,當他們掌握了AI工具,就能爆發出驚人的創造力。” 而這還只是改變的開端。實際上,實驗“領導—領導”模式的圣塔菲號潛艇的故事還有后續,在馬凱特船長卸任后的10年間,潛艇依然表現優異,3次獲得中隊最具戰斗效能獎。另外,那里也孵化出了多位未來的領導者:當初的兩名副指揮官、三名部門長官后來相繼晉升為指揮官。曾經的普通船員中,一些走上領導崗位,一些獲得高級學位,還有一些下海經商。從某種意義上,“領導者”馬凱特的缺席或許更說明了領導力的本質:不是依附在權威或者某個人身上,而是建立在組織的行動共識上;最終實現的,不是訓練追隨者,而是創造領導者,這樣也才更符合“生成式AI”時代所需要的——“生成式”領導力。 美的集團董事長兼總裁方洪波來源:受訪者 就像方洪波說的,“企業家精神光方洪波有是不行的,每個事業部總裁,每個管內銷、外銷以及研發的人,甚至生產線上的工人,都要有。”這恐怕也是未來AI時代最深的一條“護城河”——畢竟,技術差異、知識差異,甚至經驗差異都有可能被拉齊,但每個人頭腦中的自主創新匯聚而成的改變力和生產力,不可替代,也不可限量。 點擊封面訂閱全年雜志 回歸“以人為本” 時代的巨幕剛剛拉開,隨著AI技術在企業各個場景中的逐步滲透,未來領導者將面對的是全然不同的管理場景。 就像聯想集團董事長兼CEO楊元慶所說,當機器作為有認知、決策和執行能力的主體進入網絡空間,人類馴化和駕馭人工智能的能力已經成為驅動產業變革的新質生產力。這種生產力不僅會孵化新的產品、業務,也會催生新的員工和組織形態——能夠領導多個智能體的超級員工,以及由無數超級員工結成的超級組織。 按照阮芳的描述,“超級員工”可以具化為兩方面的人才:一面是學習力極強的年輕人,一面是技術“大牛”。“未來AI能達到的能力水平會是中等偏上,替代的將是相對基礎、重復度較高、流程性的工作,或者助力員工、管理者提升決策質量;但很難替代那些具有高附加值的、尤其跟戰略引領直接相關的崗位。”阮芳說。 與其說AI取代人,倒不如說AI會改變組織中“人”的定位。周鴻祎就指出,未來組織將是“碳基員工+硅基員工”的混合形態,智能體使用軟件和工具,會成為人類的“數字伙伴”和“數字員工”;人則升級為駕馭智能體的“管理者”——“為什么要做這件事”“做到什么標準才叫好”,這些需要人來定義。這也是萬華化學董事長廖增太一直強調的,他始終認為在AI時代,“人”將更加回歸本質,實現獨特價值——而“人”也是組織變革與組織創新的根本。 因此,對于一家希望在AI變革中搶占先機的企業來說,首先要培養“超級員工”——這也是當前很多企業都在跟進的。這兩年,海信打造了員工“活水平臺”及人才智選等近20個AI場景,通過“AI人崗匹配”“AI人才智選”“AI精準送課”等智能體,實現了更精準的人事管理和人才培養;周鴻祎則明確要求360集團所有人都要學會使用、搭建、管理、監督智能體,“領導”5個、10個乃至更多智能體,將自己變成超級個體、超級員工。 更進一步,則是如何激發超級員工進行超級創新?經濟學家周其仁曾就人力資本及發揮機制寫過很多論述,提出了一個重要觀點:“人是否把他掌握的知識和技術應用于經濟過程,以及這種應用的效果如何,至少取決于兩個因素:第一是能力,即綜合已經掌握的知識和技能,并加以創造性組合或發揮的本事;第二是意愿,就是我們的這位知識和技術的主人是否樂意‘調用’其知識存量。” 如果說AI賦能可以保證第一點的達成,那么第二點的實現則有賴于領導者更深層次的思維轉變。實際上,經濟學家早就指出,“人力資本是主動財產”,能否真正發揮取決于人的意志——這一點即便在“奴隸經濟”時期都依然成立,否則人即便“在場”,也會主動關閉“大腦”和“能力”,做出領導者所譴責的“摸魚”行為;只不過由于工業時代機械管理的固化以及現代競爭下“人才內卷”的加劇,很多企業領導者早已拋棄了這樣的經濟常識和管理常識。 AI時代對人力資本的重構將喚醒這一常識。阮芳就指出,對于“兩類”超級員工的激勵來說,簡單的KPI考核和物質激勵是失效的,更需要做的是“以人為本”,這對領導力提出了更高的要求。 如何“以人為本”呢?或許可以沿著馬斯洛需求理論中的五個層次找到路徑,比如,從滿足“生理需要、安全需要”的激勵機制到通過分權等方式來回應“尊重需要和自我實現需要”,方式不盡相同,效果也因人而異。過去,很多企業家都指出“管理是科學和藝術的結合”,未來恐怕還要兼顧到“心理”層面——挖掘需求,滿足需求。 微軟CEO納德拉將此概括為“同理心”——也是這位數字轉型時代的領導者最看重的一項能力,他在《刷新》一書中就寫道:在一個技術激流以前所未有之勢顛覆現狀的世界里,同理心比以往任何時候都顯得珍貴,它在機器中難以復制,在人類與人工智能的世界中,它將是無價的。 甚至可以說,這一點比技術應用本身還重要,例證并不難找:只有十幾家線下門店、線上商城推出時間也不長的胖東來,卻在技術迭代最劇烈的AI時代,成為風頭最盛的那個——這則現代商業寓言,想必也點醒了很多企業的管理迷途。 胖東來創始人于東來一直強調“企業發展、對人的關心永遠是第一位的”,與關注業績相比,他更在乎自己和員工的幸福,鼓勵每一位員工自由發展,擁有真正的個人熱愛以及獨立人格。胖東來的一切管理行為也都由此出發:把90%以上的利潤分給員工,給他們提供豐富的藏書、十幾萬元一臺的跑步機、高品質的音響,甚至設立了“委屈獎”和“不開心假”,遇到有損員工“幸福狀態”的問題,胖東來會第一時間迅速調整,甚至不惜影響生意表現。 “其實只要我們每個人擁有了這種思維,朝著美好的目標,做企業就一點都不難。不能帶來美好的方法,就再去尋找其他的。”于東來曾在接受《中國企業家》專訪時提到,“你看現在胖東來在中國很火,也影響了國外的企業,就是因為這種理念都是相通的,誰不喜歡能讓人類更美好的企業呢?” 避開“陷阱” 阮芳遇到的很多企業管理者,都有一個疑問:既然AI的技術日新月異,要不要等到技術更加成熟的時候,再做轉型? 答案并非如此。因為領導力不可能快速生成,而是逐步進化。在阮芳看來,企業要對未來的AI大變革做好準備,首先要做一些局部嘗試,借此磨煉出新的領導力,繼而在這種領導力的撬動下,推動更大的應用和改變——如此循環增強,企業面向AI時代的新型領導力才能最終實現螺旋式上升,真正搶占新技術所帶來的變革紅利。 這一點,張波深有體會。在他看來,數智化轉型和AI應用都要經歷漫長復雜的過程;領導者要在全公司營造“寬容失敗、鼓勵創新”的氛圍,給員工試錯空間,才有可能取得突破,“AI不是特效藥,是慢功夫,要有耐心。” 相比于技術和機制,最難轉變的是認知和思維。“大量的變革是從改變思想、打破舊的習慣開始,這個過程是挺痛苦的,因為人最難的就是改變自己。”海信集團董事長賈少謙感觸良多,這兩年,他要求下屬改變匯報模式,不再像過去那樣,帶著“問答題”或“填空題”來向他要答案,而是要自己帶著有答案的選擇題——包括ABCD四個方案,說明選A而不是C的原因,他可以在此基礎上給出建議。 表面上,這只是匯報方式的變化,實際上則是決策體系的調整,讓更接近業務現場的人勇于做決策,也善于做決策——在賈少謙看來,這是AI難以替代的少數能力之一。在未來知識和能力看似“隨手可得”的情況下,就更要警惕內部管理層的決策懶惰,以及由此導致的集體決策的“同質性”,這也是賈少謙一直強調“喜歡不聽話的干部,甚至鼓勵下屬要敢于爭論”的原因,“大家角度不同,意見不一致,這才是一個真正有生命力的組織——一言九鼎,不是企業家該干的事。” 還是在開頭的那次圓桌對話中,Copilot調侃起比爾·蓋茨標志性的“沉思表情”,“你有沒有想過,AI可能會被你那張‘思考臉’嚇到?覺得自己快要進入藍屏(死機)時刻?”蓋茨回答——依然是那副表情,“我想,隨著這些AI變得如此智能,我剩下的就只有那個表情和批評精神了——這才會讓我顯得與眾不同。” 玩笑嗎?或許,這才是面向未來的AI時代最應該保持的那份清醒。
6小時前
5
繼手機之后,字節AI眼鏡或將跟上
如果說2024年是大模型之戰,那么在2025年末,中國AI戰場已演變為一場大廠的流量入口之爭。 在阿里發布千問APP、夸克AI眼鏡之后,字節與中興聯合發布了“豆包AI助手”手機nubia M153,激起了千層浪。 《科創板日報》記者還獲悉,字節的AI眼鏡研發正在推進中,或有望在明年發布。談及字節AI眼鏡的發布計劃,有供應鏈人士對《科創板日報》記者如此評價:“大模型是底座,產業鏈到位了。”但記者詢問字節方面,沒有得到回應。 除了阿里、字節外,百度也以AI眼鏡殺入戰場。顯然,大廠們都希望盡快補齊AI領域的軟硬件生態,以搶占觸達用戶的“物理入口”。 ▍從手機到眼鏡:互聯網巨頭打響AI硬件“入口”爭奪戰 當前,大廠之間的AI之爭已經從大模型參數,發展到了AI的軟硬件應用。通過推動自身大模型在智能終端的落地,爭奪下一代硬件入口。 “ 入口是關鍵的護城河,也是收費站,可謂兵家必爭之地。誰掌握了分發權,誰的話語權就大。所以,互聯網公司想做硬件,而硬件公司想做爆款APP 。”某手機廠商的影像負責人如是說。 “蘋果模式是大家都希望的,但也并非一蹴而就。而 AI操作系統讓大家看到了替代安卓的可能性,甚至有可能再此基礎上收‘AI費’,所以AI能力強的公司一定會心動 。”上述負責人稱。 其中,AI眼鏡被認為是手機之后的下一代關鍵終端,不僅有創業公司開啟百鏡大戰,更得到了互聯網大廠的青睞。 不過,由于技術限制,AI眼鏡短期內不能脫離手機來使用。大多數操作均需要通過手機來輔助完成。因此,以手機、AI眼鏡形成智能體落地硬件的閉環,是字節更大的野心。 在實測中,搭載豆包助手的手機可以幫用戶掛機打游戲,甚至通過調用第三方應用打開智能汽車的車門等。 這類由智能體來調用終端各類應用的暢想,正是各大終端廠商正在探索的方向。蘋果在2024年就計劃讓新版本的Siri將能夠通過語音控制單獨應用內的所有功能。 在國內,榮耀YOYO、小米小愛等手機助手也都演示過“一句話點買外賣”等功能。 阿里則發力千問助手在AI眼鏡的落地。最新發布的夸克AI眼鏡,成為首款搭載阿里千問助手的智能硬件,可以通過語音控制來完成在夸克眼鏡上的各種操作。 一位業內專家表示,在AI與終端結合的后手機時代,有一種可能是,未來手機這類終端,只負責顯示像素和發出聲音,AI負責產生內容、工具和應用從人找應用到AI推服務的精準適配,催生AI驅動的“服務直達”新時代。 手機將成為AI能力的聚合體,不需要按鈕、屏幕、語音、觸控,AI根據意圖和場景,實時生成界面和操作方式,催生AI懂你服務新格局。 另有業內分析認為,字節豆包與中興在手機上的合作,類似于華為智選車的模式。華為不僅提供智能駕駛、智能座艙等核心技術,還深度介入產品定義等,與車企形成緊密綁定。 “這代表一種趨勢。”一位ICT業內人士評價道,“AI能力偏弱的企業淪為基礎硬件代工廠,靈魂只能交給AI能力突出的企業,車、手機這兩種主流終端市場或都將如此發展。” ▍AI顛覆智能終端,仍需過“微信關” 一名消費電子分析師對記者表示,“豆包AI助手”從場景、技術來看,相比之前新鮮的內容并不多,只是借助字節的大模型,在語義識別方面效果更好。如今AI發展的問題主要在于硬件、App和大模型廠商都在搶話語權,互相沒有完全打通配合。 就在“豆包AI助手”手機nubia M153發售后不久,用戶發現其微信、農業銀行、建設銀行等App出現了風控措施。 多位用戶反饋,在nubia M153上使用豆包手機助手操作手機功能時,如果涉及操作微信,會出現微信異常退出,甚至無法登錄的情況。為此,字節豆包后續下線了手機助手操作微信的能力。 《科創板日報》從一名nubia M153用戶了解到,此前被禁止登錄的微信賬號已經解封,重新登錄后則提示“豆包操作手機屬于實驗室功能,先不支持微信的操作。” 第三方APP對外部應用的調取和數據抓取有明確禁止規定。美團在知識產權聲明中強調,不得通過技術手段掃描、探測、抓取美團平臺內容。淘寶平臺服務協議顯示,禁止存在可能破壞、篡改、刪除、影響淘寶平臺任何系統正常運行或未經授權獲取淘寶平臺及其他用戶的數據、個人資料的病毒、木馬、爬蟲等惡意軟件、程序代碼。 在這些APP中,微信對于智能體的調用監管尤為嚴格。微信《軟件許可及服務協議》對此明確規定:不允許用戶使用未經授權的三方工具/服務進行自動化操作,違反用戶協議,微信有權限制賬號。 這也導致 主流手機廠商的AI助手都曾推出針對微信的調用功能,但后續被終止了。 比如,榮耀YOYO去年推出過幫助用戶查找微信、支付寶中的自動續費服務,并可幫助用戶詢關閉續費,但后續該微信功能被取消。 vivo和OPPO今年都在AI助手中加入記憶功能,用于自動總結屏幕內容。比如,OPPO在ColorOS 16中推出了“AI一鍵閃記”,能夠總結圖文、視頻內容,還能記取餐碼、記賬。但進入10月底,用戶發現微信已從“一鍵記賬”的支持列表中消失,只剩下支付寶和云閃付。 OPPO官方客服對此回復稱,由于微信應用限制,自動記賬相關功能暫不支持使用。如果要記錄微信支出,需要手動記錄賬單。 一名消費電子領域的專家表示,硬件廠商在探索AI助手時都會面臨著與豆包助手同樣的問題。一是讓AI隨時操作頻幕和應用,可能會涉及用戶隱私。二是來自APP應用生態的反彈。 正如移動互聯網時代的應用市場分發涉及利益分配,AI時代的智能體分發同樣敏感,涉及到手機廠商、應用廠商之間的博弈。 “在AI與手機的融合,以及智能體相關的問題,互聯網應用廠商愿意做的就做,一些不愿意做的就留給時間。”一名手機廠商的AI專家表示。“ 目前出于商業考慮,他們不允許手機廠商調用其APP 。” “ 微信一直比較封閉,AI手機本質上就是爭奪流量入口的,相當于動了超級APP的蛋糕,他們肯定要抵制的 。”另一廠商的相關人士也對《科創板日報》記者表示。 有業內分析認為,豆包此次試水, 對于理清用戶接受度的邊界和商業規則的模糊地帶,有極大幫助。相當于主動當了一回“壓力測試員” ,也利于后續其他廠商的跟進,從而推動智能體在端側的落地。 ▍缺乏硬件基因的互聯網大廠能成功嗎? 除了應用生態外,缺乏硬件基因的互聯網企業想要試水智能終端,仍存在較大的研發難度。 全球互聯網巨頭谷歌早在2017年就收購了HTC的部分手機業務,并推出了多代Pixel手機,但銷量上持續疲弱,在手機市場較為邊緣化。 字節跳動則于2017年收購錘子科技的堅果手機團隊,成立新石實驗室。之后推出了堅果Pro3、堅果R2等產品。但最終在2021年年初,原錘科團隊組建的新石實驗室并入教育硬件團隊,不再研發堅果手機。 字節此次重入手機市場,是否能夠堅持長期主義,有待時間觀察。 多名數碼領域的人士在采訪中,對于缺乏硬件研發能力的互聯網企業,入局智能硬件產品,并不十分看好。“當較大的研發投入在短期難以得到回報時,這些廠商未必能夠堅持迭代超過三代。” 不過,也有專家認為互聯網廠商殺入硬件終端,具備各自獨特的優勢。 工信部信息通信經濟專家委員會委員盤和林表示,字節具備自帶的用戶流量。“坐擁自媒體社交平臺,字節不缺用戶,甚至還能用字節的用戶給硬件企業賦能。” 對于阿里入局AI眼鏡,盤和林認為,和字節不同,阿里在B端具有穩定客戶。通過AI眼鏡,阿里也可以成為平臺上電商商家的供貨商,在硬件銷售上和供應鏈整合上都有一定優勢。 百度的優勢,則在于搜索。“AI眼鏡的一大重要功能,就是在辦公的時候用AI眼鏡進行信息搜索,不需要在搜索網站上手動輸入,用語音即可。百度憑借搜索能力,在信息和AI整合方面,比其他家更強。”
9小時前
4
AI把音綜的事全干了
“等我哪天研究出了時光機,就回到千禧年發表這首歌,機械降神。” 在《美猴亡》的評論區,有網友如是感慨。以前穿越是背詩詞和記化學物理公式,讓尚處于蒙昧的NPC們虎軀一震,但那好歹是人類自己的智慧結晶。現在穿越者已經瞧上AI了,要把賽博資產也據為己有。 也不能怪人太貪心,AI整的有些玩意是不錯啊。《大東北是我的家鄉》改成R&B版之后,立馬靚麗不少。土地還是那東北,味道卻有點西海岸,不中不洋的小味兒挺撓人。《千年等一回》改成電音版后,感覺青白二蛇都戴上了朋克眼鏡,隨時可以發出鐳射光擊毀雷峰塔。法海當主持那廟,也不是金山寺,而是DJ Remix。帶勁的feel,下田犁二畝地不是問題。 曾幾何時,音綜苦苦求索的“樂壇新聲音”,居然就是那AI歌手“大頭針”、“卷筆刀”。由于唱得太好,不少聽眾直接表示,哪怕是AI我也愛了。評論區更是各種捏臉,“我心里大頭針長這樣。”一個聲音融合了張杰、汪峰、劉宇寧的AI,被群眾捏出來的臉卻融合了宋威龍、陳星旭、張凌赫。以融合對融合,以AI對AI,真是人類達不到的至臻至美。 從演唱到編曲,從作曲到填詞,2025年,華語樂壇的主題詞是AI。速度之快,遠超預估。畢竟一年前,硬糖君還在聽AI賈斯汀·比伯唱《歐若拉》,一年后已經反復欣賞大頭針的《很愛很愛你》了。觸屏手機開始流行的時候,沒人為磚頭諾基亞流一滴眼淚。 新聲音,似是故人來 “我們要為樂壇尋找新生代和新聲音”,過去音綜總是那么信誓旦旦充滿使命感。殊不知,在CD和古早選秀時代的公司和節目組,已經把這片區域的自然嗓音完成了窮舉式的挖掘開發。后來的綜藝再怎么努力,也只是宛宛類卿。 今天的聽眾模仿大橘給“華語樂壇”寫信,語氣應該是荒誕的。“大頭針類張杰、趙傳、曾一鳴、汪峰、楊培安、林俊杰、阿杜、李圣杰、張信哲、張學友、薛之謙,AI類卿更勝卿。苦思已排,汝可安心!” 大頭針和卷筆刀,滿足了聽眾對完美嗓音的想象。大頭針一首《很愛很愛你》唱得撕心裂肺,和原唱劉若英的溫柔繾綣相比多了幾分不安和撕扯,更適合當下人們需要宣泄的情緒。其基礎聲音像李代沫和金潤吉,但太多音徘徊在強混和假音之間,已非肉嗓所能企及。 另一首《淚海》,也是出圈神曲。人們在其中反復咂摸到底是誰的聲音,卻發現找不到答案。“這個海可太張杰了”、“汪峰做夢都想唱成這樣”、“像曾一鳴的聲線”。有故人之姿正因為人家是故人之子,可以想象“大頭針”初期被喂了太多樂壇經典聲音。 不過,雖然聲音有辨識度且唱法全面,但“大頭針”的問題是局限在“女歌男唱”。火的《淚海》《出賣》《星語心愿》《七月七日晴》《你看你看月亮的臉》都是原唱為女歌手,男歌手的歌反而不出彩。之前很少有男歌手能唱女歌手的原key,除了林俊杰起高了的那版《煎熬》。而AI恰可以全程高音唱原key,這就讓聽感十分震撼。 AI歌手像是一臺設定好的發聲機器,如同玩游戲開掛。大頭針能連續高音不停,且在各個音階之間絲滑爬升轉換,甚至毫無來由地“旱地拔蔥”突起高音。聽眾清楚地知道,真人歌手受限于肺容量和肉嗓,不可能完成如此質量。 但AI歌手的弱點也在于太完美,不少人批評大頭針聽多了審美疲勞。這一點,不愛飆高音的“卷筆刀”就做了很好的補位,他以一首《黃昏》引爆短視頻,是在周傳雄聲線基礎上的極致溫柔。聲音絲滑沒有半分凝滯,像是剛做完霧化吃了二斤枇杷膏就來錄制。 當然,盡管現在AI歌手連換氣聲都做得天衣無縫,但在人類幽微情感的表達上還是有所欠缺。AI編曲的R&B版《第一次》,著急忙慌賣弄性感像是“今夜第一次”,少了年輕光良那種情竇初開唯唯諾諾的“人生第一次”的羞澀。 于是,人們又紛紛在老歌里找到人類尚可一戰的證據。“張學友為人類扳回一城”、“王力宏為人類扳回一城”、“邰正宵為人類扳回一城”。 新編曲,算法征服耳朵? 聽完大頭針,再重新夸真人歌手的心態與出去偷吃的男人類似。“繁華只覺秋雅好,平淡方知冬梅香。”被外面的風花雪月弄萎了,只好重拾家中賢妻的好,實則是一種矯正性的心理安慰。家里家外紅旗不倒,AI真人彩旗飄飄,各種心態的雜糅誰能說出個三七分成? 阿多諾與霍克海默曾經擔憂不已的文化標準化、偽個性化的問題,在AI編曲領域展現得淋漓盡致。音綜這些年的創新,基本停留在改編老歌環節。要么破壞原節奏,要么莫名其妙把兩首歌串燒在一起,呈現效果大多不理想。而AI用強大的算法摸清了人們喜歡的編曲形式,輸出的全新編曲充滿創意動感。 電音版《千年等一回》,被網友譽為賽博電鰻。Daft punk風味,讓高勝美整個唱法變時尚。“許仕林你爹媽怎么認識的?”“擱西湖livehouse認識的。”聽完像打了把《赤影戰士》版的“新白”,像素化的白素貞和小青拿炮把法海轟趴下了。 City pop版的《迷迭香》更被網友指路“音綜可以直接拿去用了,只是沒人唱得好”。這個版本的前奏編曲,拿去配《東京愛情故事》一點問題沒有!場景設定是情場浪子開了一瓶香檳,熱烈而不失禮貌地詢問對方“愿意現在和我共舞一曲嗎?” 《花田錯》被編曲成了《花田起義》,拿聽歌識曲一聽搜出來是《瀏陽河》。這種“情歌紅唱”的編曲方法,也讓不少流行歌的聽感煥然一新。原版:男女主在花田里因為感情纏綿無法自拔。AI版:兩個師團在花田里發生遭遇戰陣地反復易主。有種“我就犯了錯咋滴吧,不服試試我的意大利炮”的豪橫。 就連90年代神曲《夢里水鄉》也難逃一劫,被爆改成了艾米·懷恩豪斯風格。如果說江珊的演唱,是一個精神凈土般的原版水鄉。那么AI版就是水鄉被商業開發,岸邊好多酒吧,有直男在墻上亂涂亂畫寫“26歲女房客”的續集。岸邊的玲瓏少年沒了蹤影,取而代之的是腰肢豐腴的駐唱歌手。 正如R&B版的《大東北是我的家鄉》一樣,AI編曲特點是在原曲的基礎上多了經濟上行期的熱情奔放,具有火力全開的動感和生命力。現階段的AI編曲讓無數老歌重獲新生,把80、90后吃過的細糠重新做一遍喂給00后,是將幾代人的音樂財富轉化為數字養料。關鍵這些細糠還添加了科技狠活兒,能不讓人上頭嗎? 真正的問題在于,把老歌全部翻新一遍是沒有意義的。AI只是通過炒陳飯反復向我們論證,過去的飯是真香。至于這里面的個性和創新實在寥寥,無非是一通看似洋氣的爆改,把所有歌曲都弄成新不新舊不舊的賽博蒸汽感,電子摻迷幻,紅牛兌勁酒。偶爾來一口提神醒腦,貪杯反而傷身。 新形式,AI判詞賽紅樓 音樂的視覺呈現,一直是音綜痛點。站樁唱歌雖然保持了音樂的純粹,但觀眾會覺得舞臺空曠沒看點。弄唱跳或者繁復舞臺設計,當然也有人跳出來指責破壞了音樂的主體地位。 這個問題也被AI解決了,不用太復雜讓“本尊”上就行。在B站,人們用AI為《西游記》人物寫專屬主題曲,白骨精的《不再三》、孫悟空的《美猴亡》、銀角大王的《裝裝樣》堪稱AI判詞。這種AI作詞作曲并利用原角色形象進行演唱的形式,讓受眾有了更強沉浸感。就像影視解說改成第一人稱,用AI模擬主角音色進行講解一樣,帶來的變革不言而喻。 “他們殺死了美猴王,用廟堂、用跪拜、用牌坊。如今我端坐在這蓮臺之上,卻再也不知何站是故鄉。他們說這就是成長,可這成長為何像投降?”完全可以設想:音綜里一個相貌端正的青年在播完被社會毒打的VCR后,站在臺上唱這首歌時臺下評委和觀眾的熱淚盈眶。這絕對是一個理想主義者社會化后不甘平庸的好故事,但AI殺死了比賽讓孫悟空自己來講。 在超越人聲極限、編曲的思維局限后,AI已經可以用極其普惠的方式實現全民作曲。有網友表示自己用suno制作的音樂改了譜子后被汽水簽約了,還有專門的中介收費幫你改AI作曲的歌。 而不少疑似AI生成的口水歌,如“連不上我WiFi,找不到我乖乖”更是把原創圈禍害得不行。令人啼笑皆非的是,還有人用AI寫了“連不上我頻道,收不到我信號”。結果第一首AI歌作者和第二首AI歌作者打起來了,前者說要告后者侵權。搞笑程度不亞于AI《大東北是我的家鄉》找袁婭維要版權費(并未發生),而忘了自己的AI里喂了袁婭維的聲音。 AI的鯰魚效應還在繼續,至少很多音樂人找到了新賽道——挑戰大頭針。最熱情參賽者是曾一鳴,《美猴亡》也唱《淚海》也唱,哪里有AI那里就有曾老師。實話,自從有了大頭針打樣,曾老師的唱功和細節都有了質的飛躍。雖然肉嗓不能像AI那樣無限高音,但一些細節處理完全可以為人所用。 而且看似挑戰AI,實則是在探索如何用人聲去呈現AI唱法,唱得越像說明人聲沒輸。但這種逼近也是AI對歌手的一種馴服,唱得越像AI越贏。 硬糖君還學得一種捧殺方法,在挑戰AI的歌手的視頻下留言“全網最接近大頭針高音的就你一個”。在這樣的鼓勵下,博主天天挑戰AI高音。再過一周去看,發聲方式不合理的直接練啞了。AI有風險,模仿需謹慎。 如何看待AI浪潮下的華語樂壇創作?是積極迎戰還是綏靖保守。硬糖君這里有一計可使音綜幽而復明,那就是做個《挑戰大頭針》節目,讓歌手組團對抗AI。戲劇張力拉滿,還有點人類無望對抗人工智能的BE美。
1天前
17
谷歌、OpenAI拉響“紅色警報”
作為AI賽道的兩大重磅玩家,OpenAI與谷歌近日的“角色互換”引發了全球科技圈和資本市場的重大關注。 本周,ChatGPT開發商OpenAI的首席執行官Sam Altman拉響“紅色警報”,此前該公司主要競爭對手谷歌高調發布了Gemini 3大模型并迎來如潮好評。 這一事態發展頗具戲劇性,因為就在三年前,面對ChatGPT橫空出世,谷歌也曾發布過“紅色警報”。短短三年時間,“紅色警報”發布方悄然互換,不禁讓人感慨:AI行業無永恒領跑者,攻守態勢轉瞬即變。 面對最新的事態發展, AI賽道另一核心玩家Anthropic的首席執行官Dario Amodei日前對其兩大競爭對手OpenAI和谷歌進行了一番揶揄,并“炫耀”了自身優勢 。 Amodei周三在一場活動上表示, 他的公司認為沒有必要宣布這種緊急情況(即發布“紅色警報”) 。 “我們如今所處的位置占據著些許優勢,這讓我們完全可以專注于穩步發展,并持續迭代我們的模型,”Amodei表示。他補充道,Anthropic從未發布過任何“紅色警報”。 Amodei表示,Anthropic之所以可能感受到的壓力稍小一些,部分原因在于公司產品更多面向企業客戶,而非普通消費者。“我們一直在不斷優化模型,使其更貼合企業的實際需求。”他稱。 他指出,為企業構建模型與打造面向消費者的模型有著本質區別。 “你關注的重點完全不同,”他說。“你更少地關注用戶粘性,而更多地關注編碼、高智力活動和科研能力。” 盡管Anthropic已在企業級編程領域搶占一席之地,但Amodei透露,公司正計劃將業務拓展至金融、生物醫藥、零售以及能源等更多領域。 Anthropic上個月發布了Claude Opus 4.5,并稱這是該公司迄今為止最先進的AI模型。它改進了生成計算機代碼和工作文檔方面的功能。 不過,Anthropic仍面臨著激烈的競爭。谷歌、OpenAI等一眾科技巨頭均推出了面向辦公場景和企業級的產品。眾所周知,谷歌是全球頂尖的科技公司之一;而OpenAI手握的資源也比Anthropic更充裕。 質疑燒錢式競爭 即便如此, Amodei仍對谷歌、OpenAI和Meta等公司的燒錢式競爭策略提出了質疑 ——這些公司正不惜重金爭奪AI賽道的頭把交椅。 “(AI技術的)經濟價值將以多快的速度增長存在不確定性,因此,當前行業正面臨真正的兩難困境,”他稱。 他還表示,Anthropic正“盡最大努力,以負責任的態度穩步推進業務”。 “有些玩家完全抱著‘YOLO’(You Only Live Once,意為‘只活一次,放手一搏’)的心態,在競爭中用力過猛,”他表示。
1天前
2
世界太小,不夠世界模型們用了
世界模型,已經像這個世界一樣混亂了。 OpenAI指著Sora生成的視頻說,這就是“世界模擬器”;楊立昆(Yann LeCun)指著Sora,說它是像素幻覺,真正的世界模型應該是“預測未來的抽象大腦”;谷歌DeepMind稱,Genie3就是一個“可交互的通用世界模型”;而李飛飛說,“空間智能”才是正解。 現實世界是唯一的、客觀的,但AI圈里似乎人人都在制造屬于自己的“世界模型”。 盡管定義南轅北轍,但這群吵得不可開交的大佬們,在一個基本判斷上達成了共識:大語言模型早晚到頭,世界模型才是通往AGI的必經之路。 大語言模型在GPT-3.5之后經歷了參數的膨脹,而世界模型在技術路線收斂之前,就先經歷了概念的通貨膨脹。 世界模型是個筐,啥都往里裝 “世界模型”的混亂,根源在于它是一種目的,指的是讓AI具備理解外部世界規律,預測世界變化的能力,而非具體的技術路徑。 最先混亂的就是概念。 關于世界模型的思想,最早可追溯至1943年認知科學家Kenneth Craik提出的“心智模型(Mental Model)”,即大腦通過構建外部世界的微縮模型來進行預測,換句話說,我們腦中有一個心智模型,不僅能處理當前看到的信息,還能預測“如果我這樣做,世界會變成什么樣子”。 雖然該理論在20世紀90年代就被引入強化學習了,但真正讓它在現代AI領域擁有姓名的,是Jürgen Schmidhuber等人在2018年發表的奠基性論文《Recurrent World Models Facilitate Policy Evolution》。這篇論文首次系統定義了神經網絡世界模型的框架,那時它還是一個由視覺組件(VAE)、記憶組件(RNN)和控制器構成的具體架構,在簡陋的賽車游戲和二維類射擊游戲里訓練。 七年過去,隨著大語言模型的爆發,對通用人工智能的渴望讓這一概念在近兩年像“線面”一樣繁殖了。 Yann LeCun在2022年提出了以世界模型為核心的“自主智能”,強調通過模塊化設計和自監督學習獲取抽象表征,并在2023年、2024年先后推出了I-JEPA、V-JEPA預測模型。 李飛飛在2024年提出了“空間智能”理念,創辦World Labs,又新發布了Marble,主張世界模型必須具備生成可交互3D環境的物理一致性能力,“對我來說,空間智能是創造、推理、互動、理解深刻的空間世界的能力,無論是二維、三維還是四維,包括動態和所有這些。” 甚至連OpenAI前首席科學家Ilya Sutskever提到的“壓縮即智能”,本質上也是認為只要能無損地壓縮預測下一個token(無論是文本還是像素),模型內部就構建了一個關于世界的映射。 一個抽象的概念,衍生出了更多抽象的概念。 若剝離這些定義上的爭論,從技術方向來看,當前世界模型主要分為兩大流派,分別對應了兩種截然不同的世界觀:表征派(Representation)與生成派(Generation)。 Yann LeCun就是“表征派”,這是一條不產生畫面的極簡主義路線。 類比人腦中的心智模型(Mental Model),我們對世界的預測和行動,往往是一種直覺,不是物理公式或者具體的畫面。基于此,LeCun的世界模型是一個深藏在系統后端的“大腦”,它只在表征處理后的潛在空間里運作,預測的是“抽象狀態”。 在這篇推文中,LeCun明確定義了一個世界模型需要同時輸入四個變量,對先前世界狀態的預估s(t),對當前的觀察x(t),當前的動作a(t),一個潛在變量z(t),結合四個變量來預測下一時刻的世界狀態s(t+1)。 這個定義有兩個關鍵點,一是世界模型預測下一刻的“狀態”而不是畫面,二是能針對連續的動作交互進行因果推斷。 比如一輛車開過來,它不會在腦海里畫出車牌號和反光,只會計算出“障礙物靠近”這一狀態。這種模型不為了給人看,只為了給機器做決策,它追求的是邏輯上的因果推演,而非視覺上的逼真。LeCun提出的I-JEPA(聯合嵌入預測架構)和V-JEPA,都摒棄了生成式AI“預測每一個像素”的做法,畢竟現實世界充滿了不可預測的噪音(比如樹葉的紋理),AI不應該浪費算力去生成這些細節。 第二大流派則是目前聲量最大的“生成派”,和Yann LeCun最核心的區別就在于,他們要重建、模擬視覺世界。 這一派常常引用一句來自物理學家Richard Feynman的名言:“What I cannot create,I do not understand.——我若無法創造,便不能理解。”也就是說,只要模型能生成對的世界,就證明它懂了世界的物理規律。 2024年初,OpenAI在介紹Sora時就提到,它是一個世界模擬器。OpenAI認為,只要數據量足夠大,模型就能通過預測下一幀像素,涌現出對物理規律的理解。通過學習數十億的視頻片段,它記住了“人走路時腿會交替”、“玻璃杯掉落會破碎”的概率分布。 Sora作為世界模型的爭議很大,最直接的一點就是它無法回應LeCun對于動作與世界狀態的因果律——如果模型只能像放電影一樣生成視頻,而不能回答“如果我踢了這個球,它會怎么飛”這樣的動作交互,那么它可能只是記住了“球飛行的軌跡概率”,而不是理解了“力學定律”。 那么,如果這個視頻生成能夠根據用戶的動作輸入,實時預測下一幀呢? 于是,生成派衍生出了更進一步的形態:互動式生成視頻(Interactive Generative Video),例如Genie3。 和Sora不一樣,IGV的區別在于實時性、可交互性,也就是有了動作(Action)。谷歌DeepMind發布的Genie 3,將其明確定位為「通用目的世界模型」。它允許用戶進入場景并與之互動,支持生成720p分辨率、24fps幀率的實時畫面。用戶可以自由導航,比如以第一人稱視角駕駛或探索復雜地形。這意味著模型不僅理解畫面,還理解了動作與環境變化的因果關系,盡管目前這個動作僅限于方向按鍵的上下左右。 最后,則是李飛飛所主張的“3D空間智能(Spatial Intelligence)”,以World Labs發布的Marble為最新代表。 如果說前兩者是在處理視頻流,那么Marble則是試圖從底層構建一個持久的、可下載的3D環境。 這條路線的技術底座更接近于“3D高斯潑濺(3D Gaussian Splatting)”。它不依賴傳統的網格建模,而是將世界表征為成千上萬個漂浮在空間中的彩色模糊小斑點(高斯體)。通過這些微粒的聚合,模型能渲染出精美的三維畫面,并允許用戶通過提示詞生成、利用內置編輯器自由改造,支持一鍵導出到Unity等引擎中。 盡管Marble現在離李飛飛所提到的空間智能還很遠,但可以看出她認為達到空間智能的第一步,先要建立一個高精度的物理準確的3D空間。我們可以總結一下,區別于Sora,Marble生成的是一個符合物理規律的3D世界,區別于Genie3,Marble不是實時生成的世界,但它的精度和還原度更高。 但這些路線的成果,都沒有達到各自所期待的世界模型的模樣,甚至彼此間吵得不可開交,也都有一批擁護者,而這也導致“世界模型”的概念外延被無限擴大。 如今,凡是涉及環境理解與模擬的上下游工程,不管是具身智能、自動駕駛、游戲視頻等結構化的垂直領域,還是生成式視頻、多模態模型、視頻理解、3D模型等技術,甚至做視覺信息壓縮的DeepSeek OCR,全都主動或者被動地和世界模型掛上了鉤。 世界模型越來越像一個筐,啥都能往里裝了。 有泡沫也有野心,世界模型是一種“反LLM中心”敘事 如果僅僅是技術路線的不同,不足以解釋為何“世界模型”會在今年會井噴。熱潮背后,交織著資本的焦慮、技術的瓶頸以及對AGI的渴望。 我們必須先承認,這里面有巨大的泡沫成分。 在創投圈,敘事往往比代碼更值錢。當“大語言模型”的競爭格局已定,OpenAI、Google等瓜分了基礎模型的天下,后來者和垂直應用開發者急需一個新故事來打動投資人。 “視頻生成模型”聽起來就是一個工具軟件,天花板有限;但一旦改名叫“世界模型”,瞬間就上升到了AGI的高度。 這也是當下AI時代一個有趣的現象:科研人員大規模下場創辦公司,學術與商業發生了重疊。 在純粹的科研世界里,所有的創新都必須建立在嚴謹的公理之上。如果你要解決一個問題(如實現AGI),你首先必須精準地定義這個問題。然而,當Lab變成了Company,學術大佬們變成了CEO,這種原本局限在期刊里的“定義之爭”,就被拋到了商業世界。 在科研中,不同路線可以共存;但在創業公司中,資源是有限的,如果A定義是對的,B公司的幾十億投入可能就打了水漂,一個定義的差異,對應的卻是數以億計的算力投入方向,上下游產業鏈的備貨,投資人的價值重構。 而當我們拋開定義爭奪和炒作,世界模型的興起,也像是一場“反LLM中心主義”的運動。 整個AI行業對大語言模型(LLM)產生了一種集體性的技術焦慮。這種焦慮源于LLM的先天缺陷:它是“離身”(Disembodied)的。LLM是在純文本的符號系統中訓練出來的,它知道“蘋果”這個詞和“紅色”、“甜”經常一起出現,但它從未真正“看見”過蘋果,也無法理解蘋果掉在地上的重力加速度,更別提隨著數據規模的擴大,AI提升的邊際效益正在遞減。 無論是Ilya Sutskever在離職OpenAI后強調的“超越大模型”,還是李飛飛提出的“空間智能”,核心都在于一點:AI需要從學習“人類說的話”,轉向學習“世界發生的事”。行業正在從單純的文本處理,轉向對物理現實的模擬與交互,因為大家都意識到,通往AGI的最后一塊拼圖,不在互聯網的文本數據里,而在真實的物理世界中。 只是希望在世界模型真正出現之前,這個詞不要先被玩壞了。
1天前
7
谷歌VS OpenAI:短短三年,“紅色警報”發布方互換
中國有句俗語:“三十年河東,三十年河西”。而在當前瞬息萬變的AI賽道上,河東河西的角色互換時間,似乎可以壓縮到十分之一: 最新的故事,可能得從兩份“紅色警報”說起: 第一份“紅色警報”來自三年前的一家老牌科技巨頭,當時其擔心一家備受矚目的AI初創公司;而第二份本周最新發布的“紅色警報”主角,則倒過來變成了后者——這家具有先發優勢的AI初創公司開始驚慌失措,因為前者的產品已經取得了長足進展…… 相信許多投資者已經猜出了這兩家公司的名字——沒錯,它們就是谷歌與OpenAI。 據業內人士透露,周一,OpenAI首席執行官奧爾特曼在公司內部的Slack備忘錄中告訴員工,該公司將啟動一項“紅色警報”行動,公司將因此向ChatGPT投入更多資源,并推遲其他產品的發布。 該公司使用黃色、橙色和紅色這三種不同的顏色代碼來描述解決問題所需的不同緊急程度。 這份發給全公司員工的內部通知是迄今為止最明確的跡象,表明OpenAI正面臨來自競爭對手的壓力,這些競爭對手已經縮小了這家初創公司在AI競賽中的領先優勢。尤其令奧爾特曼擔憂的是谷歌,這家公司上個月發布了其Gemini AI模型的新版本,在行業基準測試中表現超越了OpenAI,并使這家搜索巨頭的股價飆升。 而很有意思的是,許多密切關注著AI行業的投資者可能依稀還記得,2022年12月——也就是在ChatGPT正式發布后不久,谷歌也曾在公司發布過一份類似的“紅色警報”。 據當時被媒體披露的一份內部備忘錄和錄音顯示,谷歌首席執行官皮查伊參加了多次圍繞谷歌人工智能戰略的會議,并指示公司內多個團隊重新集中精力應對ChatGPT對其搜索引擎業務構成的威脅。據悉,谷歌的研究、信任與安全部門以及其他部門的團隊當時被命令調整工作重心,以協助開發和推出人工智能原型和產品。 毫無疑問,短短三年時間,“紅色警報”發布方的悄然互換清楚地表明,隨著谷歌緊追不舍乃至試圖彎道超車,OpenAI在AI模型領域的王座似乎正面臨威脅。而當OpenAI從“顛覆者”變為“守擂者”,這場AI霸主之爭或許也已正式進入了下半場…… 谷歌正迎頭趕上 OpenAI目前面臨的最大勁敵,無疑是谷歌的Gemini 3模型,該AI模型一經推出便廣受好評。 該模型的強大功能表明谷歌在人工智能競賽中已不再落后。不僅OpenAI感到不安,全球市值最高的企業英偉達近期也因谷歌自研芯片TPU進展的報道,而被迫為自家AI芯片辯護。 從數據來看,自8月份發布圖像生成器Nano Banana以來,Gemini的用戶群一直在增長。 這家搜索巨頭11月宣布Gemini月活躍用戶已突破6.5億,較7月公布的4.5億大幅增長。相比之下,OpenAI聲稱其周活躍用戶接近8億——盡管優勢依然存在,但領先幅度正在被不斷蠶食。 Salesforce首席執行官馬克·貝尼奧夫近日表示,因Gemini的“驚人”進步, 他目前已放棄ChatGPT并轉投Gemini 3。 “天啊,”貝尼奧夫上月在X平臺寫道,"我使用ChatGPT已有三年之久。但剛體驗Gemini 3兩小時,就再也不回頭了。(Gemini 3的)這種飛躍簡直瘋狂——推理能力、處理速度、圖像生成、視頻處理……所有方面都更敏銳更迅捷。感覺世界又一次被顛覆了。" 據悉,在奧爾特曼最新發布的“紅色警報”中,也特別提及了Gemini 3,盡管其暗示OpenAI即將推出的新模型在測試中仍“領先”谷歌旗艦模型,并強調將優先為ChatGPT用戶啟用OpenAI的Imagegen圖像生成模型。 但顯然,ChatGPT是否還能保住在大語言模型賽道上的優勢,已面臨了越來越大的業內質疑聲。 近幾個月來,OpenAI尤其難以平衡用戶對其聊天機器人安全性的擔憂與提升用戶體驗之間的關系。其8月份發布的GPT-5模型也并未獲得部分用戶的青睞——不少用戶抱怨其語氣冷漠,且難以回答簡單的數學和地理問題。 財務處境天壤之別 從財務角度看,人工智能領域競爭的成本可謂高昂。而與OpenAI相比,谷歌正憑借其廣告業務這一“現金制造機”占據絕對優勢。 誠然,谷歌計劃今年投入910億至930億美元資本支出,其中大部分用于人工智能成本。但僅上季度其營收就達1000億美元——其中741.8億美元來自廣告業務。 同時,與OpenAI不同,谷歌能憑借其龐大規模實現全棧優勢,從研發到芯片制造再到內部云平臺(承載所有業務)全程掌控人工智能發展。 相比之下,OpenAI目前則尚未盈利,必須持續不斷地籌集資金才能生存,這使其在財務上處于劣勢,無法與谷歌和其他能夠利用自身收入進行投資的科技公司相抗衡。 近幾個月來,許多華爾街人士也不斷對OpenAI不斷攀升的人工智能支出承諾表示擔憂,其未來八年支出總額至少達1.4萬億美元。OpenAI的支出也比其主要初創競爭對手Anthropic更為激進,根據OpenAI自身的財務預測,該公司需要將收入增長到約2000億美元才能在2030年實現盈利。 在最新“紅色警報”中,奧爾特曼表示,OpenAI將推遲其他項目的開發,例如廣告、用于醫療和購物的AI代理,以及名為Pulse的個人助理。他鼓勵團隊成員進行臨時調動,并表示公司將為負責改進ChatGPT的人員召開每日例會。 然而,這一轉變無疑將進一步加劇業內對其盈利時間表將延后的擔憂。 OpenAI雖占先機,但谷歌握有平臺優勢 事實上,客觀來說,OpenAI過去近年也并未“虛耗”其先發優勢,尤其是今年已取得若干重大突破。 近月來,OpenAI通過旗下TikTok式AI視頻生成應用Sora,進軍了社交媒體等領域,更主動推出自營瀏覽器Atlas試圖直擊谷歌Chrome。 在突破計算資源與能源供應瓶頸的戰役中,OpenAI顯然也打出了不少“王炸”。面對AI發展所需的龐大算力缺口和巨額資金投入,OpenAI主導了一系列“鐵索連環”式循環融資合作模式。 微軟、英偉達等美國科技巨頭向OpenAI巨額注資,而OpenAI獲得資金后,又將其回流用于購買巨頭的芯片或云算力。這本質上是一場豪賭算力的游戲。科技巨頭們通過深度綁定,試圖用資金換取未來的技術壟斷。盡管該公司目前仍為私營企業,但其命運已經開始與英偉達、微軟和甲骨文等公司的命運息息相關。 這使得在許多人的腦海里,ChatGPT當前仍是最為與AI“緊密關聯”的產品——幾乎如同谷歌之于網絡搜索。 這一先發優勢的存在和維持,可能仍有望助推ChatGPT應用下載量與使用率,同時幫助抵御谷歌誘導用戶轉向Gemini或其他人工智能產品的攻勢。 但在另一邊,谷歌崛起的勢頭,顯然也已不容忽視。 人類是習慣的“奴隸”,許多人早已養成每日使用谷歌產品或服務的習慣——這家科技巨頭目前也正利用平臺優勢不斷吸納ChatGPT用戶。 如今,隨著OpenAI明智地開始發出“紅色警報”保持警惕,人們得以見證這場人工智能競賽的升溫:曾經的落后者谷歌正逐步掌握人工智能技術,并加速前進。 對OpenAI來說,這則是一個提醒:當面臨被顛覆的可能時,像谷歌這樣的科技巨頭們仍有強大的“底蘊”可以展開相當激烈的抗爭——有時,甚至還能扭轉局面。 去年五月,奧爾特曼在批評谷歌產品之前曾表示,“我盡量不會去過多思考競爭對手。”而如今看來,那樣的日子或許已一去不復返……
2天前
3
