每經(jīng)記者 鄭雨航 每經(jīng)實習記者 宋欣悅 岳楚鵬 每經(jīng)編輯 蘭素英
本周,一場激烈的“軍備競賽”在AI界上演。
OpenAI自12月5日開啟的12天特別活動已經(jīng)過去了一半,期間發(fā)布了不少驚喜,包括期待已久的AI視頻生成模型Sora、解鎖高級視頻對話和屏幕共享的ChatGPT,以及ChatGPT接入蘋果“全家桶”,賺足了外界的眼球。在第七天的活動上,OpenAI還故意放了個“彩蛋”:一個項目標注著“AGI(即通用人工智能,請勿現(xiàn)場演示)”,吸引了大量關注。
科技巨頭谷歌、馬斯克旗下xAI自然不會坐以待斃,也競相發(fā)布新產品。尤其是谷歌新推出的人工智能大模型Gemini 2.0 Flash,除了能生成文字外,還能直接生成圖片和語音,而且延遲還特別低。
在一系列新品的“轟炸”之下,用戶也是激動不已,紛紛涌入各大平臺,希望搶得一手體驗。哪知道,ChatGPT、Sora,以及Meta的一系列產品卻在本周出現(xiàn)了全球范圍的宕機,持續(xù)了數(shù)小時,讓用戶叫苦不迭。但OpenAI和Meta都沒有詳細說明服務中斷的原因,但據(jù)猜測,這與算力和服務器的需求激增有關。有行業(yè)人士介紹,在大模型時代,算力需求每2個月就要翻倍。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢呢?復旦大學計算機科學技術學院副教授鄭驍慶在接受《每日經(jīng)濟新聞》采訪時表示,“個性化”將是關鍵詞之一。
借著12天12場的新品活動,OpenAI在科技界掀起了一場前所未有的波瀾。xAI和谷歌自然也不會缺席這場盛宴,也相繼發(fā)布新產品,在這場年末狂歡中刷了一波存在感。
圖片來源:每經(jīng)制圖
截至目前,OpenAI的這場圣誕特別活動已經(jīng)過去一半,期間發(fā)布的產品不乏重磅之作,例如被OpenAI稱為“今年最重要的AI功能之一”的Projects In ChatGPT、等了300天才上線的視頻生成模型Sora 和“裝上眼睛”的ChatGPT。
Sora與今年2月發(fā)布的預覽版相比,則增加了文本生成視頻、動畫圖像和混合視頻等功能。用戶可生成分辨率高達1080p、時長最長為20秒的視頻。此外,用戶還可以導入自己的素材,用于擴展、重新混合或融合內容,甚至直接從文本生成全新的視頻。
知名數(shù)碼科技博主馬克·布朗利(Marques Brownlee)表示,Sora在風景鏡頭處理方面表現(xiàn)出色,能生成媲美專業(yè)素材的無人機航拍鏡頭。然而,這款產品仍存在一些局限性。比如,在物理模擬方面,模型對物體運動的理解還不夠深入,常常出現(xiàn)動作不自然、物體突然消失等問題。
ChatGPT的高級語音(Advanced Voice)模式也無疑是一大“王炸”,不僅支持實時視頻通話,還能實時共享屏幕和上傳圖像。這一技術迭代使得ChatGPT不僅能聽會說,還解鎖了視覺能力,通過攝像頭睜眼“看”世界,可以說“人味”十足。
在強化AI視覺理解能力方面取得進展的還有谷歌。在ChatGPT高級語音模式發(fā)布的前一天,多次在新品發(fā)布上遭遇OpenAI狙擊的谷歌也“放了大招”,官宣了新模型Gemini 2.0系列的“先頭兵”——Gemini 2.0 Flash。憑借強大的多模態(tài)輸出功能和良好的用戶體驗,Gemini 2.0總算是給谷歌扳回了一局。
有科技博主體驗后直接驚呼:這絕對是世界上首個真正把語音 + 視覺全模態(tài)能力做到實時、無卡頓感交互的AI模型。
面對競爭對手的強勁勢頭,OpenAI在接下來的活動中還將釋放什么驚喜呢?
在第七天(12月14日)的發(fā)布會上,OpenAI埋了個“彩蛋”:一個項目標注著“AGI(請勿現(xiàn)場演示)”,吸引了大量關注。此外,在用于演示的iPhone上,還似乎設置了一個名為“超級秘密AGI”的日歷活動,進一步增添了神秘色彩。
而在11日,OpenAI研究人員卡琳娜·阮(Karina Nguyen)在社交平臺上發(fā)布帖子時附上了一張新功能展示界面截圖,界面上出現(xiàn)了一個陌生的名字——ChatGPT ε。網(wǎng)友猜測,這極可能就是之前被傳出的下一代模型“獵戶座”(Orion)。網(wǎng)友還給出了“充分”的理由:天文學中,獵戶座腰帶上的中心恒星Anilam,用巴耶命名法表示正是獵戶座ε。
圖片來源:Reddit
新產品發(fā)布如火如荼,渴望搶先體驗的用戶也躍躍欲試。然而,讓人意想不到的是,OpenAI和Meta旗下產品卻出現(xiàn)了全球范圍的服務中斷。
當?shù)貢r間12月11日下午3點左右,ChatGPT、Sora及API開始出現(xiàn)中斷。15分鐘后,OpenAI在X平臺上致歉。直到晚上9點,OpenAI才宣布基本恢復了服務。
圖片來源:X平臺截圖
中斷期間,一些用戶不停發(fā)出抱怨之聲,稱OpenAI嚴重耽誤了他們的工作了。有用戶不無調侃地表示:“ChatGPT宕機了,我現(xiàn)在不得不像個山頂洞人一樣備戰(zhàn)期末考試。”
而在ChatGPT和Sora宕機前約6小時,Meta旗下多個產品也出現(xiàn)“宕機”。上午10點,中斷數(shù)據(jù)追蹤網(wǎng)站Downdector報告的Facebook中斷數(shù)量激增至超過九萬七千份,Instagram的中斷報告數(shù)量激增至六萬七千份以上,其他Meta產品也出現(xiàn)了不同程度上的中斷。數(shù)小時后,問題得以解決。
圖片來源:X平臺截圖
OpenAI和Meta都沒有詳細說明服務中斷的原因,但有人猜測與算力和服務器的需求激增有關。
本周早些時候,Sora 一經(jīng)開放便吸引了大量用戶,導致服務器一度被“擠爆”。許多注冊用戶無法生成視頻,并收到一條消息,稱“OpenAI的服務器已滿負荷”。
算力資源的不足在AI領域已經(jīng)不是什么新鮮話題。有行業(yè)人士介紹,在“深度學習”時代之前,算力需求每24個月翻倍;在“深度學習”時代,算力需求每3至4個月翻倍;在大模型時代,算力需求每2個月就要翻倍。
目前,算力需求和算力基礎設施存在供需缺口。上個月,阿爾特曼就曾透露,由于計算能力的明顯短缺,GPT-5的發(fā)布將被推遲至明年。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢呢?
復旦大學計算機科學技術學院副教授鄭驍慶在接受《每日經(jīng)濟新聞》記者采訪時表示,“個性化”將是2025年AI發(fā)展的關鍵詞之一。
他對記者補充稱,要實現(xiàn)個性化和數(shù)據(jù)隱私之間的平衡,云+端的協(xié)作模式將成AI發(fā)展的趨勢。如果所有數(shù)據(jù)都在云端,會消耗大量算力。未來,需要快速響應的、涉及個人隱私的數(shù)據(jù)可能會在端側(如PC、智能手機),而需要更強計算能力才能解決的復雜問題,會上傳至云端進行計算。
美國硅谷風險投資公司a16z近期綜合公司50位合伙人洞察而發(fā)布的“Big Ideas in Tech for 2025”報告也對明年AI領域的發(fā)展進行了展望。
Justine Moore表示,AI將成為你的“第二大腦”。借助大語言模型(LLMs),每天產生的大量數(shù)字信息可以被整合為一個“數(shù)字大腦”。在未來,AI將成為一個無限記憶庫,記錄我們的想法,提供建議,指導個人成長。AI可以整理總結信息,生成數(shù)字日記,幫助我們進行更明智的決策。
而James da Costa提到,2025年,每個白領都將有一個AI助手幫助處理繁瑣任務,讓人們專注于更具創(chuàng)造性或戰(zhàn)略性的工作。未來,某些角色可能幾乎完全由AI agents(智能體)自動化完成。
Sarah Wang認為,2025年將是AI原生應用層崛起的一年。在大多領域內,最佳的創(chuàng)始團隊本質是應用AI的工程團隊。他們探索與模型互動的最佳方法,以解決客戶“最后一公里”難題。成功的AI應用可能會結合多個大模型+自訓練的小模型,提供從通用到有價值的AI體驗。未來成功的AI應用公司,絕不會被簡單視為“GPT套殼”。
Guido Appenzeller則表示,生成式AI將無處不在,AI不再僅運行在云端大服務器,也會運行在小型設備和應用上。
封面圖片來源:視覺中國-VCG31N2008742366
還沒有評論,來說兩句吧...