本報記者 袁傳璽
12月18日,火山引擎在FORCE原動力大會上正式發(fā)布豆包大模型1.8(Doubao-Seed-1.8)及音視頻創(chuàng)作模型Seedance 1.5 pro。火山引擎總裁譚待表示,截至今年12月份,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業(yè)客戶累計token使用量超過一萬億。
“目前大廠在多模態(tài)Agent(智能體)領(lǐng)域的競爭已從單點模型能力比拼,升級為‘模型—平臺—生態(tài)’的系統(tǒng)化作戰(zhàn)。”中國移動通信聯(lián)合會教育與科學(xué)技術(shù)研究院執(zhí)行院長陳曉華在接受《證券日報》記者采訪時表示,火山引擎此次發(fā)布的產(chǎn)品旨在依托其日均調(diào)用量的規(guī)模優(yōu)勢,在Agent生態(tài)底座上確立領(lǐng)先地位。
技術(shù)突圍
本次發(fā)布的豆包大模型1.8,其核心升級完全圍繞“打造更強大的Agent大腦”展開。與單純追求參數(shù)規(guī)模不同,該版本在設(shè)計之初便針對多模態(tài)Agent場景進行定向優(yōu)化,在復(fù)雜指令遵循、多輪交互以及操作系統(tǒng)級別的實際操作(OS Agent)能力上實現(xiàn)了系統(tǒng)性增強。
在至關(guān)重要的多模態(tài)理解層面,豆包1.8完成了視覺能力的底層升級。其單次視頻理解幀數(shù)提升至1280幀,并能以低幀率解析超長視頻,在需要時調(diào)用工具對關(guān)鍵片段進行高精度分析。這一能力使得模型能夠處理在線教育課程、工業(yè)質(zhì)檢視頻等復(fù)雜冗長的視覺信息,為Agent在真實場景中自主決策提供了感知基礎(chǔ)。
同步亮相的音視頻創(chuàng)作模型Seedance 1.5 Pro,則從內(nèi)容創(chuàng)作端展示了多模態(tài)融合的更高階形態(tài)。該模型采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),實現(xiàn)了毫秒級的音畫同步,并能基于畫面景深和角色數(shù)量,精準(zhǔn)匹配多人、多語言對話的口型。這解決了AI視頻生成中長期存在的“張口無聲”或口型錯位的頑疾,將技術(shù)從“炫技”推向“實用”。
火山引擎推出上述兩個模型,標(biāo)志著大模型行業(yè)已從單純的參數(shù)競賽,全面進入了以多模態(tài)Agent為核心的產(chǎn)業(yè)落地新階段。賽智產(chǎn)業(yè)研究院人工智能研究所副所長安赟對《證券日報》記者表示,這可以從三個維度來分析。其一,AI價值從“單點生成”向“全鏈路執(zhí)行”的質(zhì)變。通過多模態(tài)感知與Agent規(guī)劃能力的結(jié)合,AI能夠跨越感知與行動的鴻溝,真正具備了在垂直場景中閉環(huán)完成任務(wù)的能力。其二,IT基礎(chǔ)設(shè)施從“功能驅(qū)動”向“智能驅(qū)動”的范式重構(gòu)?;鹕揭嫣岢龅摹癆I云原生架構(gòu)”極具前瞻性,揭示了未來的軟件形態(tài)將不再是傳統(tǒng)的SaaS堆棧,而是以Agent為主體的智能協(xié)同網(wǎng)絡(luò)。其三,大模型應(yīng)用正在跨越“成本與穩(wěn)定性”的規(guī)?;T檻。
競爭加劇
事實上,主要云廠商均已將戰(zhàn)略重心調(diào)整至多模態(tài)智能體平臺,競爭維度從單一模型能力升級為全棧技術(shù)、開發(fā)生態(tài)與行業(yè)場景的立體化角逐。
阿里云在9月份的云棲大會上全面升級了其全棧AI體系,實現(xiàn)從AI大模型到AI基礎(chǔ)設(shè)施的技術(shù)更新。阿里通義旗艦?zāi)P蚎wen3-Max不僅在多項評測中躋身全球前列,更在聚焦Agent工具調(diào)用能力的Tau2-Bench測試中取得突破性高分。更重要的是,阿里云發(fā)布了全新的Agent開發(fā)框架ModelStudio-ADK和低代碼平臺ModelStudio-ADP,將Agent的開發(fā)效率提升至“1個小時就能輕松開發(fā)一個能生成深度報告的Deep Research項目”的水平。
10月15日,百度搜索宣布全面升級文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作。依靠百度搜索開放平臺,文心助手支持一鍵調(diào)用多工具解決生活、健康、教育、工作等多場景問題。
在譚待看來,傳統(tǒng)的IT架構(gòu)已無法滿足Agent時代的需求,以模型為中心的AI云原生架構(gòu)正在形成,并圍繞Agent的開發(fā)與運營進行重構(gòu)。
面對競爭,火山引擎此次打出了“組合拳”?;鹕揭嫒嫔壛似髽I(yè)級AI Agent平臺——AgentKit,覆蓋了Agent從開發(fā)、部署到管控的全生命周期。同時,火山引擎推出了HiAgent智能體工作站,通過構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心、提供一系列開箱即用的通用智能體,以及支持個性化定制智能體應(yīng)用,幫助企業(yè)實現(xiàn)Agent的規(guī)?;芾砼c應(yīng)用。
除了提升模型能力外,火山引擎還推出業(yè)內(nèi)首個“AI節(jié)省計劃”,該計劃通過階梯定價,承諾最高可為按量付費的企業(yè)節(jié)省47%的成本。
“通過從模型能力到基礎(chǔ)設(shè)施的全面革新,火山引擎正在推動AI應(yīng)用從單一的模型調(diào)用向復(fù)雜的Agent智能體生態(tài)演進,加速AI在各行各業(yè)的深度落地。”譚待表示。