2025年4月14日,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)在南京舉辦的“人工智能賦能新型工業(yè)化深度行”活動(dòng)中宣布,正式啟動(dòng)“可信AI智能體測(cè)試床”建設(shè)工作。
該項(xiàng)目聯(lián)合華為、百度、金蝶軟件、聯(lián)通數(shù)科、中國(guó)移動(dòng)研究院、VIVO、吉利汽車、華晨寶馬等十余家頭部企業(yè),旨在構(gòu)建覆蓋多智能體協(xié)同測(cè)試的標(biāo)準(zhǔn)化環(huán)境,推動(dòng)智能體技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)規(guī)模化應(yīng)用。
隨著大模型與智能體通信協(xié)議(如MCP協(xié)議)的快速發(fā)展,智能體在跨場(chǎng)景協(xié)作、任務(wù)執(zhí)行等方面展現(xiàn)出巨大潛力,但其實(shí)際應(yīng)用仍面臨協(xié)作有效性不足、身份可信性存疑、應(yīng)用可靠性參差等挑戰(zhàn)。
為此,中國(guó)信通院提出“可信AI智能體測(cè)試床”的三大核心能力架構(gòu):
資源配置層:整合計(jì)算設(shè)施、數(shù)據(jù)資源、網(wǎng)絡(luò)設(shè)施等基礎(chǔ)能力,為智能體測(cè)試提供硬件與軟件支撐;
環(huán)境構(gòu)建層:搭建智能體仿真測(cè)試環(huán)境,支持運(yùn)行腳本調(diào)試、模型接入與智能體部署;
任務(wù)測(cè)試層:聚焦多智能體協(xié)同測(cè)試,覆蓋理解分析、規(guī)劃決策、通信交互等全流程能力驗(yàn)證。
測(cè)試床的核心任務(wù)是通過(guò)三類測(cè)試場(chǎng)景,推動(dòng)智能體技術(shù)的標(biāo)準(zhǔn)化與:
MCP協(xié)議測(cè)試:驗(yàn)證智能體通信協(xié)議的一致性、服務(wù)性能和擴(kuò)展性,解決跨平臺(tái)互聯(lián)互通問(wèn)題;
單智能體基準(zhǔn)測(cè)試:評(píng)估智能體在感知、規(guī)劃、執(zhí)行等維度的能力,例如動(dòng)態(tài)環(huán)境感知、任務(wù)拆解、數(shù)據(jù)庫(kù)操作等;
多智能體協(xié)同測(cè)試:模擬復(fù)雜任務(wù)場(chǎng)景(如智慧城市、工業(yè)自動(dòng)化),驗(yàn)證多智能體協(xié)作的可靠性與效率,例如華為、百度提供的技術(shù)方案將重點(diǎn)優(yōu)化分布式?jīng)Q策與資源調(diào)度能力。
中國(guó)信通院指出,測(cè)試床的標(biāo)準(zhǔn)化成果將直接服務(wù)于金融、制造、交通等領(lǐng)域,幫助企業(yè)降低30%的測(cè)試成本,提升50%的協(xié)作效率。
此次測(cè)試床的啟動(dòng)不僅是技術(shù)驗(yàn)證平臺(tái),更標(biāo)志著產(chǎn)業(yè)協(xié)同模式的升級(jí)。參與企業(yè)將共享測(cè)試數(shù)據(jù)與場(chǎng)景資源,形成“技術(shù)研發(fā)-測(cè)試優(yōu)化-商業(yè)落地”的閉環(huán)。例如:
華為貢獻(xiàn)了其邊緣計(jì)算與通信協(xié)議技術(shù),優(yōu)化智能體在高并發(fā)場(chǎng)景下的穩(wěn)定性;
百度基于其大模型能力,提供自然語(yǔ)言交互與復(fù)雜任務(wù)規(guī)劃的支持;
吉利汽車則開(kāi)放了智能駕駛仿真環(huán)境,推動(dòng)車聯(lián)網(wǎng)場(chǎng)景下的協(xié)同測(cè)試。
此外,測(cè)試床還將與螞蟻數(shù)科等企業(yè)的可信智能體技術(shù)平臺(tái)聯(lián)動(dòng),確保智能體在知識(shí)工程、交互安全等環(huán)節(jié)的可靠性,降低產(chǎn)業(yè)化應(yīng)用的潛在風(fēng)險(xiǎn)。
中國(guó)信通院表示,下一步將重點(diǎn)完善測(cè)試床的評(píng)估標(biāo)準(zhǔn)與工具鏈,并計(jì)劃于2025年底發(fā)布首份《可信AI智能體測(cè)試指南》。
隨著測(cè)試能力的擴(kuò)展,智能體技術(shù)有望在金融客服、智慧醫(yī)療、數(shù)字孿生等領(lǐng)域?qū)崿F(xiàn)規(guī)?;涞?,真正成為企業(yè)數(shù)字化轉(zhuǎn)型的“AI生產(chǎn)力”。
可信AI智能體測(cè)試床的啟動(dòng),不僅是技術(shù)基礎(chǔ)設(shè)施的突破,更是中國(guó)在人工智能產(chǎn)業(yè)協(xié)同與標(biāo)準(zhǔn)話語(yǔ)權(quán)爭(zhēng)奪中的關(guān)鍵一步。
微信掃碼
關(guān)注PHP中文網(wǎng)服務(wù)號(hào)
QQ掃碼
加入技術(shù)交流群
Copyright 2014-2025 http://ipnx.cn/ All Rights Reserved | php.cn | 湘ICP備2023035733號(hào)