開(kāi)云直播中心:沈向洋深圳硬核演講:具身智能是大灣區的非凡機遇靈巧手是人類(lèi)最后尊嚴
開(kāi)云體育官方入口登錄:
機器人前瞻11月22日報道,今天,一年一度的IDEA大會(huì )在深圳舉行。這場(chǎng)人工智能盛會(huì )由IDEA研究院創(chuàng )院理事長(cháng)、美國國家工程院外籍院士沈向洋發(fā)起,深入探討了關(guān)于A(yíng)I發(fā)展、AI Agent、具身智能、低空經(jīng)濟等前沿技術(shù)與熱點(diǎn)議題。
沈向洋進(jìn)行了近3個(gè)小時(shí)主題演講,期間發(fā)布了多個(gè)IDEA研究院創(chuàng )新成果,包括企業(yè)決策智能體、數據分析智能體、藥物計算發(fā)現平臺、金融大模型、GPU原生渲染器、視覺(jué)大模型、低空管理與服務(wù)操作系統等。
想要理解人工智能演進(jìn),沈向洋強調,需要在算力、算法和數據之外,增加兩個(gè)考慮維度:交互與載體。如今,談大模型總繞不開(kāi)英偉達CEO黃仁勛,沈向洋打趣說(shuō),“黃仁勛每天醒來(lái)都在笑,全世界的人在給他捐錢(qián)。?!?
在具身智能方面,沈向洋對格外看重靈巧手,強調,“人手的魔法在于它手既能搬箱子,也能穿針引線(xiàn)。所以,靈巧手可以說(shuō)是人類(lèi)在人工智能面前,最后的尊嚴?!彼€提到去年與黃仁勛的對談時(shí),黃仁勛說(shuō),“具身智能是粵港澳大灣區非凡的機遇?!?
據了解,IDEA大會(huì )于2021年首度舉行,匯聚產(chǎn)學(xué)研企界領(lǐng)袖,致力構建一個(gè)凝聚數字化的經(jīng)濟多方力量的國際化平臺,是粵港澳大灣區最具影響力的科技盛會(huì )之一。
除了廣為人知的了算力、算法、數據這三要素之外,沈向洋提出,未來(lái)理解AI的演進(jìn)還必須加入兩個(gè)維度:交互和載體。
算法是AI發(fā)展的核心支撐。AI的算法演進(jìn)有三個(gè)階段:監督學(xué)習構筑表達與生成能力,強化學(xué)習引入因果與執行,自主學(xué)習邁向高層認知。技術(shù)本身從Transformer架構出發(fā),向更高效、更穩健的體系演化;從自回歸到擴散,再到混合式生成方法,這些變化一同推動(dòng)智能的表達邊界不斷拓展。
AI的載體發(fā)展遵循從抽象到具體、從虛擬到物理的擴展路徑:從早期的語(yǔ)言模型,逐步演進(jìn)到涵蓋聲音、圖像、視頻甚至4D內容的多模態(tài)模型;在此基礎上,融入物理世界規律的世界模型成為新方向,而當世界模型落地到機器人、無(wú)人駕駛車(chē)輛、飛行器等物理實(shí)體時(shí),便形成了具身模型。
“從載體的這個(gè)維度來(lái)看,AI很快就會(huì )讓我們從理解這樣一個(gè)世界,走向改變這樣一個(gè)世界?!鄙蛳蜓笳f(shuō)。
過(guò)去七八十年,計算機科學(xué)的一條主線(xiàn)就是人機交互方式的演進(jìn):從命令行,到圖形界面,到互聯(lián)網(wǎng)搜索,再到推薦系統。AI的到來(lái),則帶來(lái)了自然語(yǔ)言和多模態(tài)的交互。
早期的第一代大模型,更像問(wèn)一句答一句的搜索;而近兩年的推理模型則讓對話(huà)成為一個(gè)持續迭代的過(guò)程:你問(wèn)、它答,你再追問(wèn)、它再推理,過(guò)程越來(lái)越像真實(shí)的科研活動(dòng)。
在他看來(lái),“探索世界就應該是Search less,research more?!蔽磥?lái),AI會(huì )慢慢的多地主動(dòng)提出問(wèn)題、主動(dòng)執行任務(wù),但在人機系統中,人仍需在關(guān)鍵節點(diǎn)做決策、做最終判斷,以確保AI的行為不偏離邊界。
GPU從2006年作為通用并行計算系統起步,從打游戲到“挖礦”再到支撐大模型訓練,如今已成為基礎設施。但當前算力需求呈現新變化:推理需求已經(jīng)遠超訓練,端側芯片和強化學(xué)習專(zhuān)用芯片的需求也迅速上升。強化學(xué)習芯片必須支持高速交互和大規模并行,推理芯片則要做到低功耗、高吞吐。
GPU刺激了深度學(xué)習的第一波爆發(fā),但能耗與成本也不斷攀升。隨著(zhù)應用多樣化,推理、端側、強化學(xué)習等專(zhuān)用芯片不斷涌現;未來(lái)光子、量子、類(lèi)腦等也可能在特定領(lǐng)域帶來(lái)性能躍升。
在智能演進(jìn)的三個(gè)階段,數據扮演不同的角色:在模擬世界階段,數據是靜態(tài)教材;在探索世界階段,數據是動(dòng)態(tài)反饋;在歸納世界階段,數據是驗證假設的證據。
當我們轉向強化學(xué)習、探索世界時(shí),模型需要的就不再是靜態(tài)數據,而是帶反饋的動(dòng)態(tài)數據。沈向洋用一個(gè)樸素的類(lèi)比強調這一點(diǎn):“就像騎自行車(chē)這件事,你光看書(shū)的話(huà)不可能會(huì )學(xué)會(huì )騎自行車(chē)的?!?
從人類(lèi)數據枯竭到合成數據興起,再到AI主動(dòng)探索并獲取實(shí)驗數據,這一過(guò)程代表著(zhù)數據從限制模型能力的約束,逐步轉變?yōu)橥苿?dòng)AI主動(dòng)學(xué)習的工具。
在沈向洋看來(lái),未來(lái)AI最強大的能力之一,是能夠自己提出假設,并自己收集證據來(lái)提升智能水平。在這個(gè)過(guò)程中,數據和智能是相互推動(dòng)的。
合成數據已經(jīng)成為大模型訓練的剛需要素,尤其在小語(yǔ)種、隱私敏感行業(yè)、小樣本場(chǎng)景等長(cháng)尾領(lǐng)域,數據稀缺更是主要瓶頸。
成立于2025年的DataArc數創(chuàng )弧光,專(zhuān)注大模型合成數據技術(shù),是IDEA研究院成立以來(lái)孵化速度最快的項目,成立不足一年已完成兩輪融資。本屆大會(huì )上,DataArc發(fā)布了SynData開(kāi)源框架。
在沈向洋看來(lái),除了數據層面的機會(huì ),模型層面也遠不止超大模型這一條路,各類(lèi)垂直應用場(chǎng)景同樣蘊含巨大空間。金融,就是其中的典型代表。
傳統金融投資面臨行情預判精度不足、風(fēng)險管控難度較大的挑戰,Quant 5.0融合AI技術(shù),憑借大參數算力支撐及高頻數據訓練,可支持三類(lèi)任務(wù):對未來(lái)收益和走勢的預測,服務(wù)投資決策;為交易所、監管機構及機構投資者提供風(fēng)控能力;為監管與決策提供市場(chǎng)模擬和壓力測試工具。
由于Quant 5.0是通用時(shí)間序列底座模型,它可以輕松遷移到其他市場(chǎng)、其他資產(chǎn)類(lèi)別以及其他交易策略上,并通過(guò)Agent方式實(shí)現策略自動(dòng)化部署。
現場(chǎng)發(fā)布了國內首個(gè)提供公共服務(wù)的工業(yè)級AI驅動(dòng)GPU渲染引擎SMARAY,在保證高質(zhì)量渲染效果的前提下,其渲染效率較傳統渲染器提升數十至數百倍,且可兼容主流動(dòng)畫(huà)特效建模軟件,無(wú)需改變現有工作流 。
目前,SMARAY已獲《流浪地球2》視效制作方More VFX、《哪吒》系列出品方光線(xiàn)動(dòng)畫(huà)等頭部影視團隊項目實(shí)踐驗證。
另外,現場(chǎng)還介紹了IDEA研究院的MoonBit團隊的最新成果。MoonBit是IDEA研究院自研的AI時(shí)代新編程語(yǔ)言,今年,MoonBit從支持多后端的編程語(yǔ)言,逐步演進(jìn)為涵蓋AI原生工具集的全棧工具鏈,覆蓋WebAssembly邊緣計算、C/LLVM系統編程、JavaScript前端開(kāi)發(fā)等全場(chǎng)景,構建起集開(kāi)發(fā)者工具鏈與智能體開(kāi)發(fā)生態(tài)于一體的開(kāi)發(fā)者平臺。
今年,MoonBit也開(kāi)放了全球首個(gè)語(yǔ)言原生的智能體開(kāi)發(fā)環(huán)境MoonBit Pilot,智能輔助生成MoonBit工具包,可快速擴展MoonBit生態(tài)。
下個(gè)月,IDEA研究院將正式開(kāi)源用MoonBit編程語(yǔ)言開(kāi)發(fā)的智能體平臺MoonBit agent SDK,支持使用多種編程語(yǔ)言。
截至目前,MoonBit社區用戶(hù)已從早期的500人、去年的2.6萬(wàn)人,增長(cháng)到十萬(wàn)級規模;全球貢獻代碼行數超過(guò)1000萬(wàn)行,生態(tài)庫約3000個(gè)。
AI Agent是大模型落地的重要產(chǎn)品載體,也是人工智能行業(yè)從業(yè)者多年來(lái)關(guān)注的核心方向。進(jìn)入2025年,全球尤其是中國的AI Agent創(chuàng )新全面爆發(fā)。沈向洋從四個(gè)層面來(lái)梳理AI Agent的影響:個(gè)體、公司、治理與創(chuàng )新。
AI Agent帶來(lái)了生產(chǎn)力的巨大提升,徹底改變了傳統工作模式,一個(gè)人加上一堆AI Agent,就會(huì )成為所謂的超級個(gè)體。這種生產(chǎn)力的飛躍直接推動(dòng)了生產(chǎn)關(guān)系、組織機構、分工形式與協(xié)同方式的變革,而成為超級個(gè)體的關(guān)鍵在于是否愿意學(xué)習和運用AI Agent。
沈向洋判斷,未來(lái)慢慢的變多企業(yè)將成為“AI Native公司”,從組織結構到業(yè)務(wù)流程,從供應鏈到市場(chǎng)拓展,都圍繞AI重新設計。
為此,IDEA研究院推出了KAIROS決策智能體,核心就是讓AI真正進(jìn)入企業(yè)的決策鏈路。
其能通過(guò)三大能力打造“決策-執行-反饋”閉環(huán):一是借助通用大模型語(yǔ)言理解能力,結合企業(yè)數據與經(jīng)驗,精準解讀業(yè)務(wù)需求;二是針對復雜決策提供更優(yōu)的端到端優(yōu)化方案;三是通過(guò)自動(dòng)編程、代碼生成實(shí)現模型自適應演變,降低維護成本。
落地場(chǎng)景中,KAIROS應用覆蓋物流、倉儲、港口、零售等多場(chǎng)景,可支撐規劃類(lèi)、調度類(lèi)、預測類(lèi)等全類(lèi)型決策。
在政府治理體系中,統計部門(mén)是一類(lèi)關(guān)鍵角色。長(cháng)期以來(lái),統計局的工作人需要“肩挑手扛”:去各處找數據、整材料,為領(lǐng)導寫(xiě)報告。而大模型的發(fā)展,正在推動(dòng)這項流程走向自動(dòng)化和智能化。
IDEA研究院去年發(fā)布的“經(jīng)濟超腦1.0”已能看懂數據、理解背后邏輯,而升級后的“經(jīng)濟超腦2.0”,可構建全流程自動(dòng)化數據分析體系,依托Agents驅動(dòng)的智能框架,實(shí)現效率提升10-30倍,關(guān)聯(lián)模糊需求與業(yè)務(wù)指標、自動(dòng)拆解宏觀(guān)分析需求,讓數據分析回路從被動(dòng)調試升級為主動(dòng)修正,推動(dòng)實(shí)現數據驅動(dòng)的智能化決策,釋放數據資產(chǎn)價(jià)值以形成更優(yōu)政策建議。
去年,IDEA研究院已發(fā)布分子、抗體、反應、藥物文獻四大化學(xué)大模型;今年取得更大突破,研發(fā)的LightUnity模型用于創(chuàng )新藥發(fā)現。
在此基礎上,IDEA研究院發(fā)布Mozi平臺,以“Agent+Toolbox”模式,結合多智能體架構、專(zhuān)家工具箱與自動(dòng)化流程,解決傳統藥物早期計算發(fā)現中工具誤導、研發(fā)黑箱、工作流瓶頸等痛點(diǎn)。
不久前,傳聞特斯拉人形機器人因手部“難產(chǎn)”而被迫縮減生產(chǎn)計劃。沈向洋表示,在具身智能的眾多攻關(guān)點(diǎn)里,靈巧手是技術(shù)復雜度的珠峰。
他分享到,今年的深圳智能機器人靈巧手大賽,是國內首個(gè)將靈巧手技術(shù)與即時(shí)配送場(chǎng)景結合的賽事。從取包裹、拆包裹、折紙箱、到按電梯,以場(chǎng)景為旗幟,以需求為標尺,牽引技術(shù)前進(jìn)的方向。
在具身智能技術(shù)發(fā)展中,視覺(jué)感知是AI與物理世界交互的核心基礎,更是賦能“感知-決策-執行”閉環(huán)的關(guān)鍵支撐。一年前,DINO-X視覺(jué)大模型誕生,以開(kāi)放世界檢驗測試能力,“讓機器看懂物理世界”。
今年IDEA大會(huì )上,DINO-X Grasp發(fā)布,實(shí)現世界開(kāi)集2D認知理解、物體級抓取位姿預測、物體級3D形狀感知,打造“更強”具身大腦。
福田實(shí)驗室:這是由粵港澳大灣區數字化的經(jīng)濟研究院(IDEA)與騰訊合作共建的省級實(shí)驗室,旨在通過(guò)跨領(lǐng)域合作提升研發(fā)技術(shù)能力,聚焦人居環(huán)境具身智能領(lǐng)域的研究。福田實(shí)驗室聯(lián)合騰訊Robotics X實(shí)驗室推出的Tairos具身智能開(kāi)放平臺,是一款以模塊化方式提供大模型、開(kāi)發(fā)工具與數據服務(wù)的具身智能軟件平臺。
國際先進(jìn)的技術(shù)應用推進(jìn)中心(深圳):聚焦人工智能、具身智能、低空經(jīng)濟等重點(diǎn)領(lǐng)域,依托粵港澳大灣區數字化的經(jīng)濟研究院建設的先進(jìn)的技術(shù)應用推廣平臺。
深港高等研究交流中心(SHARE):旨在依托深圳與香港的區位優(yōu)勢和大灣區的優(yōu)質(zhì)科研教育資源,搭建跨學(xué)科科研合作與國際交流平臺。中心聚焦人工智能賦能的前沿科學(xué)問(wèn)題,推動(dòng)其在生物醫藥、材料科學(xué)、低空經(jīng)濟、無(wú)線(xiàn)通信、具身智能等關(guān)鍵領(lǐng)域的應用與突破。
會(huì )上,孵化自IDEA研究院的視覺(jué)大模型企業(yè)視啟未來(lái)還宣布完成近億元天使輪融資,該團隊創(chuàng )始人兼CEO張磊曾任微軟總部及亞洲研究院首席研究員。
低空經(jīng)濟方面,大會(huì )發(fā)布的OpenSILAS 2.0,通過(guò)可進(jìn)化框架解構六大核心技術(shù),依據城市與空域復雜度構建產(chǎn)品矩陣,實(shí)現“規劃—運行—監管—服務(wù)”全環(huán)節管理與全流程服務(wù),以分級化、模塊化提供可落地擴展方案。
回到沈向洋反復提到的智能演進(jìn)曲線(xiàn),今天看到的,不只是一個(gè)個(gè)炫目的模型和 Demo,而是新一輪技術(shù)范式剛剛起步的信號。算力、算法、數據在加速迭代,交互和載體在重塑人機邊界,AI 正從“問(wèn)一句答一句”的工具,走向能與人類(lèi)協(xié)同推理、共創(chuàng )知識的長(cháng)期伙伴。
當被問(wèn)及關(guān)于中美AI發(fā)展的差距時(shí),沈向洋覺(jué)得,AI發(fā)展至少能夠理解為兩個(gè)維度:一條是“攀登珠峰”,以巨額投入追求最強模型;另一條是“修公路”,讓更多人和更多場(chǎng)景用得上AI,讓模型在更大范圍內規?;瘧?,在每件事情上,都要走對自己最合適的發(fā)展之路。
未來(lái),隨技術(shù)迭代與場(chǎng)景深耕的雙向賦能,AI將更深刻地融入千行百業(yè),開(kāi)啟智能社會(huì )的全新階段。
,開(kāi)云體育網(wǎng)頁(yè)入口