云端攜手:AI如何定義下一代智能終端?
然而,當AI走向終端,它所面臨的挑戰(zhàn)遠比想象中復雜。如何平衡成本與體驗?如何保障數(shù)據(jù)安全與隱私?如何讓通用的大模型適應千行百業(yè)的獨特需求?
一個明確的行業(yè)共識是:端側智能的崛起,并非要與云端割裂,而是要構建一種“云端協(xié)同”的智能模式。這種模式不再是簡單的任務分配,而是一種基于場景需求的精密布局,目的是實現(xiàn)體驗、成本與安全的最佳平衡。在實際落地中,這種協(xié)同策略主要由四大核心驅動力決定:
●實時性與安全性。 在機器人、自動駕駛等領域,毫秒級的延遲都可能引發(fā)安全問題。機器人“神經級別的控制”必須在端側完成閉環(huán),僅依賴云端往返通信的風險是不可接受的。這是端側算力不可替代的核心價值,它保證了智能設備在關鍵時刻的可靠性。
●數(shù)據(jù)隱私與合規(guī)。 用戶數(shù)據(jù)的隱私保護至關重要。部分數(shù)據(jù)不適合直接上傳云端,本地化處理成為必然選擇。這意味著必須在端側部署足夠強大的模型來處理敏感信息。
●成本與效率的平衡。 將高頻、相對簡單的任務放在端側,可以極大降低云端推理成本;而對于知識問答、復雜邏輯推理、模型迭代升級等“重活”,則交由算力更充沛、效率更高的云端來完成。這種精細化的分工,是實現(xiàn)規(guī)模化商業(yè)部署的關鍵。
●全局協(xié)同與優(yōu)化。云端更像是是一個協(xié)同與管理平臺。它將分散的終端設備整合為一個有機整體,通過全局視角確保系統(tǒng)的最優(yōu)運行,通過集群調度實現(xiàn)“1+1>2”的協(xié)同效應,從而解決了大規(guī)模設備部署的管理難題。
打造體驗卓越的智能終端,是一項復雜的系統(tǒng)工程,遠非單一企業(yè)能夠獨立完成。硬件、云平臺、算法、數(shù)據(jù),產業(yè)鏈的每一個環(huán)節(jié)都不可或缺。一個開放、協(xié)作的生態(tài)系統(tǒng),成為推動行業(yè)前行的共識。
在這個生態(tài)中,角色分工明確:硬件廠商提供物理載體,算法公司專注于核心模型的研發(fā)與優(yōu)化,而像阿里云這樣擁有全棧AI云能力的平臺,則扮演著“智能基石”的角色。提供的不僅是模型本身,更是一整套從底層算力、數(shù)據(jù)處理、模型訓練與部署到應用開發(fā)的“全棧式”服務。這使得創(chuàng)新者可以將精力聚焦于自身最擅長的領域——無論是對用戶需求的洞察,還是對人機交互的理解,從而加速產品的研發(fā)與迭代。
以下為36氪研究院院長鄒萍與視源股份未來教育集團(希沃)副總裁黃柏林、銀河通用聯(lián)合創(chuàng)始人張直政、心言集團具身智能資深算法工程師顏鑫、阿里云智能集團通義大模型解決方案總監(jiān)鄭海超的對話內容,經36氪編輯整理:
01.端側智能落地的路徑選擇和方法論
36氪:有的企業(yè)選擇在端側部署小模型,也有選擇通過云端調用的方式給用戶提供服務,各位是怎么選擇自己的技術發(fā)展路徑的?
黃柏林:首先應該回到客戶的需求。希沃是一個教育品牌,做的是教育信息化。我們比較有代表性的是一款叫希沃學習機的產品,不同年齡層次的孩子的需求是不一樣的,大模型在端側還是云側,我們考量更多的是能否匹配孩子在那個年齡段的需求。
我們現(xiàn)在選擇的技術路徑是端+云的方式。比如圖像識別這種傳統(tǒng)模型可以解決的問題,我們就放在端側,相對復雜的非標準的問題放到云端,最終還是服務于客戶需求。
張直政:大模型對具身智能這個領域帶來的改變是讓機器人有一個聰明的大腦,銀河通用希望構建由大模型驅動的機器人。
傳統(tǒng)的機器人運動控制是靠硬編程,這就意味著要把它的動作寫死,比較關心重復定位精度。有了大模型以后,它最大的意義就是我們可以直接以任務的成功率為導向來構建機器人的大腦。
那有一個聰明的大腦意味著什么?第一意味著機器人的泛化能力有質的飛躍,第二它不是一個單點替代的關系,會引起整個協(xié)作關系和交互方式的重構,第三點在于大模型把數(shù)據(jù)、模型、算力整個閉環(huán)打通,當我們把具身智能大模型投入到具體的場景里面去,它可以自我學習、自我迭代,形成一個完整的解決方案,然后給千家萬戶、千行百業(yè)賦能,最終形成生產力。
顏鑫:心言集團主要在做的機器人是以情感智能為核心的情感陪伴機器人。
我們采用了云邊端結合的策略,在端側機器人通過模型的方式去感知多模態(tài)的、非結構化的數(shù)據(jù),需要去提供實時性、魯棒性、安全性的支撐和服務。在云端的時候,更多的還是會采用更大參數(shù)的模型去提供更多的規(guī)劃,更多的決策能力。
36氪:阿里云作為一個賦能千行百業(yè)的數(shù)字化平臺,為了應對這些分散在各個行業(yè)中的點狀問題,能否總結出來一些業(yè)務落地的方法論?
鄭海超:我覺得從更廣泛的視角來看,最終還是要看企業(yè)真正場景的落地和整個商業(yè)價值的閉環(huán)。落地的時候是三個結合——
第一就是大模型跟小模型的一個結合。為了完成一個完整的業(yè)務,有可能需要端上部署一些小的模型,如果發(fā)現(xiàn)需要更大尺寸的模型才能得出一個非常好的結果,那還是要到云上去。
第二個是云和端結合,比如說語音場景對時延更敏感,需要做一些前置的處理,還有一些安全跟隱私相關的數(shù)據(jù),用戶更希望把這些東西放到端上。
第三個是生成式大模型跟判別式的模型結合。做業(yè)務不一定都要用模型的方式,其實還可以寫規(guī)則,如果很簡單的一個事命中了規(guī)則直接就走掉了,不需要過大模型。因為大模型肯定會帶來時間跟成本的上升,并且端上的算力相對有限。所以說從真正業(yè)務落地的角度來講,我們認為關鍵還是這三個結合。
02.端側AI規(guī)模化落地的技術攻堅
36氪:銀河通用從初期探索到規(guī)?;涞?,在模型的輕量化、算力的適配和推理優(yōu)化等環(huán)節(jié)當中,具體遇到過哪些技術卡點,探索出哪些解決方案?
張直政:銀河通用希望把最前沿的具身智能大模型,推廣到不同的場景里面去。
比如說工業(yè)場景非常注重隱私,也非常注重干活的節(jié)拍和效率,所以神經級別的控制需要放在端側。在多樣化場景和需求背后統(tǒng)一的思考什么呢?第一跟安全性相關的行為,第二是時延的問題,第三是數(shù)據(jù)的隱私性,例如涉及到用戶隱私的數(shù)據(jù)只能放在端側去處理,不能放在云端。
那把什么放在云端呢?第一我們把學習的過程盡可能放在云端,因為云端的算力更加充沛,學習效率更高;第二是對延遲要求比較低,但對復雜性要求比較高的情況,比如說我們讓機器人去解一個被纏繞的線束。
36氪:從軟件到硬件,用戶對于智能的要求是不一樣的,心言的 AI 陪伴機器人要能夠在復雜的、非結構化的環(huán)境當中去運行,是怎么去做算法設計的,以及模型部署會有哪些挑戰(zhàn)?
顏鑫:家庭場景是一個非常復雜的開放式環(huán)境,里面的數(shù)據(jù)結構是非結構化的、多模態(tài)的,能否通過多模態(tài)模型的方式去獲取到這些數(shù)據(jù),從這些數(shù)據(jù)當中抽離出情感信息,這在算法中是有非常大的挑戰(zhàn)。
得益于阿里云,有Qwen2.5-Omni這樣的多模態(tài)模型,以及測測在過去十余年當中積累的豐富的多模態(tài)數(shù)據(jù),我們在這個方向上做了很多的探索,這里面會要求模型的穩(wěn)定量化。
機器人一定是要有一個實時的、穩(wěn)定的、安全的運行,我們會把整個流程分層為三個部分:感知、規(guī)劃和決策。決策和規(guī)劃是由云端的模型來提供,要求云端的模型有非常強大的 Reasoning 的能力和 Agent 能力。那么在家庭陪伴的機器人當中,因為隱私、安全和實時性,就導致在做感知的時候,模型是需要放在端側的。
36氪:希沃能否跟我們分享一個較為成功的云端協(xié)同的 AI 應用,給老師、給學生分別帶來了哪些體驗上的改變?
黃柏林:比較典型的就是關于如何評價一節(jié)課上得好和不好。因為教室是一個典型的人很固定、任務也很確定,但是發(fā)生什么極其復雜的場景。
對于大模型的挑戰(zhàn)就在于如何響應這種情況。我們是兩年前開始投入一個項目研發(fā),先把任務切成了 8 個,然后分段上傳到云端大模型,回來之后拼裝成一份完整的報告。最后輸出到老師和學生手里的時候還要時效性,我們做到的是 5 分鐘就能拿到一節(jié)課的評價的報告。
這個背后的挑戰(zhàn)一個就是評價本身要公允,會涉及到比較專業(yè)的教學評價方法,同時還要兼顧時效性,就涉及到把復雜任務前置,一邊錄制一邊處理,下課 5 分鐘就能生成,我們大概會把一個 7B 的模型放在本地,同時搭配通義千問進行意圖識別,從而實現(xiàn)較好的效果。
36氪:為了應對不同行業(yè)特征下的非通用性需求,阿里云能夠提供哪些標準化的工具或解決方案呢?
鄭海超:首先通義作為阿里巴巴自研的開源基礎大模型,率先實現(xiàn) “全尺寸、全模態(tài)、多場景” 開源,包含文本、圖像、視頻、語音、編碼等多種模態(tài),在每一個模態(tài)又給大家提供了不同的規(guī)格的模型服務。其次,為了大家更好地做業(yè)務,我們提供了完整的訓練環(huán)境,大模型服務平臺百煉允許大家去利用各種各樣的基礎模型上傳自己的數(shù)據(jù),并且可以結合通義模型家族的數(shù)據(jù)來做混合的訓練,再進行模型的部署和推理。最后,如果大家還有特定的需求,可能需要我們雙方做更進一步的定制化,基于阿里云定制化的工具平臺,幫助大家做一個獨屬于自己的定制化模型。
03.全棧AI能力打造共贏生態(tài)
36氪:阿里云接下來會采取哪些措施來回應各個行業(yè)的需求,以及推動開源開放和行業(yè)共建?
鄭海超:阿里云會在多個層次上來跟大家一起合作。
在基礎設施層,阿里云部署遍布全球的基礎設施,為模型訓練及推理服務流程提供穩(wěn)定且經濟的算力基座;在數(shù)據(jù)與模型服務平臺層,通過人工智能平臺PAI圍繞“數(shù)據(jù)-訓練-推理-AI應用”的全生命周期,為客戶提供高效、低成本的模型服務技術支撐;在模型層持續(xù)推進模型架構升級與模型能力進化,打造全尺寸、全模態(tài)的開源模型家族;在應用與解決方案層打造多模態(tài)交互的開發(fā)套件,以“多模態(tài)交互”與“智能助手”為核心組成,提供 60%–80% 的通用能力基座,支持終端廠商在差異化場景下快速完成二次開發(fā)與產品化。
值得一提的是,通義多模態(tài)交互開發(fā)套件已經在端側場景廣泛落地,為終端設備注入「聽懂、看懂、會思考」的能力。其通過自然對話、多模態(tài)感知與實時交互,讓萬物成為用戶的感知延伸與生活助手。該套件提供端側SDK與算法增強,支持VAD、回聲消除等本地處理,顯著降低延遲與功耗,并具備廣泛的硬件與系統(tǒng)兼容性(Android、iOS、Linux、RTOS)。通過可視化配置界面,開發(fā)者可無代碼管理模型、提示詞、知識庫與Agent流程,快速部署測試。同時支持調用大模型服務平臺百煉上的模型,并可自定義Agent、插件及第三方協(xié)議接入,構建靈活可擴展的多模態(tài)開發(fā)生態(tài)。
在服務千行百業(yè)的過程中,阿里云已經沉淀并開放服務頭部客戶過程中形成的行業(yè) Know-How 與最佳實踐,形成端云協(xié)同的可復制范式,加速 AI 能力在全行業(yè)的規(guī)?;涞?。
更多精彩內容,可點擊觀看完整直播回放:
https://36kr.com/live/3443623793972869
更多關于AI價值落地的探討,會在2025云棲大會現(xiàn)場精彩呈現(xiàn)。敬請關注9月24日下午云棲大會【36氪先鋒AI硬件分論壇】與【通義多模態(tài)交互技術分論壇】。
歡迎點擊鏈接領取門票,直通云棲大會,現(xiàn)場見證智能硬件的“智變時刻”。
https://yunqi.aliyun.com/2025/ticket?activityId=NTQ1Ng==&ticketId=MTMy&channelId=MzY3OA==
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
新一輪的人工智能浪潮,正從云端涌向我們身邊的每一塊屏幕、每一個設備。從AI PC、AI手機到形態(tài)各異的智能機...瀏覽全文>>
-
【哪些歌值得單曲循環(huán)聽】在音樂的世界里,有些歌曲因其旋律、歌詞或情感共鳴而被反復聆聽。這些“值得單曲循...瀏覽全文>>
-
【哪些高校有消防專業(yè)】在當前社會對公共安全和應急管理重視程度不斷提高的背景下,消防專業(yè)的教育也逐漸受到...瀏覽全文>>
-
【哪些費用屬于辦公費用】在企業(yè)日常運營中,辦公費用是不可或缺的一部分。合理歸類和管理這些費用,有助于提...瀏覽全文>>
-
【哪款天氣預報軟件最好用】在日常生活中,天氣預報軟件已經成為我們出行、穿衣、安排活動的重要參考工具。隨...瀏覽全文>>
-
【哪款輸入法最好用啊】在如今的智能手機時代,輸入法已經成為我們日常生活中不可或缺的工具。無論是聊天、寫...瀏覽全文>>
-
【暮白首的配音演員是誰】《暮白首》是一部近年來備受關注的古裝劇,憑借精美的畫面和扣人心弦的劇情吸引了大...瀏覽全文>>
-
【慕字如何組詞】“慕”是一個常見的漢字,讀音為mù,表示欽佩、向往、愛慕等意思。在日常生活中,“慕”字常...瀏覽全文>>
-
【慕字的意思】“慕”是一個常見的漢字,其含義豐富,在不同的語境中有不同的解釋。本文將從字義、詞性、用法...瀏覽全文>>
-
【目的相關詞語有哪些】在日常寫作、學術研究或語言表達中,“目的”是一個非常常見的概念,常用于描述行為、...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當你看到T-Mobile用戶贏得手機手表和耳機時你會羨慕不已
- Ubuntu24.10OracularOriole推出最新內核工具鏈GNOME47和增強的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強大的159美元UBoomX便攜式揚聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機型扭轉了之前的趨勢
- Waze迎來魔獸世界改版
- SquareEnix將心愛的RPG移植到MetaQuest3
- 蘋果正在設計全新操作系統(tǒng)瞄準新類別的產品
- 小米RedmiA27U顯示器采用4K面板和90WUSBC端口
- 蘋果將為iPhone17系列采用新電池技術
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機其價格低于摩托羅拉Razr2024
- OnePlus13型號 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運動相機競爭對手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無線控制器系列2通過Xbox設計實驗室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價更高
- 谷歌終止PixelBuds的點擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對AppleIntelligence功能的評價從一般到還可以
- GalaxyS25Plus看起來很時髦但三星是否選擇像iPhone一樣的通用設計
- 優(yōu)質48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價同時贈送100美元Xbox禮品卡和1年保護計劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價格
- Valve出售部分SteamDeck型號-GBLCD型號售價296.65美元512GBLCD型號售價336.75美元
- Beats在其產品線中增加了手機保護殼推出適用于iPhone16系列的MagSafe保護殼
- 三星在IFA2024上展示AI產品
- 新的AIPlaygroundDesign工具你可以簡單地與之交談就像ChatGPT一樣
- 極簡主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預訂