AI Agent涌向移動(dòng)終端,手機(jī)智能體勢(shì)不可擋
還沒(méi)搞清楚什么是AI Agent,手機(jī)Agent就已經(jīng)橫空出世
AIGC為何涌向移動(dòng)端?背后有哪些邏輯?什么是手機(jī)智能體?一文看明白
科技大廠、手機(jī)廠商、企服領(lǐng)域都在發(fā)力,手機(jī)智能體成AI Agent新趨勢(shì)
AI Agent迎來(lái)移動(dòng)端大爆發(fā),手機(jī)智能體將成企業(yè)AIGC新標(biāo)配
AI Agent移動(dòng)應(yīng)用大升級(jí),手機(jī)智能體開(kāi)啟跨端跨應(yīng)用業(yè)務(wù)連接新場(chǎng)景
文/王吉偉
春節(jié)期間OpenAI推出的AI視頻模型Sora火出天際,到處都是文生視頻模型如何厲害如何改變真實(shí)世界的信息,以至于OpenAI在AI Agent方面的最新動(dòng)向都被掩蓋了。
春節(jié)前的2月8日,科技媒體The Information報(bào)道OpenAI正開(kāi)發(fā)兩款革命性的Agent軟件,其中一款能夠有效接管客戶(hù)的設(shè)備來(lái)自動(dòng)執(zhí)行復(fù)雜的任務(wù)。
據(jù)說(shuō),這個(gè)Agent能夠自動(dòng)執(zhí)行點(diǎn)擊、光標(biāo)移動(dòng)、文本輸入等操作,與人類(lèi)操作軟件無(wú)異。例如,把文檔中的數(shù)據(jù)傳輸?shù)诫娮颖砀裰羞M(jìn)行分析,或者自動(dòng)填寫(xiě)費(fèi)用報(bào)告并將其輸入會(huì)計(jì)軟件,或者根據(jù)一定的預(yù)算制定行程或預(yù)訂機(jī)票。
這個(gè)能夠直接操縱個(gè)人電腦自動(dòng)完成各種任務(wù)的智能體,現(xiàn)在被更多媒體稱(chēng)作AI Agent 2.0。
這些報(bào)道沒(méi)有具體說(shuō)明這款A(yù)gent所接管的設(shè)備是PC還是手機(jī),不過(guò)ChatGPT有移動(dòng)端,能夠在手機(jī)或者平板上調(diào)用這個(gè)Agent是遲早的事。
想要在移動(dòng)端構(gòu)建AI Agent的大語(yǔ)言模型(LLM,Large Language Models)廠商,遠(yuǎn)不止OpenAI這一家。
去年12月,騰訊與德州大學(xué)達(dá)拉斯分校合作推出了一個(gè)名為AppAgent的項(xiàng)目。該項(xiàng)目可以通過(guò)自主學(xué)習(xí)和模仿人類(lèi)的點(diǎn)擊和滑動(dòng)手勢(shì),在手機(jī)上執(zhí)行各種任務(wù)。
項(xiàng)目地址:
https://github.com/mnotgod96/AppAgent
論文地址:
https://arxiv.org/abs/2312.13771
包括在社交媒體上發(fā)帖、幫助用戶(hù)撰寫(xiě)和發(fā)送郵件、使用地圖、在線購(gòu)物,甚至進(jìn)行復(fù)雜的圖像編輯。AppAgent在50個(gè)任務(wù)上進(jìn)行了廣泛測(cè)試,涵蓋了10種不同的應(yīng)用程序。
2月初,阿里巴巴與北京交通大學(xué)聯(lián)合推出了一款全新的手機(jī)操作智能體框架Mobile-Agent。該框架的核心優(yōu)勢(shì)在于其純視覺(jué)解決方案。傳統(tǒng)的手機(jī)操作方式往往需要依賴(lài)XML等標(biāo)記語(yǔ)言以及系統(tǒng)元數(shù)據(jù),而Mobile-Agent則完全摒棄了這些需求。
項(xiàng)目地址:
https://github.com/X-PLUG/MobileAgent
論文地址:
https://arxiv.org/abs/2401.16158v1
這意味著,用戶(hù)無(wú)需進(jìn)行復(fù)雜的設(shè)置或修改,只需通過(guò)直觀的視覺(jué)指示即可完成操作。
除了科技大廠,LLM創(chuàng)業(yè)團(tuán)隊(duì)也推出了相應(yīng)的Agent項(xiàng)目。比如在去年12月,清華&智譜AI團(tuán)隊(duì)推出的CogAgent-Chat。CogAgent是一個(gè)基于180億參數(shù)規(guī)模的視覺(jué)語(yǔ)言模型(VLM)的圖形用戶(hù)界面(GUI)智能體,專(zhuān)注于GUI圖形交互界面的理解和導(dǎo)航。
CogAgent使用屏幕截圖作為輸入,在PC和Android GUI導(dǎo)航任務(wù)上超越了基于語(yǔ)言模型的方法,如Mind2Web和AITW,引領(lǐng)了GUI理解領(lǐng)域的最新技術(shù)發(fā)展。
論文:
https://arxiv.org/abs/2312.08914
代碼:
https://github.com/THUDM/CogVLM
Demo:http://36.103.203.44:7861/
如今的大語(yǔ)言模型在具體應(yīng)用方面都是多端通用,MAS和SaaS模式使得LLM廠商推出的AI Agent構(gòu)建平臺(tái)及個(gè)體能夠應(yīng)用于手機(jī)端也是必然。
AI智能體涌向移動(dòng)端,已經(jīng)成為AIGC行業(yè)發(fā)展的必然趨勢(shì)。
(注:回復(fù) 手機(jī)Agent 獲取本文提到的所有研報(bào)資源。)
AI Agent趨勢(shì):涌向移動(dòng)端
系統(tǒng)廠商與終端廠商的步子,甚至比大模型廠商邁得還要大。畢竟他們更貼近用戶(hù),了解市場(chǎng)需要什么,也知道自己在哪里突破。
這些廠商對(duì)于AI Agent的探索比我們預(yù)想得要早很多,且已經(jīng)拿出初步成果。
也是在春節(jié)前夕,微軟推出了名為UFO的Windows Agent。這是一款用于構(gòu)建用戶(hù)界面(UI)交互智能體的 Agent 框架,能夠快速理解和執(zhí)行用戶(hù)的自然語(yǔ)言請(qǐng)求。
項(xiàng)目地址:
https://github.com/microsoft/UFO
技術(shù)報(bào)告:
https://arxiv.org/abs/2402.07939
UFO可以在Windows內(nèi)自主回答用戶(hù)查詢(xún),可在單個(gè)或者跨多個(gè)App中無(wú)縫導(dǎo)航和操作來(lái)滿足Windows 操作系統(tǒng)上的用戶(hù)請(qǐng)求。可以更加智能地理解用戶(hù)的意圖,不用人工干預(yù),自動(dòng)執(zhí)行相應(yīng)的操作。
如果你想從一份Word文檔中提取文本、對(duì)照片應(yīng)用程序中的圖像進(jìn)行觀察、以及總結(jié) PowerPoint中的內(nèi)容,利用所有這些信息撰寫(xiě)一封深度的電子郵件內(nèi)容并完全自主發(fā)送時(shí),你只需要借助一個(gè)UFO框架就可以完成。
這意味著,以前需要大量手動(dòng)工作的跨應(yīng)用程序工作流程,現(xiàn)在可以直接簡(jiǎn)化為針對(duì) UFO 的簡(jiǎn)單自然語(yǔ)言指令。
UFO,或許會(huì)成為下一代Windows系統(tǒng)的核心。以后搭載windows系統(tǒng)的筆記本電腦等移動(dòng)終端,將會(huì)因UFO而開(kāi)啟全新用戶(hù)體驗(yàn)。
重點(diǎn)在于,其他系統(tǒng)也會(huì)效仿Windows,AI Agent將會(huì)成為各個(gè)系統(tǒng)的標(biāo)配。
把LLM以及AI Agent裝入PC或者移動(dòng)終端,硬件廠商將其稱(chēng)作AI PC或者AI 手機(jī)。
自從LLM能夠在端側(cè)部署之后,硬件廠商們就開(kāi)啟了狂飆模式,而LLM的落地應(yīng)用主要途徑的AI Agent模式也首先進(jìn)入其法眼。
在2024 CES上,聯(lián)想首次提出“智能終端AI OS”,即在AI技術(shù)驅(qū)動(dòng)下,智能終端將內(nèi)嵌個(gè)人Agent(智能體)、個(gè)人大模型、本地知識(shí)庫(kù)、應(yīng)用接口,形成下一代AI OS。并認(rèn)為,AI技術(shù)的突破將在PC、手機(jī)、AIoT等所有智能終端產(chǎn)品領(lǐng)域掀起第三次技術(shù)革命浪潮,重塑終端體驗(yàn)及產(chǎn)業(yè)生態(tài)。
據(jù)悉,聯(lián)想個(gè)人Agent或?qū)⒃?月份與用戶(hù)見(jiàn)面。
面對(duì)新生代AI硬件設(shè)備AI pin和Rabbit R1 所展現(xiàn)的“準(zhǔn)AI Agent”屬性,手機(jī)廠商們?cè)缫呀?jīng)坐不住,強(qiáng)勢(shì)展開(kāi)了對(duì)AI智能體的角逐。
1月份,小米、華為、vivo、理想等幾家公司聯(lián)合清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)共同發(fā)布了一篇個(gè)人LLM智能體綜述論文(也是一個(gè)標(biāo)準(zhǔn)),該論文梳理了個(gè)人LLM智能體所需的能力、效率和安全問(wèn)題,收集并整理了領(lǐng)域?qū)<业囊?jiàn)解,還開(kāi)創(chuàng)性地提出了個(gè)人LLM智能體的5級(jí)(L1—L5)智能水平分級(jí)法。
論文地址:
https://arxiv.org/abs/2401.05459
文獻(xiàn)庫(kù):
https://github.com/MobileLLM/Personal_LLM_Agents_Survey
今后各家的智能體處于什么水平,參照這個(gè)標(biāo)準(zhǔn)便會(huì)一目了然,也為移動(dòng)終端的Agent構(gòu)建提供了更多參考方向。當(dāng)然,這個(gè)標(biāo)準(zhǔn)的推出也意味著廠商們對(duì)于移動(dòng)終端智能體的積極探索與更大的市場(chǎng)需求。
OPPO等推出的AI手機(jī),用戶(hù)實(shí)測(cè)后的感觸是越來(lái)越像Agent,至少已經(jīng)能夠達(dá)到上述標(biāo)準(zhǔn)的L2級(jí)。
OPPO與IDC在聯(lián)合發(fā)布的《AI手機(jī)白皮書(shū)》中,還給AI手機(jī)下了一個(gè)明確的定義。
OPPO還公布1+N智能體生態(tài)戰(zhàn)略,核心包括OPPO AI超級(jí)智能體和AI Pro智能體開(kāi)發(fā)平臺(tái)。
其中1指的是AI手機(jī)的智能OS,扮演AI時(shí)代操作系統(tǒng)的角色,具備傳統(tǒng)智能手機(jī)不支持的自學(xué)習(xí)感知能力、長(zhǎng)期記憶能力和工具調(diào)用能力。它可以與用戶(hù)專(zhuān)屬的智能體、第三方智能體的交互和信息統(tǒng)籌。N指的就是前面所述的用戶(hù)智能體和第三方智能體等構(gòu)成的全新智能體生態(tài)。
理想汽車(chē)參與這份標(biāo)準(zhǔn)的研究,則映射的是AI Agent適配人車(chē)交互場(chǎng)景的廣闊市場(chǎng)。國(guó)盛證券在一篇報(bào)告中指出,AI Agent面向復(fù)雜任務(wù)處理,充分適合人車(chē)交互場(chǎng)景,是數(shù)字人的核心演進(jìn)方向。
座艙智能化時(shí)代,用戶(hù)在駕乘中會(huì)有各種個(gè)性化需求,數(shù)字人被賦予更多的施展能力的空間,其使命是通過(guò)AI Agent實(shí)現(xiàn)AGI向汽車(chē)座艙滲透,實(shí)現(xiàn)三屏互動(dòng)(手機(jī)屏、車(chē)載屏和家用屏)。
而Meta與雷朋合作推出的第二代智能眼鏡,接入多模態(tài)AI后,也開(kāi)始向AI Agent”靠攏。不必再為不同任務(wù)選用不同應(yīng)用程序,只需用日常用語(yǔ)告訴設(shè)備需求,眼鏡就能基于軟件獲取的信息,為用戶(hù)作出量身回應(yīng)。
企服的爆發(fā):Agent漸成標(biāo)配
科技巨頭公司及企業(yè)服務(wù)廠商,也早在AI Agent移動(dòng)終端的應(yīng)用方面下足了功夫。
字節(jié)跳動(dòng)在2月初正式推出了「Coze 扣子」AI Bot 開(kāi)發(fā)平臺(tái)。任何用戶(hù)都可以快速、低門(mén)檻地搭建自己的 Chatbot,且平臺(tái)支持用戶(hù)將其一鍵發(fā)布到飛書(shū)、微信公眾號(hào)、豆包等渠道。
除了可以創(chuàng)建自己的Chatbot,Coze官方還提供了Bots 商店和插件。插件的使用,可以讓用戶(hù)構(gòu)建的機(jī)器人更加強(qiáng)大。
通過(guò)Coze構(gòu)建的機(jī)器人,與OpenAI的GPTs類(lèi)似,主要用于交互并能夠?qū)崿F(xiàn)一定的業(yè)務(wù)流程操作,可以算是初級(jí)智能體。
其更早推出的豆包,也是一個(gè)構(gòu)建智能體的平臺(tái)。
釘釘在1月發(fā)布的釘釘7.5版本,也是全量上線AI Agent產(chǎn)品“AI助理”。釘釘平臺(tái)上的Agent,能夠通過(guò)釘釘內(nèi)的企業(yè)協(xié)同場(chǎng)景,迅速將AI Agent用起來(lái),積累數(shù)據(jù)。這個(gè)助理?yè)碛姓嬲膱?zhí)行能力,并非停留在和用戶(hù)的交互層面,可以進(jìn)行信息摘要、寫(xiě)工作總結(jié)、寫(xiě)文檔等通用的辦公工作。
用友發(fā)布的YonGPT,也能通過(guò)上下文記憶、知識(shí)/庫(kù)表索引、Prompt工程、Agent執(zhí)行、通用工具集等擴(kuò)充大模型的存儲(chǔ)記憶、適配應(yīng)用和調(diào)度執(zhí)行能力,再結(jié)合財(cái)稅、人力、供應(yīng)鏈、研發(fā)等領(lǐng)域的知識(shí)和最佳實(shí)踐擴(kuò)充大模型專(zhuān)業(yè)能力,從而形成體系化的企業(yè)服務(wù)大模型。
以上這些平臺(tái)的Agent,憑借SaaS屬性,都可以在手機(jī)端絲滑使用。
除了以上公司,一些創(chuàng)業(yè)公司以及專(zhuān)注超自動(dòng)化的廠商,也陸續(xù)推出了能夠應(yīng)用于移動(dòng)端的Agent產(chǎn)品。
比如實(shí)在智能也推出了手機(jī)Agent智能體,只需一句話直接傳達(dá)自己的意圖,就可以幫你操作所有電腦、手機(jī)的軟件完成各類(lèi)工作和生活的目標(biāo)任務(wù),通過(guò)自主學(xué)習(xí)和模仿人類(lèi)的點(diǎn)擊和滑動(dòng)手勢(shì),可以在手機(jī)上操作App執(zhí)行各種任務(wù)。
背后的邏輯:發(fā)展趨勢(shì)使然
在很多人還沒(méi)有弄懂什么是AI Agent的時(shí)候,大部分人以為Agent更適合在PC端執(zhí)行各種任務(wù)的時(shí)候,廠商們已經(jīng)在悄然布局AI Agent在移動(dòng)端的應(yīng)用了。
王吉偉頻道認(rèn)為,廠商們之所以急于將AI Agent拓展至移動(dòng)端,大概有以下幾點(diǎn)原因:
用戶(hù)需求:隨著技術(shù)的發(fā)展,用戶(hù)對(duì)智能手機(jī)和設(shè)備的期望越來(lái)越高,他們希望設(shè)備不僅僅是工具,還能成為日常生活的助手。Agent能夠理解用戶(hù)的需要,并為他們提供個(gè)性化服務(wù),改善用戶(hù)體驗(yàn)。
增強(qiáng)粘性:通過(guò)提供Agent服務(wù),可以讓用戶(hù)更頻繁地與設(shè)備互動(dòng),增加用戶(hù)對(duì)品牌的忠誠(chéng)度和設(shè)備的使用頻率。
競(jìng)爭(zhēng)優(yōu)勢(shì):隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,廠商需要不斷創(chuàng)新以保持競(jìng)爭(zhēng)力,集成先進(jìn)的Agent技術(shù)可以作為賣(mài)點(diǎn),吸引消費(fèi)者購(gòu)買(mǎi)。
商業(yè)模式創(chuàng)新:AI Agent可以開(kāi)辟新的收入渠道和商業(yè)模式,比如通過(guò)智能推薦系統(tǒng)促進(jìn)銷(xiāo)售,或者通過(guò)訂閱服務(wù)提供高級(jí)功能。
開(kāi)拓新的收入流:智能Agent往往能夠與其他服務(wù)或產(chǎn)品相結(jié)合,為廠商創(chuàng)造新的收入渠道,如智能家居控制、電子商務(wù)購(gòu)物、內(nèi)容訂閱等。
提高工作效率:在企業(yè)服務(wù)領(lǐng)域,AI Agent可以幫助員工處理日常任務(wù),提高工作效率,減少重復(fù)勞動(dòng),讓員工有更多時(shí)間專(zhuān)注于更有價(jià)值的工作。
客戶(hù)服務(wù)改善:AI Agent可以提供24/7的客戶(hù)服務(wù),不僅提高了響應(yīng)速度,還能夠處理大量的客戶(hù)咨詢(xún),提升客戶(hù)滿意度。
除了以上幾點(diǎn)原因,還有重要的一點(diǎn)便在于AI Agent行業(yè)發(fā)展趨勢(shì)。
畢竟,按照比爾蓋茨的觀點(diǎn),AI Agent將徹底改變?nèi)藗兙€下和線上的生活方式,改變每個(gè)人與計(jì)算機(jī)的互動(dòng)方式,還將顛覆軟件行業(yè)。
就智能手機(jī)而言,Gartner在相關(guān)報(bào)告中的觀點(diǎn)認(rèn)為,生成式AI智能手機(jī)配備了硬件和軟件功能,能夠無(wú)縫集成和高效執(zhí)行智能手機(jī)上的Gen AI驅(qū)動(dòng)功能和應(yīng)用程序。它們能夠在本地運(yùn)行基礎(chǔ)或微調(diào)的人工智能模型,產(chǎn)生新的衍生版本的內(nèi)容、策略、設(shè)計(jì)和方法。
無(wú)疑,這對(duì)于提升用戶(hù)體驗(yàn)以及使用手機(jī)提升生產(chǎn)力有著莫大的幫助。
Forrester在相關(guān)報(bào)告中給出的兩組預(yù)測(cè)數(shù)據(jù),也很好地說(shuō)明了這個(gè)趨勢(shì)。
到2027年,超過(guò)60%的個(gè)人電腦微處理器將集成設(shè)備上的人工智能功能。隨著設(shè)備上的人工智能成為標(biāo)準(zhǔn)要求,這一比例將從2023年的10%上升。
同時(shí),到2027年,智能手機(jī)中超過(guò)70%的其他應(yīng)用處理器將集成設(shè)備上通用功能,而2023年這一比例為5%,設(shè)備上通用將成為一項(xiàng)標(biāo)準(zhǔn)要求。
處理器集成LLM,將會(huì)極大地拓展AI Agent的存在空間,并會(huì)進(jìn)一步提升用戶(hù)體驗(yàn)。
按照OpenAI CEO奧特曼的說(shuō)法,Open AI的愿景是讓ChatGPT化身“超級(jí)智能工作個(gè)人助理”,為全能的AGI(通用人工智能)鋪路。
顯然,包括GPTs在內(nèi)的AI Agent將會(huì)承載這個(gè)使命,而移動(dòng)端Agent才是變革過(guò)往生產(chǎn)效率的真正開(kāi)始。
手機(jī)智能體:跨端跨應(yīng)用場(chǎng)景開(kāi)啟
前文我們不只一次提到了手機(jī)上的AI智能體。能夠在手機(jī)上應(yīng)用并執(zhí)行各種任務(wù)的Agent,都可以視作手機(jī)Agent\手機(jī)智能體。
而AI手機(jī)本身,也是一個(gè)Agent。在OPPO AI中心產(chǎn)品總監(jiān)張峻看來(lái),AI手機(jī)不僅有底層硬件的需求,也有OS層面AI化和交互體驗(yàn)的革新,它更像是一個(gè)超級(jí)智能體。
手機(jī)智能體不僅是智能助手的升級(jí)版,更是一種新的互動(dòng)方式。它們能夠感知用戶(hù)的需求、自主決策執(zhí)行,甚至學(xué)會(huì)用戶(hù)的習(xí)慣,為用戶(hù)提供更為個(gè)性化的服務(wù)。這種技術(shù)的發(fā)展將為我們帶來(lái)更加智能化、便捷和高效的手機(jī)體驗(yàn)。
與PC端的Agent類(lèi)似,目前的手機(jī)Agent一般分為兩種:一種是被釘釘稱(chēng)作交互式的Agent,主要用于各種文字、圖片等的生成以及各種問(wèn)答;另一種是能夠直接操作部分生態(tài)內(nèi)業(yè)務(wù)應(yīng)用的業(yè)務(wù)類(lèi)Agent。在表現(xiàn)形式上,它們都是軟件機(jī)器人。
但手機(jī)Agent的構(gòu)建并不一定在手機(jī)端,也可以在PC端。
手機(jī)Agent的目的是通過(guò)在手機(jī)上運(yùn)行Agent程序或者軟件去執(zhí)行各種對(duì)于手機(jī)的操作,以完成各種辦公場(chǎng)景中的任務(wù),所以這個(gè)Agent的形態(tài)可能就是一個(gè)應(yīng)用,或者是通過(guò)APP去調(diào)用的某個(gè)打包的可執(zhí)行文件。
事實(shí)上,受限于手機(jī)訪問(wèn)屏障門(mén)檻越發(fā)變高的趨勢(shì),從PC端構(gòu)建AI智能體是目前TO B領(lǐng)域的主流移動(dòng)Agent解決方案。從電腦端觸發(fā)手機(jī)智能體會(huì)有更大的優(yōu)勢(shì),更能滿足B端客戶(hù)移動(dòng)業(yè)務(wù)實(shí)現(xiàn)的需求,并能兼顧用戶(hù)的工作與生活細(xì)節(jié)。
在王吉偉頻道看來(lái),我們?nèi)粘9ぷ髦械拇蟛糠謽I(yè)務(wù)流程會(huì)分散到多端設(shè)備上,構(gòu)建一個(gè)能夠跨終端的Agent去處理跨端、跨軟件、跨部門(mén)的業(yè)務(wù)流程是非常必要的,也是所有企業(yè)及辦公人員的剛需。
手機(jī)智能體最強(qiáng)的能力展現(xiàn)就是調(diào)用手機(jī)端的一切應(yīng)用,一邊滿足企業(yè)用戶(hù)工作+生活并兼顧用戶(hù)在各場(chǎng)景中的便利,另一邊讓個(gè)人用戶(hù)一句話就暢享專(zhuān)屬手機(jī)智能體助理的貼心服務(wù)。
此外,由企業(yè)服務(wù)廠商推出的企業(yè)級(jí)手機(jī)Agent能夠做到足夠的安全級(jí)別,不用擔(dān)心隱私數(shù)據(jù)泄露等安全隱患。
以實(shí)在智能推出“手機(jī)+Agent”結(jié)合的手機(jī)智能體為例,它可以打破手機(jī)App的界限,跨應(yīng)用操作任何手機(jī)軟件完成任務(wù)。
手機(jī)Agent能夠通過(guò)模仿人類(lèi)的直觀動(dòng)作來(lái)與手機(jī)應(yīng)用程序交互,就像一個(gè)真人用戶(hù)一樣,可以查詢(xún)天氣訂機(jī)票、預(yù)約餐廳訂位、進(jìn)行在線購(gòu)物、編輯圖片或制作視頻,也可以操作辦公軟件發(fā)送郵件、采集業(yè)務(wù)數(shù)據(jù)和處理表格、提交工作流程審批單等等,只需一個(gè)指令,手機(jī)Agent智能體在瞬息間即可幫你完成。
例如,春節(jié)開(kāi)工期間,您正忙于工作,無(wú)暇分身向客戶(hù)發(fā)送開(kāi)工問(wèn)候,類(lèi)似于此的重復(fù)性工作,在手機(jī)智能體的幫助下就可以自動(dòng)完成,只需對(duì)手機(jī)說(shuō)出“向標(biāo)簽為客戶(hù)的好友發(fā)送開(kāi)工問(wèn)候”的需求,它就可以識(shí)別您的微信標(biāo)簽備注,向該標(biāo)簽下所有客戶(hù)發(fā)送專(zhuān)屬問(wèn)候語(yǔ),成為你的手機(jī)辦公助理。
與傳統(tǒng)的Siri等智能語(yǔ)言助手不同的是,這個(gè)手機(jī)智能體不是簡(jiǎn)單的命令執(zhí)行者,而是規(guī)劃、決策和執(zhí)行的多面手,通過(guò)ISSUT(智能屏幕語(yǔ)義理解技術(shù))視覺(jué)能力進(jìn)行整個(gè)操縱過(guò)程,無(wú)侵入接口,也不需要系統(tǒng)后臺(tái)訪問(wèn)用戶(hù)的隱私、敏感數(shù)據(jù)來(lái)實(shí)現(xiàn)操作。
此外,PC智能體已經(jīng)生成的業(yè)務(wù)流程跟蹤,也已經(jīng)在手機(jī)端實(shí)現(xiàn)。比如,企業(yè)的高管通過(guò)手機(jī)智能體就可以輕松獲取當(dāng)日最新控制臺(tái)業(yè)務(wù)分析數(shù)據(jù),掌握第一手業(yè)務(wù)動(dòng)態(tài),及時(shí)將需要關(guān)注的動(dòng)態(tài)發(fā)送給技術(shù)或支持人員等,提高工作的靈活性和信息反饋效率。
這個(gè)邏輯,是用手機(jī)去控制PC端智能體去執(zhí)行相關(guān)的業(yè)務(wù)操作,這種跨系統(tǒng)、跨終端的連接型操作是基于手機(jī)Agent平臺(tái)構(gòu)建的Agent所無(wú)法實(shí)現(xiàn)的。
這也意味著,在B端的具體業(yè)務(wù)應(yīng)用上,AI Agent已經(jīng)完成從原來(lái)的 “你說(shuō),PC做”到“你說(shuō),手機(jī)做”的跨越,并實(shí)現(xiàn)了“你說(shuō),PC+手機(jī)一起做”。
短短幾個(gè)月時(shí)間,AI Agent就已經(jīng)涌向移動(dòng)終端,手機(jī)智能體實(shí)現(xiàn)了跨端跨應(yīng)用、場(chǎng)景聯(lián)動(dòng)。國(guó)產(chǎn)廠商對(duì)于AI Agent的應(yīng)用探索,一直處于潮流前端,真的是難能可貴。
從PC端智能體無(wú)縫切到手機(jī)智能體,以及用手機(jī)操作PC智能體的應(yīng)用場(chǎng)景絲滑轉(zhuǎn)換,可以說(shuō)是繼PC智能體后的又一智能體的突破性落地范例。
實(shí)在智能推出的手機(jī)Agent智能體,驗(yàn)證了AI Agent的實(shí)用性,在移動(dòng)Agent領(lǐng)域做出了一個(gè)很好的應(yīng)用示范,其未來(lái)有更多創(chuàng)新的多模態(tài)框架探索。
手機(jī)智能體未來(lái):終端Agent智能革命
手機(jī)智能體將會(huì)為大家?guī)?lái)新的互動(dòng)方式與個(gè)性化服務(wù),并帶來(lái)更加智能化、便捷和高效的手機(jī)體驗(yàn)。
未來(lái),隨著手機(jī)智能體的不斷發(fā)展,它將會(huì)成為更加強(qiáng)大、智能化的存在,成為我們生活的一部分。當(dāng)然手機(jī)智能體嶄露頭角,也預(yù)示著手機(jī)和移動(dòng)終端行業(yè)新紀(jì)元的到來(lái)。
比爾·蓋茨認(rèn)為,AI智能體最令人興奮的影響是它們將使當(dāng)今對(duì)大多數(shù)人來(lái)說(shuō)過(guò)于昂貴的服務(wù)民主化。并指出,智能體不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來(lái)自我們從鍵入命令到點(diǎn)擊圖標(biāo)以來(lái)最大的計(jì)算革命。
現(xiàn)在看來(lái),手機(jī)智能體帶來(lái)的終端Agent智能革命,大概率會(huì)承載這一重要的歷史使命。
【王吉偉頻道,關(guān)注AIGC與IoT,專(zhuān)注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA?!?/p>
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
作者|曾響鈴文|響鈴說(shuō)在ChatGPT引爆大模型熱潮的2023年,很多人其實(shí)都還處于只聽(tīng)說(shuō)沒(méi)用過(guò)的階段。到了國(guó)內(nèi)最早獲批的百度文心一言、中科院紫東太初、商湯日日新等正式對(duì)公眾開(kāi)放服務(wù)后,最先進(jìn)的AI科技,才絲滑地飛入尋常百姓家了。人工智能帶來(lái)的顛覆性讓大家伙短暫地?fù)?dān)憂過(guò)生成式應(yīng)用“會(huì)不會(huì)把我的飯碗搶
2023年都有哪些國(guó)內(nèi)廠商推出了AIAgent?哪些廠商成功融資?對(duì)創(chuàng)業(yè)有什么啟示?一文看明白。
如何創(chuàng)造更多財(cái)富?如何讓生意更好做?如何海量獲客和精準(zhǔn)獲客?如何跟用戶(hù)拉近距離?如何自動(dòng)成交?如何讓客戶(hù)自動(dòng)裂變?這些都是秦剛公眾號(hào)后臺(tái)留言最多的問(wèn)題。特別是在AI時(shí)代,我們都希望能夠找到一條通往財(cái)富的捷徑,作為一名24年的互聯(lián)網(wǎng)創(chuàng)業(yè)老板,秦剛非常理解這些的感受。有人說(shuō),挖金子是不會(huì)致富的,賣(mài)鏟子才
12月17日,以“數(shù)智·共生”為主題的2023傳神者沉浸式高峰論壇在北京成功舉行,論壇由北京語(yǔ)言大學(xué)國(guó)家語(yǔ)言服務(wù)出口基地、新譯科技國(guó)家語(yǔ)言服務(wù)出口基地、傳神語(yǔ)聯(lián)國(guó)家語(yǔ)言服務(wù)出口基地,三家國(guó)家級(jí)特色服務(wù)出口基地(語(yǔ)言服務(wù))聯(lián)合主辦,瞻勝傳播協(xié)辦,匯聚了國(guó)內(nèi)外數(shù)十位來(lái)自語(yǔ)言服務(wù)領(lǐng)域、文化傳播領(lǐng)域、高校教
我不是危言聳聽(tīng),現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說(shuō):誰(shuí)能把MCP做起來(lái),誰(shuí)就擁有AI生態(tài)控制權(quán),誰(shuí)就是AI圈的老大。你們有沒(méi)有發(fā)現(xiàn),MCP在2025年初開(kāi)始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺(tái),提供50+預(yù)置MCP服務(wù)。不過(guò)大都只面向阿里系產(chǎn)品。(2)騰
2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會(huì)理事長(zhǎng)李軍接受了大賽主持人艾誠(chéng)采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場(chǎng)“冠軍中的冠軍”對(duì)決,更是一次全球AI人才的線下交流盛會(huì)。大賽“史無(wú)前例”的吸引了全球青年科技精英匯聚香港,更加推動(dòng)和普
2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會(huì)負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠(chéng)采訪。裁判委員會(huì)主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會(huì)副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并
2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來(lái)自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來(lái)自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開(kāi)放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林
2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來(lái)自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會(huì)嘉賓:全國(guó)政協(xié)委員、香港特別行政區(qū)立法會(huì)議員、香港中文大學(xué)工程學(xué)院副院長(zhǎng)、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語(yǔ)一樣懂AI,
昨天新出了一個(gè)AI,據(jù)說(shuō)比DeepSeek還牛,而截止到今早,已經(jīng)有10萬(wàn)人在排隊(duì)申請(qǐng)Manus邀請(qǐng)碼了,而且它邀請(qǐng)碼已經(jīng)炒到10萬(wàn)了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來(lái)自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛
蘋(píng)果16弄了兩個(gè)版本,一個(gè)是專(zhuān)門(mén)給中國(guó)人用的,準(zhǔn)備用百度的AI,還要交錢(qián)。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺(tái)灣、香港、澳門(mén)都可以用。以后都這樣了。好,問(wèn)題就出在這,蘋(píng)果和百度的合作出現(xiàn)問(wèn)題了,新聞連起來(lái)看,才能明白其中含義。新聞一:蘋(píng)果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類(lèi)生活方式正在快速轉(zhuǎn)變,這一切給人類(lèi)歷史帶來(lái)了一系列不可思議的奇點(diǎn)。我們?cè)?jīng)熟悉的一切,都開(kāi)始變得陌生?!庇?jì)算機(jī)之父約翰·馮·諾依曼曾這樣說(shuō)到。
“毀滅你,與你何干?”,這是在劉慈欣的科幻小說(shuō)《三體》里用來(lái)形容人類(lèi)與三體人之間的戰(zhàn)爭(zhēng)的一句話。