1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

 2024-09-03 11:00  來源:A5專欄  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent 7.0,看RPA Agent的迭代升級抓取豆瓣信息、自己制作PPT,這款AI Agent真的實現(xiàn)了流程全自動化AI Agent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPA Agent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實在Agent 7.0 ,這款神器做到了B端與C端通吃C端AI Agent構(gòu)建與應(yīng)用實現(xiàn)端到端,這個智能體構(gòu)建平臺真的不一般

文/王吉偉

智能體的爆發(fā),意味著大語言模型的快速落地與應(yīng)用。所以它一經(jīng)提出便如泄洪之水一發(fā)而不可收,直至現(xiàn)在如火如荼。

尤其是在智能體工作流(Agentic Workflow)的加持下,智能體表現(xiàn)出了更強的易用性和適應(yīng)性。除了解決簡單工作流的自動化,也在積極融合進入更多的傳統(tǒng)業(yè)務(wù)流程和應(yīng)用場景。

王吉偉頻道在《Agentic Workflow新范式,基于大語言模型的工作流、業(yè)務(wù)流程、智能體大融合》一文中提到過,廣義上的Agentic Workflow是包含傳統(tǒng)軟件(工具、解決方案)、大語言模型、AI Agent等在內(nèi)的新型業(yè)務(wù)流程的集合,其中用RPA等超自動化工具將輕量化LLM工作流與傳統(tǒng)工作流相連接的工作流,將會成為企業(yè)業(yè)務(wù)流程的重要形式。

當前的AI Agent構(gòu)建平臺所構(gòu)建的AI Agent通過各種插件和工作流已經(jīng)可以做到較長的流程,但仍然無法操作沒有API接口和沒有開放API的大型以及遺留的企業(yè)級應(yīng)用程序,并且API接口也不能保障絕對的穩(wěn)定。

因此在智能體的應(yīng)用上,用RPA來連接多種應(yīng)用系統(tǒng)以保障數(shù)據(jù)的流通是不可或缺的,這對于已將RPA應(yīng)用于企業(yè)運營人機交互層的組織來說則更加重要。

在企業(yè)級智能體的解決方案上,基于RPA構(gòu)建的或者以RPA為tools的RPA Agent越發(fā)受到廣大組織重視,原因正是它能夠彌補單純的API類智能體的不足,可以通過“API+UI”雙重自動化極大提升智能體的應(yīng)用潛力。RPA已經(jīng)成為智能體的重要技術(shù),也是實現(xiàn)基于LLM的智能自動化的必要技術(shù)之一。

從去年LLM爆發(fā)以來,RPA\超自動化廠商們也都在持續(xù)進化,完成了RPA Agent的產(chǎn)品化進階。那么它們進化到什么程度了?在王吉偉頻道寫這個選題期間,恰好實在智能發(fā)布了最新產(chǎn)品實在Agent 7.0。這篇文章,我們就以這款產(chǎn)品為例,透視國產(chǎn)RPA Agent產(chǎn)品的發(fā)展情況。

先來看兩個例子

在詳細介紹實在Agent之前,先來看幾個實際操作案例。

案例1:采集豆瓣新片排行榜發(fā)送給同事

這是一個娛樂類的案例。如果你想為同事推薦最新的十部電影,過去需要打開豆瓣電影的新品排行榜,逐個復制電影名稱,通過微信或者釘釘發(fā)送給朋友?,F(xiàn)在使用實在Agent,只需要打開軟件,輸入 「采集豆瓣電影片排行榜前十(電影名、評分)」,它就能自動分析你的需求并拆解成執(zhí)行步驟,然后點一下 執(zhí)行 ,它就會自動采集相關(guān)數(shù)據(jù)并把數(shù)據(jù)填入到釘釘,發(fā)送給你的同事。

案例2:在騰訊文檔制做年終匯報幻燈片

這是一個辦公應(yīng)用的案例。按照正常步驟操作這個業(yè)務(wù)流程,需要打開騰訊文檔,搜索相關(guān)文檔,再制作成PPT。使用實在Agent智能體,只需要告訴它 「明天要去匯報,去騰訊文檔里做一個叫年中匯報的幻燈片 」,它就會把你的需求拆解成相應(yīng)的執(zhí)行步驟,然后點擊 執(zhí)行 按鈕,幾分鐘后就能在騰訊文檔走出一個幻燈片。

除了這兩個案例,實在智能還給王吉偉頻道展示了獲取百度貼吧前10個熱門貼吧相關(guān)信息、京東關(guān)注商品降價通知發(fā)送、京東購物車商品結(jié)算等案例。

王吉偉頻道還實際測試了12306查詢車次、給微信好友添加標簽及發(fā)送信息等應(yīng)用案例,都能一一完成。實在Agent智能體預制了很多代表性案例,感興趣的朋友可以親自嘗試。

據(jù)悉,目前實在Agent已經(jīng)能夠?qū)︶斸敗⑽⑿?、企業(yè)微信等集成辦公軟件進行精確操作,并能通過屏幕識別技術(shù)對淘寶、京東、攜程及12306等網(wǎng)站進行精確識別。

實在智能正在對更多的軟件系統(tǒng)進行適配,以后大家需要操作的工作、生活及學習等業(yè)務(wù)流程,都能通過使用自然語言與實在Agent智能體交流實現(xiàn)相應(yīng)業(yè)務(wù)流程的自動化,且這些Agent流程都是可以復用的,一次創(chuàng)建多次使用。

實在Agent 7.0.0有什么特點?

以上兩個實操案例,來自于實在Agent 7.0。新版Agent 7.0具備以下幾個特點:

自然對話交互:“All in One”式助理工作體驗;意圖理解、流程規(guī)劃:更為強大的意圖理解+流程精準拆解規(guī)劃能力;多代產(chǎn)品能力集成:實現(xiàn)一代RPA、二代IPA數(shù)字員工元素拾取、組件、流程編排等全部能力集成;軟件界面精準操作:Agent多模態(tài)屏幕語義理解,屏幕掃描識別,界面精準操作;

實在智能千億參數(shù)訓練的底層TRAS大模型也再次進化,訓練參數(shù)量更大,支持自然語言溝通工作、科普知識,高效執(zhí)行任務(wù)完成工作,對話工作兩不誤。

在智能問答方面,基于實在智能文檔系統(tǒng)(IDP),能夠給實現(xiàn)文件的精確問答及處理。

此外,該公司已經(jīng)繼續(xù)深入探索企業(yè)大模型、數(shù)字員工運營管理平臺、RAG和Agentic Workflow等技術(shù)和產(chǎn)品整合研究,實在智能創(chuàng)始人孫林君曾在2024年世界人工智能大會上提到“企業(yè)大腦”解決方案。

目前它們正在逐步推出企業(yè)知識庫定制訓練服務(wù),通過RAG讓Agent能夠回答企業(yè)內(nèi)部專屬的知識內(nèi)容和流程內(nèi)容,讓知識和流程資產(chǎn)創(chuàng)新價值。

之所以能做到這些,在于其對于技術(shù)和產(chǎn)品研發(fā)的執(zhí)著,并且產(chǎn)研投入量極大。此次版本大更新花費近一年時間,深入更新迭代了底層較多技術(shù)架構(gòu)、功能架構(gòu)、RPA組件等。

實在智能在RPA有6年技術(shù)沉淀,在AI有6年能力、人才等的積累,多年的技術(shù)沉淀、對市場需求的準確把握以及對技術(shù)走向的前瞻性預判,使得他們能夠在LLM與AI Agent爆發(fā)之后先一步扛起RPA Agent的行業(yè)大旗。

作為國內(nèi)首家發(fā)布明確意義上的AI Agent智能體的公司,實在智能的系列產(chǎn)品已經(jīng)先一步實現(xiàn)依據(jù)個人訴求生成工作流程、識別工作環(huán)境(瀏覽器、網(wǎng)頁、通訊軟件、工作軟件等)、自主執(zhí)行任務(wù)及流程,在保證智能體能夠在B端為廣大組織提供企業(yè)級服務(wù)的同時,也用標準化、易用化的產(chǎn)品進入C端市場服務(wù)更多個人用戶。

與Coze等Agent平臺有什么區(qū)別?

看了上面兩個案例,是不是感覺使用實在Agent超級簡單?

沒錯,使用實在Agent智能體的全部流程僅是 「輸入需求-點擊執(zhí)行-收到結(jié)果」 這么簡單,完全不用考慮其他操作,實現(xiàn)了軟件使用上的端到端。理論上,隨著軟件的不斷迭代,這種端到端的方式可以做到任何業(yè)務(wù)流程的自動化創(chuàng)建和自動化執(zhí)行。

提及智能體,目前大家更熟悉的可能是Coze、Dify、GPTs等平臺上用戶所創(chuàng)建的各種智能體。從上面的案例大家應(yīng)該能夠體會到,實在Agent與它們最大的區(qū)別是在智能體構(gòu)建上幾乎不需要人為參與(流程中斷時需要人為干預),都由實在Agent自行完成。

其他平臺的Agent構(gòu)建方式是:人力構(gòu)建智能體,智能體自動化執(zhí)行任務(wù)。實在Agent的構(gòu)建方式則是:自動化構(gòu)建智能體,智能體自動化執(zhí)行任務(wù)。這種方式,實現(xiàn)了從構(gòu)建到執(zhí)行的全自動化。

所以,在使用實在Agent智能體時,用戶不用再像在Coze等平臺一樣通過輸入提示詞、選擇插件、搭建工作流等操作去構(gòu)建一個智能體,極大地節(jié)省了用戶構(gòu)建應(yīng)用的時間(自動化構(gòu)建可以讓用戶忙其他事情),并進一步降低了智能體的構(gòu)建門檻,真正實現(xiàn)了一句話構(gòu)建智能體,所想即所得。

此外,想要在智能體平臺構(gòu)建能夠深度操作釘釘、微信等智能體,沒有相應(yīng)的API接口是無法實現(xiàn)的,且平臺生態(tài)之間的API還存在著一定的連接安全性、限制性等問題,通過RPA模仿人類操作的形式則完成杜絕了此類問題的發(fā)生。

端到端這個術(shù)語經(jīng)常應(yīng)用于B端企業(yè)級技術(shù)解決方案,主要強調(diào)技術(shù)、方案、流程及系統(tǒng)的完整性,也更強調(diào)產(chǎn)品應(yīng)用的易用性和廣泛性。

實在智能的端到端,一方面可以理解為從B端到C端。因為實在智能要做的,不僅是能在B端為企業(yè)提供專業(yè)級的Agent數(shù)字員工解決方案,更要在C端為個人用戶帶來解決長尾低頻自動化需求的智能助理。從全新的實在Agent 7.0來看,他們做到了。

另一方面,還可以理解為C端的技術(shù)實現(xiàn)。實在Agent把“端到端”的技術(shù)特點和便捷特性賦予了智能體的C端構(gòu)建與應(yīng)用,把“RPA人人可用”的愿景進一步拓展為”Agent人人可用”。在LLM的加持下,這個愿景將會快速變?yōu)楝F(xiàn)實。

2023年8月,隨著實在Agent智能體的面世,實在智能成為國內(nèi)首家發(fā)布AI Agent智能體的AI科技公司。2024年8月,實在Agent 7.0發(fā)布后,實在智能再次成為RPA業(yè)界首家推出Agent產(chǎn)品形態(tài)的AI科技企業(yè)。

而這個進程,僅用了1年。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動化與AI Agent,歡迎關(guān)注與交流?!?/p>

全文完

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

  • 百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

    “AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復雜文檔處理邊界。此次升級標志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

  • 宇樹科技加速沖刺科創(chuàng)板IPO,人形機器人龍頭估值飆至120億元

    “宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機器人賽道不可忽視的中國力量。”首程資本管理合伙人朱方文在追加投資時如是評價。7月7日,據(jù)每日經(jīng)濟新聞從宇樹科技投資方處獲悉,國內(nèi)人形機器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計劃于科創(chuàng)板IPO,預計

    標簽:
    宇樹科技
  • OpenAI推出GPT-5:AI大統(tǒng)一時代的到來?

    推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負

    標簽:
    chatgpt

編輯推薦