AI席卷百業(yè),作為AI時(shí)代的兩個(gè)主要入口,智能語音產(chǎn)業(yè)已經(jīng)進(jìn)入爆發(fā)期,計(jì)算機(jī)視覺在新基建的推動下正在成為AI落地規(guī)模最大、應(yīng)用最廣的領(lǐng)域。
在語音和文本智能領(lǐng)域,無論是面向公有云市場的七陌云客服,還是面向大中型機(jī)構(gòu)的容CC,容聯(lián)一直在引領(lǐng)行業(yè)創(chuàng)新,構(gòu)建了基于智能客服、智能聯(lián)絡(luò)中心的商業(yè)閉環(huán)。
在視覺領(lǐng)域,容聯(lián)又是如何在原有能力上做延伸和商業(yè)化落地的? 近日,CPS中安網(wǎng)對容聯(lián)云通訊AI視覺解決方案總監(jiān)陳開仡進(jìn)行了采訪,并關(guān)于通訊服務(wù)、AI技術(shù)、智能化視頻監(jiān)控等話題進(jìn)行了交流與探討。以下為訪談內(nèi)容:
Q:容聯(lián)云通訊的核心技術(shù)和產(chǎn)品優(yōu)勢主要集中在哪些方面?容聯(lián)提出的視覺智能服務(wù)與傳統(tǒng)視頻監(jiān)控的區(qū)別是哪些?
陳開仡: 當(dāng)語音和文本、視頻智能化在通訊業(yè)務(wù)中的應(yīng)用已經(jīng)大量普及的時(shí)候,容聯(lián)意識到當(dāng)下市場對于圖像識別具有大量的需求,因此容聯(lián)開始了計(jì)算機(jī)視覺(CV)的調(diào)研和研發(fā)。
由于CV與NLP深度學(xué)習(xí)技術(shù)上具有相通性,并且容聯(lián)擁有NLP引擎相關(guān)技術(shù)的積累,因此迅速掌握了CV場景的相關(guān)技術(shù)。
容聯(lián)的優(yōu)勢在于針對特定場景的數(shù)據(jù)進(jìn)行增強(qiáng)處理,將AI和傳統(tǒng)技術(shù)結(jié)合,以及前沿技術(shù)工程化的能力。
比如說準(zhǔn)確率,以智慧工地為例,容聯(lián)的“慧眼”視覺分析平臺可結(jié)合工地復(fù)雜現(xiàn)場做全方面檢測,做安全帽佩戴檢測時(shí)容聯(lián)產(chǎn)品準(zhǔn)確率可以超過90%。
AI算法極度依賴數(shù)據(jù),但是很多情況下有效的數(shù)據(jù)采集又比較難,容聯(lián)自有的數(shù)據(jù)增強(qiáng)處理技術(shù)可以在素材比較少的情況下獲得比較好的效果。
深度學(xué)習(xí)技術(shù)十分依賴訓(xùn)練數(shù)據(jù),且深度學(xué)習(xí)輸出結(jié)果中一般都有“閾值”限制,實(shí)際應(yīng)用中,很難設(shè)定適用于所有場景的統(tǒng)一閾值。
目前AI技術(shù)在落地過程中仍然受到數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、標(biāo)注成本、數(shù)據(jù)域變化等問題的制約,單純依靠深度學(xué)習(xí)模型難以解決復(fù)雜場景下的實(shí)際CV問題。
容聯(lián)具備一系列針對實(shí)際應(yīng)用場景的工程化優(yōu)化手段,包括圖像的時(shí)序分析機(jī)制、檢測目標(biāo)屬性過濾機(jī)制、目標(biāo)跟蹤及ReID機(jī)制等,提高算法在落地應(yīng)用時(shí)的精度。
除了技術(shù)上的壁壘,容聯(lián)產(chǎn)品一個(gè)重要的壁壘還是其在行業(yè)中的積累,因?yàn)樽瞿硞€(gè)行業(yè)的視頻識別本質(zhì)上就是還是拼行業(yè)數(shù)據(jù)的積累、以及對行業(yè)的理解力。實(shí)際操作中,準(zhǔn)確洞悉行業(yè)痛點(diǎn)是一個(gè)周期很長且很重的事情。
另外關(guān)于視覺智能服務(wù)與傳統(tǒng)視頻監(jiān)控的區(qū)別,傳統(tǒng)技術(shù)的一般特點(diǎn)是通用性較強(qiáng),容聯(lián)提出的視覺智能服務(wù)結(jié)合深度學(xué)習(xí)后,可在傳統(tǒng)視頻監(jiān)控的基礎(chǔ)上,得到神經(jīng)網(wǎng)絡(luò)模型輸出的具有語義信息的結(jié)果,在保持通用性的同時(shí)提升精度。
例如,目標(biāo)跟蹤場景,利用深度學(xué)習(xí)檢測圖像中特定種類物體位置,結(jié)合傳統(tǒng)背景建模、幀差法、光流法等,達(dá)到通用性與專用性的平衡協(xié)調(diào)。
Q:容聯(lián) CV 的商業(yè)化落地聚焦在哪些行業(yè)?這些行業(yè)關(guān)注的重點(diǎn)是什么,解決了什么問題, 提升了什么價(jià)值?
陳開仡 :目前容聯(lián)聚焦的行業(yè)有智慧社區(qū)、加油站、化工、城管、衛(wèi)監(jiān)、明廚亮灶等行業(yè),這些行業(yè)的重點(diǎn)各有不同。
以監(jiān)控場景為例,50個(gè)攝像頭,每天24小時(shí),產(chǎn)生的視頻量1200小時(shí),一個(gè)月就是36000小時(shí)。即使監(jiān)控崗位人員三班倒也無法做到100%覆蓋,期間很容易漏過一些突發(fā)事件,事發(fā)后再去追溯會很困難。
再比如制造業(yè)工業(yè)產(chǎn)線場景,工人有規(guī)定的操作規(guī)范,規(guī)定的位置,通常會有監(jiān)管人員進(jìn)行監(jiān)督。但是產(chǎn)線很長,又在不停運(yùn)動,監(jiān)管人員很難覆蓋全部工位進(jìn)行督導(dǎo)。產(chǎn)品因操作不當(dāng)產(chǎn)生的瑕疵會直接影響用戶評價(jià),對企業(yè)造成不良的影響。
我們通過智慧視覺算法,對以上行業(yè)的關(guān)鍵場景進(jìn)行智能的監(jiān)管,提升了管理的效率、覆蓋率,也提高了安全管控水平,同時(shí)降低了風(fēng)險(xiǎn)并且降低了監(jiān)管成本。
Q:在這個(gè)市場上有做硬件的廠商,有做整體解決方案,有圍繞最終用戶的系統(tǒng)集成商,容聯(lián)跟產(chǎn)業(yè)上下游的廠商的區(qū)別在哪里?有哪些合作?
陳開仡 :容聯(lián)采用的是AI能力+垂直行業(yè)+服務(wù)的模式,并且在多個(gè)領(lǐng)域都有大客戶積累,善于深挖用戶場景,發(fā)現(xiàn)痛點(diǎn);單個(gè)用戶的痛點(diǎn)可能是行業(yè)痛點(diǎn),針對痛點(diǎn)進(jìn)行定制化方案,將方案沉淀為行業(yè)方案,提升整體行業(yè)智能化水平是容聯(lián)的目標(biāo)。
另外容聯(lián)的產(chǎn)品設(shè)計(jì)秉承松耦合原則,模塊之間支持靈活的拆分重組,可以單獨(dú)提供,或跟上下游廠商產(chǎn)品進(jìn)行靈活融合,根據(jù)客戶的需求進(jìn)行方案的定制。
Q:了解到容聯(lián)的視覺算法商城很豐富,現(xiàn)在還有正在挖掘的場景和算法,容聯(lián)未來還關(guān)注到哪些是沒有被開發(fā)的行業(yè)需求?是否可以簡單談一下未來趨勢。
陳開仡 :目前還有一些行業(yè)的需求還未被開發(fā),例如衛(wèi)監(jiān)、教育、國土資源、軍工、港務(wù)、物流等等。
關(guān)于未來趨勢的預(yù)測從技術(shù)角度來講:一個(gè)值得關(guān)注的未來趨勢是從識別到理解,套用古人的說法就是從知其然到知其所以然。
過去十多年,計(jì)算機(jī)視覺在識別方面取得了顯著的進(jìn)展,但是現(xiàn)在僅僅進(jìn)行識別遠(yuǎn)遠(yuǎn)不是我們所期望的,或者說只是邁出了智能化的第一步。
僅僅有結(jié)果對企業(yè)對行業(yè)的價(jià)值仍舊有限,可以對結(jié)果進(jìn)行解釋,價(jià)值會更大。把物體和物體,物體和環(huán)境的聯(lián)系建立起來,有了這樣的從基本屬性到對象直至環(huán)境的關(guān)系,就有可能實(shí)現(xiàn)從知其然到知其所以然。
未來最重要的趨勢就是從無需知識支撐的識別到需要知識支撐的理解,做到知識圖譜的效果,或者可以稱之為“計(jì)算機(jī)視覺圖譜”。
從市場規(guī)模角度而言:目前計(jì)算機(jī)視覺行業(yè)增速持續(xù)保持較高的增長趨勢,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的推動著計(jì)算機(jī)視覺技術(shù),同時(shí)也驅(qū)動著整個(gè)人工智能行業(yè)的迅速發(fā)展,計(jì)算機(jī)視覺技術(shù)已在各行各業(yè)有著舉足輕重的作用。
伴隨著技術(shù)成熟度提高,硬件性能的飛速提升,人臉識別、物體識別、工序識別、復(fù)雜場景識別等分類、分割算法不算提升精度,未來將有更多的場景能夠應(yīng)用計(jì)算機(jī)視覺技術(shù),計(jì)算機(jī)視覺企業(yè)應(yīng)在強(qiáng)化技術(shù)打造的前提下,發(fā)掘更多垂直領(lǐng)域需求,解決企業(yè)痛點(diǎn)。
Q:安防行業(yè)受智能化、信息化技術(shù)影響,邊界逐漸模糊,泛安防成為行業(yè)未來趨勢,眾多巨頭跨界入局,行業(yè)競爭加劇,容聯(lián)面對如此激烈的市場格局,會如何應(yīng)對?未來的戰(zhàn)略和規(guī)劃會做哪些調(diào)整?
陳開仡 :泛安防時(shí)代,無論是技術(shù)還是市場,安防行業(yè)不再是一個(gè)封閉的行業(yè)。
首先是關(guān)于產(chǎn)品升級,容聯(lián)將側(cè)重于三個(gè)方面去創(chuàng)新:
第一,讓安防從被動防范到主動預(yù)警,從“看”變?yōu)?ldquo;做” ;利用視覺智能把安防體系從被動的記錄、檢查,逐漸轉(zhuǎn)變?yōu)樽詣悠饰?、主動預(yù)警或即時(shí)處置。
第二,讓智能安防云端化。 安防行業(yè)面對的一大問題就是場景“碎片化”,這是一個(gè)不可忽視問題,大量的碎片場景帶來大量的數(shù)據(jù)積累,安防體系中存儲的數(shù)據(jù)量級成指數(shù)增長,這時(shí)候應(yīng)用會逐漸轉(zhuǎn)向云端進(jìn)行處理,將復(fù)雜任務(wù)云化,既可以增加處理效率,也可以合理的進(jìn)行資源的分配,容聯(lián)也會針對云端領(lǐng)域的應(yīng)用場景做深入的研究。
第三,應(yīng)用場景落地。 安防行業(yè)已從前兩年關(guān)注各類AI算法的功能和性能,轉(zhuǎn)向重視算法與具體業(yè)務(wù)的匹配銜接,追求將AI性能落實(shí)到具體業(yè)務(wù)應(yīng)用上,形成具體的解決方案。容聯(lián)將致力于解決各種垂直應(yīng)用場景。
同時(shí)隨著5G、AI的興起,外加政策的扶持,我們認(rèn)為邊緣場景將會為安防行業(yè)帶來新鮮活力,所以云、邊、端一體化也是我們一個(gè)重要的產(chǎn)品規(guī)劃。
據(jù)悉,11月5日,「容聯(lián)云通訊」宣布完成 1.25億美元 F輪融資,由中國國有資本風(fēng)險(xiǎn)投資基金領(lǐng)投,新東方產(chǎn)業(yè)基金、Mirae Asset(未來資產(chǎn))、藍(lán)藤資本和CloudAlpha等戰(zhàn)略及財(cái)務(wù)投資方共同參與。騰達(dá)資本、花旗環(huán)球金融亞洲有限公司和招商證券(香港)擔(dān)任財(cái)務(wù)顧問。
這是國內(nèi)云通訊領(lǐng)域迄今為止規(guī)模最大的一筆私募股權(quán)融資。
容聯(lián)表示,本輪融資完成后,容聯(lián)將進(jìn)一步加大在智能通訊云服務(wù)方向的技術(shù)研發(fā)投入,提升產(chǎn)品厚度及競爭壁壘;同時(shí)持續(xù)創(chuàng)新,擴(kuò)容邊界,在5G、新基建的浪潮中,更好地助力企業(yè)和政府組織實(shí)現(xiàn)數(shù)字化改造與智能化升級,推動中國企業(yè)通訊市場變革。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識別、聲音識別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺+四大開發(fā)服務(wù),建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號人物王慧文對標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場對大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時(shí),外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
阿里媽媽、巨量引擎、騰訊廣告,誰是當(dāng)代“AI印鈔機(jī)”?
Manus撕開一道真相
文/八真來源/節(jié)點(diǎn)財(cái)經(jīng)具身智能賽道,誰最有可能拔得A股資本市場的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機(jī)器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機(jī)器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號、國內(nèi)IP無法訪問——曾被譽(yù)為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時(shí)刻“閃離”中國市場。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團(tuán)隊(duì)也將大幅裁撤——原有120人規(guī)模團(tuán)隊(duì)除40余
四個(gè)月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個(gè)位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時(shí),Manus官方微博和小紅書
文/十界來源/節(jié)點(diǎn)財(cái)經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場