深圳人工智能協(xié)會(huì)于今年4月推出《AI時(shí)代-細(xì)數(shù)AI風(fēng)云人物》紀(jì)念刊,紀(jì)念中國人工智能發(fā)展的60多年的風(fēng)雨變化,的盧深視創(chuàng)始人兼CEO戶磊有幸被邀請(qǐng)參與采訪,以下為采訪正文。
戶磊,的盧深視科技有限公司創(chuàng)始人兼CEO,畢業(yè)于中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院,并獲得中科院計(jì)算技術(shù)研究所計(jì)算機(jī)視覺方向碩士學(xué)位,師從高文院士。
孜孜不輟 專注于三維機(jī)器視覺領(lǐng)域
成立于2015年8月的的盧深視,是一家專注三維機(jī)器視覺領(lǐng)域的高新技術(shù)企業(yè)?;诮Y(jié)構(gòu)光深度感知及三維實(shí)時(shí)動(dòng)態(tài)高精度重建等技術(shù),的盧深視的三維人臉產(chǎn)品及解決方案提供了人臉檢測(cè)、姿態(tài)判斷、活體檢測(cè)、人臉識(shí)別等功能。據(jù)的盧深視創(chuàng)始人戶磊介紹,的盧深視的核心技術(shù)之一為深度感知,通過結(jié)構(gòu)光或者是類似雷達(dá)的方式,獲取深度信息形成深度圖象,實(shí)現(xiàn)高精度深度成像、高精度相機(jī)標(biāo)定、深度相機(jī)實(shí)時(shí)自校準(zhǔn)、無損深度圖像編碼傳輸。的盧深視另一項(xiàng)核心技術(shù)為三維重建,包括實(shí)時(shí)高精度三維面部重建、動(dòng)態(tài)三維人體重建。戶磊表示,的盧深視主要的研究方向是基于3D人臉精準(zhǔn)感知和分析之上的人臉的識(shí)別,它能夠帶來更高精度的個(gè)人身份及行為分析。"我們自己的一個(gè)定位是基于3D的技術(shù),實(shí)現(xiàn)人的身份、行為、軌跡的精細(xì)化分析,然后去支撐其在安全、消費(fèi)等各個(gè)領(lǐng)域里的應(yīng)用。"
相得益彰 5G+3D帶來強(qiáng)視覺升級(jí)
隨著5G時(shí)代的日益臨近,高速網(wǎng)絡(luò)為人類的視覺升級(jí)帶來了可能,5G+3D將加速信息顯示從二維向三維過渡。戶磊認(rèn)為,三維感知、三維重建是實(shí)現(xiàn)三維VR/AR交互的必備技術(shù),隨著5G的普及,其高帶寬、低延遲、大連接等特性,將使得更多家用設(shè)備終端能夠?qū)崿F(xiàn)三維VR/AR的交互,大量消費(fèi)者將能夠體會(huì)到三維視覺技術(shù)帶來的交互變革體驗(yàn)。5G技術(shù)的普及,是3D交互體驗(yàn)大面積應(yīng)用的一個(gè)加速劑。在3D的AR里面,大的技術(shù)方向可以分成兩類,一類是三維感知,另一類是三維顯示。在物理世界當(dāng)中置入一個(gè)3D的物體,而且它看起來很真實(shí),這是3D顯示的相關(guān)技術(shù);而要去實(shí)現(xiàn)在物理世界中置入一個(gè)3D物體這件事情,其實(shí)是需要非常精準(zhǔn)的3D物理世界感知作為基礎(chǔ)的。戶磊舉例了一個(gè)應(yīng)用場(chǎng)景,比如在遠(yuǎn)程開會(huì)中,與會(huì)成員們通過帶上一個(gè)AR智能設(shè)備,就能產(chǎn)生置身會(huì)議室的真實(shí)感。"通過對(duì)這些人進(jìn)行精準(zhǔn)的三維重建,將其變成數(shù)字化的人,然后利用5G高帶寬、低延遲、大接入量的特性,實(shí)時(shí)讓與會(huì)成員之間進(jìn)行互動(dòng)。5G與3D技術(shù)的結(jié)合,讓我們可以期待這樣的應(yīng)用。"
落地為王 技術(shù)的價(jià)值體現(xiàn)在應(yīng)用中
有了技術(shù),下一步該思考的就是如何變現(xiàn),安防是戶磊首先選中的應(yīng)用領(lǐng)域。近年來,越來越多的安全部門、安防系統(tǒng)利用人工智能產(chǎn)品和方案來加強(qiáng)安全保障。目前,大部分安防監(jiān)控產(chǎn)品和方案采用的都是二維人臉識(shí)別比對(duì)技術(shù)。作為專注三維機(jī)器視覺的廠商,戶磊認(rèn)為,從技術(shù)的角度看人臉識(shí)別技術(shù)的精準(zhǔn)度還可以產(chǎn)生更理想的效果。二維人臉識(shí)別在安防領(lǐng)域的諸多實(shí)際應(yīng)用中存在很大的局限性,無法滿足高安全標(biāo)準(zhǔn)的應(yīng)用。"的盧深視采用的是完全的三維識(shí)別,這個(gè)三維不僅體現(xiàn)在數(shù)據(jù)收集上,在識(shí)別算法上采用的也是針對(duì)三維數(shù)據(jù)的人臉識(shí)別算法,因此三維人臉識(shí)別準(zhǔn)確率更高且防偽能力更強(qiáng)。"戶磊表示,在安防領(lǐng)域,基于三維人臉識(shí)別技術(shù),能夠以極高首位命中率基于十億級(jí)庫秒級(jí)判定人員的真實(shí)身份信息,有效彌補(bǔ)了二維人臉識(shí)別技術(shù)弊端,使得人臉識(shí)別產(chǎn)品的應(yīng)用場(chǎng)景不再僅限于"事后追蹤"層面,能夠做到"實(shí)時(shí)認(rèn)定與精準(zhǔn)打擊",轉(zhuǎn)被動(dòng)為主動(dòng),成為"事前預(yù)防"的有效工具。
各有千秋 國內(nèi)CV優(yōu)勢(shì)在于商業(yè)化
作為人工智能領(lǐng)域的一項(xiàng)重要技術(shù),計(jì)算機(jī)視覺是制造、醫(yī)療、安防等各個(gè)領(lǐng)域的智能系統(tǒng)中不可分割的一部分。鑒于其重要性,一些主要國家把對(duì)計(jì)算機(jī)視覺的研究列為重大項(xiàng)目。目前,全球主要的計(jì)算機(jī)視覺研究集中在歐洲、美國和中國。就計(jì)算機(jī)視覺發(fā)展水平而言,戶磊表示,在基礎(chǔ)理論層面計(jì)算機(jī)視覺基本上是在美國和歐洲開始的,中國目前處于學(xué)習(xí)的階段。具體到三維視覺,歐洲比美國和中國在基礎(chǔ)理論和一些實(shí)踐上面要做的更好。而在應(yīng)用層面上,中國是走在前沿的,主要是因?yàn)榉e累了大量的數(shù)據(jù),以及構(gòu)建了很多應(yīng)用場(chǎng)景,這是中國的優(yōu)勢(shì)。在戶磊看來,現(xiàn)在全球?qū)W術(shù)界的溝通和流動(dòng)是非常頻繁,人工智能的發(fā)展的關(guān)鍵在于商業(yè)化落地以及數(shù)據(jù)驅(qū)動(dòng)。此外,隨著中國對(duì)人工智能的日益重視,持續(xù)在相關(guān)領(lǐng)域加大投入,戶磊相信將來中國是極有可能在計(jì)算機(jī)視覺方向上彎道超車的。
防患未然 數(shù)據(jù)安全問題應(yīng)重點(diǎn)關(guān)注
除資金、人才、空間等要素支撐外,人工智能產(chǎn)業(yè)發(fā)展還離不開數(shù)據(jù)的支持。談到數(shù)據(jù),數(shù)據(jù)安全也成為人工智能發(fā)展備受關(guān)注的一個(gè)問題。"我認(rèn)為數(shù)據(jù)安全是一個(gè)非常重要的問題,這個(gè)問題是可以通過技術(shù)方案的實(shí)施去解決的。然而,要想徹底解決這個(gè)問題,技術(shù)只是其中的一個(gè)因素。換句話說,其實(shí)很多數(shù)據(jù)安全問題,并不是技術(shù)本身做不到,而是有關(guān)人的意識(shí)、管理等諸多方面的問題有待解決。"戶磊強(qiáng)調(diào),數(shù)據(jù)安全的問題通過技術(shù)其實(shí)是可以解決的。不管是現(xiàn)在備受關(guān)注的網(wǎng)絡(luò)安全,還是像區(qū)塊鏈的加密技術(shù),甚至一些非常前沿的量子密鑰分發(fā)等,都是有技術(shù)方案可以解決問題的。在戶磊看來,數(shù)據(jù)安全或隱私保護(hù)的最大挑戰(zhàn)在于整個(gè)社會(huì)流程管控體系的不健全,因而不能將這些技術(shù)很好的去應(yīng)用起來。他認(rèn)為,一些隱私安全問題的存在很多時(shí)候是因?yàn)榉煞ㄒ?guī)不完善、邊界不清晰、流程制度跟不上等,實(shí)質(zhì)上就是社會(huì)管理機(jī)制存在問題。"說句實(shí)話,現(xiàn)在很多數(shù)據(jù)泄露其實(shí)都是人為原因泄露的,技術(shù)本身是中立的且能夠解決問題的。"
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
2023年7月6日,第六屆世界人工智能大會(huì)(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會(huì)的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營商、科研院所等優(yōu)秀團(tuán)隊(duì)
這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識(shí)別、聲音識(shí)別、語言處理等特
文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會(huì)上,發(fā)布了企業(yè)級(jí)戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺(tái)+四大開發(fā)服務(wù),建立起IoT生態(tài)。對(duì)于這場(chǎng)發(fā)布會(huì),市場(chǎng)的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定
美團(tuán)曾經(jīng)的二號(hào)人物王慧文對(duì)標(biāo)OpenAI的創(chuàng)業(yè)項(xiàng)目光年之外,以20億賣給美團(tuán),再度引發(fā)市場(chǎng)對(duì)大模型的熱議。
2020年底,王慧文在朋友圈寫下這句話時(shí),外界本以為這位伴隨中國互聯(lián)網(wǎng)發(fā)展而持續(xù)創(chuàng)業(yè)20年的人物即將告別創(chuàng)業(yè)舞臺(tái)。但是,一個(gè)曾經(jīng)多次創(chuàng)業(yè),正值壯年的互聯(lián)網(wǎng)老將心中的創(chuàng)業(yè)熱情是難以熄滅的。
Manus撕開一道真相
文/八真來源/節(jié)點(diǎn)財(cái)經(jīng)具身智能賽道,誰最有可能拔得A股資本市場(chǎng)的頭籌?答案大概率是誕生剛剛兩年,由華為"天才少年"、B站百萬粉絲科技UP主稚暉君(彭志輝)創(chuàng)立的智元機(jī)器人。近期,從事新材料研發(fā)與生產(chǎn)的上緯新材(688585.SH)丟出重磅炸彈,宣布智元機(jī)器人及相關(guān)主體將通過收購其至少63.62%的股
文/道哥大舉裁員、清空賬號(hào)、國內(nèi)IP無法訪問——曾被譽(yù)為“中國AIAgent希望之星”的Manus,在估值飆至5億美元的高光時(shí)刻“閃離”中國市場(chǎng)。近日,Manus“裁員、出走”的消息在媒體端大量發(fā)酵。消息稱,Manus公司總部將由中國遷至新加坡,其國內(nèi)團(tuán)隊(duì)也將大幅裁撤——原有120人規(guī)模團(tuán)隊(duì)除40余
四個(gè)月前邀請(qǐng)碼炒至10萬元,如今官網(wǎng)變灰、社交賬號(hào)清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個(gè)位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時(shí),Manus官方微博和小紅書
文/十界來源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)圍繞算力自主的競(jìng)賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)
“宇樹已形成硬件、算法、場(chǎng)景聯(lián)動(dòng)的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時(shí)如是評(píng)價(jià)。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉,國內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計(jì)劃于科創(chuàng)板IPO,預(yù)計(jì)
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個(gè)強(qiáng)大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開發(fā)者體驗(yàn)負(fù)