1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

硅基智能數(shù)字人核心技術(shù)不斷突破,搶占制高地

 2020-06-18 09:45  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

技術(shù)浪潮引領(lǐng)時(shí)代變革,技術(shù)革命的不斷突破一直引領(lǐng)人類接近期待的未來。計(jì)算機(jī)算力以及全球數(shù)據(jù)總量呈指數(shù)級(jí)增長(zhǎng)、算法研究的快速迭代,人工智能已經(jīng)登上了科技革命的風(fēng)口。人工智能走出科幻的迷霧,成為切實(shí)改變世界的革新技術(shù),對(duì)社會(huì)轉(zhuǎn)型升級(jí)產(chǎn)生巨大價(jià)值。

作為全球性技術(shù)領(lǐng)先的人工智能創(chuàng)新公司——硅基智能, 秉承事實(shí)求是的原則,始終堅(jiān)持AI商業(yè)化交互核心技術(shù)的自主研發(fā)和產(chǎn)業(yè)落地,以客戶成功為中心,在AI核心技術(shù)和產(chǎn)品矩陣方面,不斷創(chuàng)新突破,賦能企業(yè)和社會(huì),引領(lǐng)行業(yè)數(shù)字化、智慧化、智能化變革。

核心技術(shù)突飛猛進(jìn) 硅語數(shù)字人一日千里

硅基智能是一家在實(shí)驗(yàn)室內(nèi)大量造“人”的公司,2020年初,硅基智能重磅發(fā)布“打造硅基生命操作系統(tǒng)”的硅語數(shù)字人,其豐富的知識(shí)儲(chǔ)備、自然的面部表情、智慧的互動(dòng)交互,“音容笑貌”皆像人的高逼真度,即刻引發(fā)客戶和行業(yè)的極大關(guān)注,咨詢量和合作量絡(luò)繹不絕。

中國(guó)移動(dòng)、中國(guó)工商銀行、南京銀行、武漢漢陽區(qū)政府.......等大型知名企業(yè)和機(jī)構(gòu)紛紛向硅基智能拋出橄欖枝,硅基智能為其打造的各種形態(tài)的數(shù)字經(jīng)理陸續(xù)閃亮登場(chǎng)。

硅基智能數(shù)字人-娛樂主播小智

這幾個(gè)月內(nèi),硅基智能數(shù)字人的核心技術(shù)亦是突飛猛進(jìn),一日千里,實(shí)現(xiàn)了跨越式飛躍。更加逼真飽滿的臉部形態(tài)、更加細(xì)膩柔和的面部表情、更高契合度的語言表達(dá)和唇動(dòng)、更加復(fù)雜和流暢的肢體動(dòng)作,口型匹配、表情匹配、肢體動(dòng)作匹配,精致鮮活、惟妙惟肖。這一切的卓越表現(xiàn),皆歸功于硅基智能背后強(qiáng)大領(lǐng)先的多種人工智能前沿技術(shù)、全面的基礎(chǔ)算法、優(yōu)秀的交互能力和強(qiáng)大的算力支持,是硅基智能堅(jiān)持自主技術(shù)研發(fā)、自主產(chǎn)品創(chuàng)新的成果展現(xiàn)。

如下挑選部分典型技術(shù)以饗讀者,一起感受硅基智能先進(jìn)的人工智能核心技術(shù)打造的數(shù)字人的獨(dú)特魅力。

技術(shù)突破一:一張照片實(shí)現(xiàn)360度人臉重建

硅基智能克隆人技術(shù),完整建模克隆人形象。一張使用普通攝像頭拍攝的肖像照片,通過肖像網(wǎng)絡(luò)分析人臉特征、臉部面部美學(xué)知識(shí),即可重建人臉三維信息,生成自動(dòng)生成與照片人物360高度匹配的人臉,具有高回復(fù)度的人類面相和皮膚,形象逼真精致。

硅基智能3D人臉建模具有更好的魯棒性和更高的精度,特別是在人臉角度大、環(huán)境光變化、化妝、以及表情變化等復(fù)雜的情況下仍然具有較高的識(shí)別精度。

技術(shù)突破二:實(shí)時(shí)面部表情捕捉遷移

面部動(dòng)作是人類日常傳遞信息的主要途徑,承擔(dān)著情感傳遞的重要責(zé)任。面部動(dòng)作的識(shí)別、分析、合成是實(shí)現(xiàn)人機(jī)交互非常重要的關(guān)鍵技術(shù)。

在真人說話、做臉部動(dòng)作時(shí),硅基智能數(shù)字人的面部表情和動(dòng)作亦同步進(jìn)行,和真人一模一樣。

硅基自主研發(fā)的面部表情捕捉遷移技術(shù),包含掃描縮減、面部肌肉驅(qū)動(dòng)、面部表情和肢體捕捉、多模態(tài)建模技術(shù)等,實(shí)現(xiàn)智能檢測(cè)人臉區(qū)域并標(biāo)記特征點(diǎn),如眼、口、鼻、眉、面部輪廓等,隨視頻圖像輸入,不斷對(duì)人臉特征和表情進(jìn)行自適應(yīng),精準(zhǔn)捕捉面部表情,同步并驅(qū)動(dòng)3D數(shù)字人,實(shí)現(xiàn)高精度下的實(shí)時(shí)軀干運(yùn)動(dòng)、頭部運(yùn)動(dòng)、面部表情和視線注視的遷移,達(dá)到面部表情、嘴唇動(dòng)作、身體運(yùn)動(dòng)和聲音表達(dá)實(shí)現(xiàn)高度一致。

技術(shù)突破三:人體姿態(tài)估計(jì)及骨骼驅(qū)動(dòng)

給與一幅圖像或一段視頻,硅基智能先進(jìn)的人體姿態(tài)識(shí)別技術(shù)就可以去恢復(fù)其中人體關(guān)節(jié)點(diǎn)位置的過程。根據(jù)輸入圖像的類型,硅基智能人體姿態(tài)算法支持兩類:基于深度圖的算法和直接基于RGB圖像的算法。即便是針對(duì)比較復(fù)雜的場(chǎng)景下,基于RGB圖像的人體姿態(tài)估計(jì)算法也能達(dá)到非常好的識(shí)別效果。

人體姿態(tài)識(shí)別技對(duì)于描述人體姿態(tài)、預(yù)測(cè)人體行為至關(guān)重要,人體骨骼關(guān)鍵點(diǎn)檢測(cè)是計(jì)算機(jī)視覺任務(wù)的基礎(chǔ)。硅基智能能夠檢測(cè)圖像中的人體并返回人體矩形框位置,精準(zhǔn)定位核心關(guān)鍵點(diǎn)提取特征,包含頭頂、五官、頸部、四肢主要關(guān)節(jié)部位,利用這些參數(shù)構(gòu)成特征向量反映人體姿態(tài)。

硅基智能支持多人檢測(cè)、大動(dòng)作等復(fù)雜場(chǎng)景,可以檢測(cè)圖像中的所有人體,標(biāo)記出每個(gè)人體的坐標(biāo)位置,不限人體數(shù)量,適應(yīng)人體輕度遮擋、截?cái)嗟那闆r,完美實(shí)現(xiàn)人體姿態(tài)識(shí)別應(yīng)用。

技術(shù)驅(qū)動(dòng)創(chuàng)新,硅基智能技術(shù)突破永不止步

Gartner最新發(fā)布的技術(shù)成熟度曲線顯示,目前全球處于上升期或巔峰期的新興技術(shù)中,一半以上與人工智能有關(guān)。到2020年,人工智能預(yù)計(jì)將在全球產(chǎn)生約470億美元的總收入,成為全球經(jīng)濟(jì)發(fā)展、科技創(chuàng)新及社會(huì)變革的一大驅(qū)動(dòng)力。

作為一家國(guó)家級(jí)高新技術(shù)企業(yè),硅基智能對(duì)人工智能的未來從未停止過想象和探索。創(chuàng)新是硅基智能植根于血液中的精神,是硅基智能延續(xù)在身的基因。2020年,硅基智能將秉持初心,遵循技術(shù)發(fā)展規(guī)律,下定決心、保持恒心、找準(zhǔn)重心,咬定青山不放松,堅(jiān)定走自主創(chuàng)新之路,核心技術(shù)突破和應(yīng)用永不止步。

硅基智能將掌握核心AI技術(shù),并轉(zhuǎn)化為落地商用,加強(qiáng)產(chǎn)品應(yīng)用迭代,創(chuàng)造數(shù)量達(dá)億級(jí)的“穩(wěn)定、可靠、聰明、不知疲倦”的硅基勞動(dòng)力,作為企業(yè)數(shù)字員工參與到企業(yè)經(jīng)營(yíng)的方方面面,從勞動(dòng)力端推進(jìn)供給側(cè)結(jié)構(gòu)性改革,助推企業(yè)數(shù)字經(jīng)濟(jì)發(fā)展,基業(yè)長(zhǎng)青;助力社會(huì)經(jīng)濟(jì)結(jié)構(gòu)調(diào)整和新舊動(dòng)能轉(zhuǎn)換,提高整體生產(chǎn)效率,為全球商業(yè)變革提供強(qiáng)大的技術(shù)支持。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能
ai技術(shù)

相關(guān)文章

  • IoT開發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產(chǎn)品向上

    標(biāo)簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產(chǎn)決戰(zhàn)期?

    雖然我國(guó)汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動(dòng)需求增長(zhǎng);另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對(duì)此,在7月5日-7日舉辦的2023年中國(guó)汽車論壇上,中國(guó)汽車工業(yè)協(xié)會(huì)副秘書長(zhǎng)李邵華就做出表示,“中國(guó)將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標(biāo)簽:
    人工智能
  • 匯聚中國(guó)AI頂尖力量 云天勵(lì)飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(huì)(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會(huì)的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領(lǐng)軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊(duì)”,云天勵(lì)飛作為中國(guó)人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運(yùn)營(yíng)商、科研院所等優(yōu)秀團(tuán)隊(duì)

    標(biāo)簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時(shí)代,讓人力資源回歸本質(zhì)

    這幾個(gè)月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個(gè)名詞重回C位。過去在AI1.0時(shí)代,主要通過訓(xùn)練模型來實(shí)現(xiàn)圖像識(shí)別、聲音識(shí)別、語言處理等特

    標(biāo)簽:
    ai技術(shù)
  • 新發(fā)布的PaaS2.0,能否助力涂鴉智能再起飛?

    文:互聯(lián)網(wǎng)江湖作者:志剛2023年的IoT需要一個(gè)新故事。6月29日,涂鴉智能在開發(fā)者大會(huì)上,發(fā)布了企業(yè)級(jí)戰(zhàn)略PaaS2.0,希望通過一個(gè)平臺(tái)+四大開發(fā)服務(wù),建立起IoT生態(tài)。對(duì)于這場(chǎng)發(fā)布會(huì),市場(chǎng)的態(tài)度是積極的。美東時(shí)間6月29日收盤,涂鴉智能美股股價(jià)上漲5.6%,來到1.87美元/股。近日股價(jià)穩(wěn)定

    標(biāo)簽:
    ai技術(shù)
  • 百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

    “AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

    標(biāo)簽:
    人工智能
    ai智能
  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • 宇樹科技加速?zèng)_刺科創(chuàng)板IPO,人形機(jī)器人龍頭估值飆至120億元

    “宇樹已形成硬件、算法、場(chǎng)景聯(lián)動(dòng)的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國(guó)力量?!笔壮藤Y本管理合伙人朱方文在追加投資時(shí)如是評(píng)價(jià)。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉,國(guó)內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計(jì)劃于科創(chuàng)板IPO,預(yù)計(jì)

    標(biāo)簽:
    宇樹科技
  • OpenAI推出GPT-5:AI大統(tǒng)一時(shí)代的到來?

    推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個(gè)強(qiáng)大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開發(fā)者體驗(yàn)負(fù)

    標(biāo)簽:
    chatgpt

編輯推薦