在德國漢諾威工業(yè)博覽會的機械展區(qū),中國參展商與意大利采購商熱烈交談,周圍是高分貝的嘈雜人聲;在東莞智能工廠內(nèi),中外技術(shù)人員圍繞流水線探討工藝改進,多語種對話夾雜著機器運轉(zhuǎn)聲;在大阪國際機場的安檢區(qū)內(nèi),多國旅客就行李安檢要求進行溝通,四周交織著安檢設(shè)備的提示音與工作人員的指令聲……當全球化交流從安靜的會議室走向展會、工廠、機場等復雜聲場,傳統(tǒng)翻譯設(shè)備在聲源交織、噪聲干擾下的“失聰”問題日益突出。作為人工智能領(lǐng)域的 “國家隊” ,科大訊飛適時推出訊飛雙屏翻譯機 2.0,為跨語言溝通難題帶來創(chuàng)新性解決方案。
談及該產(chǎn)品的研發(fā)理念,科大訊飛翻譯業(yè)務(wù)線產(chǎn)品總監(jiān)孫境廷表示,“從技術(shù)中來,到用戶中去,技術(shù)創(chuàng)新優(yōu)化用戶體驗”。為切實解決用戶在商務(wù)談判、國際展會、跨國旅行等復雜場景下“聽不清、譯不明”等痛點,科大訊飛將最前沿的強降噪技術(shù)與智能硬件相融合,讓科技真正服務(wù)于真實使用場景,不斷優(yōu)化用戶體驗。

首先,訊飛雙屏翻譯機 2.0的內(nèi)部構(gòu)造暗藏玄機,五顆高靈敏麥克風以“星型陣列”分布于機身左右兩側(cè)及底部, 這種創(chuàng)新型空間布局使訊飛雙屏翻譯機 2.0能夠360度全向收音,如同人類雙耳通過聽覺神經(jīng)協(xié)同工作來判斷聲音方向。
如果說五麥陣列是訊飛雙屏翻譯機 2.0的“聽覺器官”,那么場景化AI強降噪引擎則是賦予其“智能聆聽”能力的“中樞大腦”。傳統(tǒng)主動降噪技術(shù)(ANC)通過反向聲波消除所有外部聲音,這種簡單粗暴的處理模式在耳機場景中尚可奏效,但面對翻譯機復雜的溝通場景卻力不從心——因為翻譯需求并非追求極致安靜,而是完整保留目標語音信息。
為了解決這一難題,科大訊飛將突破口對準人工智能領(lǐng)域的經(jīng)典難題“雞尾酒會問題”,該現(xiàn)象由英國科學家Cherry于1953年提出,揭示了人類大腦在嘈雜環(huán)境中鎖定目標語音的超凡能力。受這一難題的啟發(fā),科大訊飛通過深度強化學習與深度神經(jīng)網(wǎng)絡(luò)的協(xié)同運作,讓訊飛雙屏翻譯機 2.0具備了“主動聆聽”的智慧。

當訊飛雙屏翻譯機 2.0進入工作狀態(tài),內(nèi)置算法引擎會在用戶周邊1米范圍內(nèi)構(gòu)建起虛擬的“語音保護區(qū)”;自適應(yīng)注意力機制的引入,讓翻譯機真正擁有了“會思考的大腦”,懂得分辨哪些是需要捕捉的人聲,哪些是該摒棄的雜音。
這場關(guān)于翻譯設(shè)備的技術(shù)革新意義深遠,訊飛雙屏翻譯機 2.0以五麥星型陣列的“聽覺仿生”與場景化AI強降噪引擎的“智能思考”,構(gòu)建起應(yīng)對復雜聲場的“雙重護盾”,將“聽得清、分得明”的核心能力注入每一次跨語言溝通。它不僅是人工智能技術(shù)與翻譯場景深度融合的典范之作,更是打破語言壁壘、讓全球化交流從“能溝通”邁向“高效溝通”的“橋梁工程師”,為多元文化互鑒、跨國協(xié)作共贏開辟了新范式。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!