国产一线二线三线女,无码AV天天AV天天爽,亚洲欧美成人一区二区三区,天天躁日日躁狠狠躁免费麻豆,网站你们懂得

“噪音獵人”讓聲音更清晰

2021.07.14

“豬肉(rou)鋪開始剁(duo)(duo)肉(rou)了,走(zou)!”王燕南(nan)小心翼(yi)翼(yi)地在肉(rou)案上放好收音(yin)(yin)設備,希望能夠采集(ji)到剁(duo)(duo)肉(rou)的聲(sheng)音(yin)(yin)。燕南(nan)及(ji)其團隊(dui)已經收集(ji)了吆喝(he)聲(sheng)、剁(duo)(duo)肉(rou)聲(sheng)和腳步聲(sheng),這(zhe)些聲(sheng)音(yin)(yin)都被用于騰訊天籟實(shi)驗室的研究項目。

對于燕南(nan)和穿(chuan)梭在大街上的(de)(de)同事(shi)而言,噪音就像他(ta)們的(de)(de)“獵(lie)物”,被他(ta)們追蹤、捕(bu)獲并(bing)銷(xiao)毀。這些工程師被戲稱為“噪音獵(lie)人(ren)”,他(ta)們運用(yong)高超(chao)的(de)(de)“捕(bu)獵(lie)”技能(neng),幫助全世界聽到更優質(zhi)、更清晰的(de)(de)聲音。

騰訊天籟實驗室的研究員正在采集室外噪音。

燕(yan)南(nan)在聲(sheng)音領域有著多年的(de)研(yan)究經驗,因此對聲(sheng)音極(ji)為敏感。他認為降噪技(ji)術可以為很多人的(de)生活帶(dai)來(lai)積極(ji)的(de)改變。

隨(sui)著(zhu)通信設備不(bu)斷更(geng)新和完善,人(ren)們的(de)(de)通話場(chang)景可能是人(ren)行道或擁擠(ji)的(de)(de)人(ren)群(qun)中(zhong)等五(wu)花(hua)八門(men)的(de)(de)地點。因(yin)此,想要改善收聽的(de)(de)效(xiao)果,重點在于了解如(ru)何降噪(zao)。

對此(ci),燕南解釋道:“我們在菜市(shi)場也能清晰地(di)聽(ting)到豬(zhu)肉(rou)鋪老板說話,是因為(wei)我們的耳(er)(er)朵選擇性地(di)屏蔽(bi)了剁(duo)肉(rou)聲(sheng)。我們團隊想要(yao)開發出比擬人耳(er)(er)功能的技術。要(yao)想消除噪音,先要(yao)識別(bie)噪音,然后再主動干預。”

這(zhe)個解(jie)決方案看似簡單,但卻(que)困擾了(le)工程師多年(nian),其難點在于如何(he)區分(fen)噪音(yin)與(yu)人的(de)聲(sheng)(sheng)音(yin)。騰訊天籟實驗室的(de)工程師坦言,聲(sheng)(sheng)音(yin)處理(li)之(zhi)所以難,是(shi)(shi)因為聲(sheng)(sheng)音(yin)資料是(shi)(shi)一(yi)維(wei)的(de)。圖(tu)像是(shi)(shi)二維(wei)的(de),視頻(pin)是(shi)(shi)三(san)維(wei)的(de),因此區分(fen)后兩種格式的(de)不同層次(ci)相對(dui)容(rong)易(yi)。

要識別音頻中的(de)(de)噪音,工程(cheng)師首(shou)先需要收集大量噪音資料,然后剪切、清理和提取這些(xie)數據的(de)(de)共同特(te)征(zheng),并將(jiang)其(qi)放入算法模型。疫情之(zhi)前,騰(teng)訊(xun)工程(cheng)師們每天都會帶著錄音設備在辦公(gong)室四處走動,捕捉同事敲(qiao)擊鍵盤的(de)(de)聲音、關(guan)門的(de)(de)聲音以(yi)及商務環境(jing)中的(de)(de)其(qi)他噪音。

騰訊天籟實驗室的工作設備。

疫(yi)情出現后,由于遠程工作的(de)需求(qiu)激增(zeng),更多(duo)人認識了(le)一款用(yong)戶(hu)過(guo)億的(de)產品:騰訊會議。這個廣受歡迎的(de)視(shi)頻會議平臺背后所采用(yong)的(de)核(he)心技術便(bian)是騰訊天籟實(shi)驗室開發的(de)AI降噪技術。

疫情前,電話會議的使用(yong)往往更(geng)為(wei)常規(gui),通話效果(guo)很好。人們一般會在(zai)特定位置使用(yong)固網電話撥入(ru)會議。通話過程(cheng)清(qing)晰可控,所需技術相(xiang)對簡(jian)單。

但疫情改變(bian)了一(yi)切。在過去的一(yi)年到(dao)一(yi)年半(ban)左(zuo)右,人(ren)們在很多(duo)不(bu)同(tong)類型的地(di)點(dian)來(lai)進行電話或視頻會議(yi),所采(cai)用的技(ji)術(shu)和網絡也各不(bu)相同(tong),這給騰訊會議(yi)團隊帶(dai)來(lai)了極為復雜的技(ji)術(shu)挑戰。工作人(ren)員需要面對延遲(chi)、語音丟包及帶(dai)寬拉升等(deng)種種新問題。

在所有挑(tiao)戰(zhan)中,最首要(yao)的(de)(de)便是識(shi)別用(yong)戶(hu)加入(ru)會議的(de)(de)地點(dian),例如機場(chang)、公(gong)共(gong)廣場(chang)、地鐵車廂(xiang)或其(qi)他嘈(cao)雜(za)的(de)(de)地方。所有聲音以不同(tong)頻率混(hun)雜(za)在一起,讓識(shi)別人聲的(de)(de)難(nan)度驟增。面對這一挑(tiao)戰(zhan),其(qi)中一個(ge)解(jie)決(jue)辦法是使用(yong)統一的(de)(de)音頻處理(li)解(jie)決(jue)方案,通過(guo)一個(ge)復雜(za)模型來辨別和過(guo)濾(lv)各種場(chang)景(jing)中的(de)(de)噪音。

騰訊多媒體實驗室高級總監商世東在實驗室工作。

騰訊會議運用人(ren)(ren)工智(zhi)能來(lai)識別和(he)增強人(ren)(ren)聲,同時減少其他(ta)不必要(yao)的聲音(yin),已(yi)實現(xian)語(yu)音(yin)通(tong)話品質提升近(jin)50%。通(tong)過分析和(he)處(chu)理噪音(yin)獵人(ren)(ren)收集(ji)的聲音(yin),包(bao)括公(gong)交(jiao)車站的嘈雜聲音(yin)、人(ren)(ren)聲、雨聲等(deng),騰訊會議團隊能夠更好(hao)地識別并消除視(shi)頻會議中出現(xian)的這(zhe)類聲音(yin),從而(er)使人(ren)(ren)聲更加清晰。

騰訊會議團(tuan)隊憑借強大(da)的(de)技術工程和(he)研究能力令這一解決方(fang)案(an)得以實現(xian),并以96%的(de)分(fen)辨準確率在(zai)世界知名的(de)行業競賽中脫(tuo)穎而(er)出(chu)。這意(yi)味(wei)著,在(zai)96%的(de)情況下,騰訊會議都能夠(gou)識(shi)別并去(qu)除多(duo)余的(de)雜(za)音。

“過去,我(wo)們的工作重(zhong)點(dian)是(shi)利(li)用新(xin)(xin)技術取得新(xin)(xin)突破、打造新(xin)(xin)產(chan)品。而(er)如今,我(wo)們將重(zhong)心放在持(chi)續改進算法(fa)(fa)上,期望(wang)能夠發現部署AI降噪技術的新(xin)(xin)方法(fa)(fa),幫助更(geng)多人(ren)。”騰訊多媒(mei)體(ti)實(shi)驗(yan)室(shi)高級總(zong)監、天籟實(shi)驗(yan)室(shi)負責人(ren)商(shang)世東(dong)說道。“借助這項技術,我(wo)們甚至可(ke)能改善老年人(ren)的生活品質。”