【摘 要】 保密會(huì)議室等重要場(chǎng)所圍護(hù)結(jié)構(gòu)的缺陷會(huì)導(dǎo)致聲音泄漏隱患。聲掩蔽技術(shù)通過(guò)產(chǎn)生特定的聲音,對(duì)泄漏的語(yǔ)音進(jìn)行干擾,是保障聲音信息安全的重要手段。本文從關(guān)鍵技術(shù)及評(píng)價(jià)方法等方面對(duì)聲掩蔽技術(shù)進(jìn)行了分析,指出目前存在的問(wèn)題,并對(duì)未來(lái)發(fā)展提出了建議,為聲掩蔽系統(tǒng)的研發(fā)、測(cè)試、使用及維護(hù)提供參考。
【關(guān)鍵詞】 聲掩蔽?聲音泄漏?聲音信息安全
1 引言
隨著信息技術(shù)的發(fā)展,利用高靈敏度拾音器、拾振器等技術(shù)手段及高效的語(yǔ)音復(fù)原方法,竊聽(tīng)者能夠在室外以非入侵方式竊取室內(nèi)的語(yǔ)音,給這些場(chǎng)所的聲音信息安全帶來(lái)嚴(yán)峻挑戰(zhàn)。
根據(jù)門(mén)、窗、墻體、管道等建筑圍護(hù)結(jié)構(gòu)和設(shè)施的聲學(xué)特性,室內(nèi)語(yǔ)音可經(jīng)由空氣傳聲和固體振動(dòng)傳聲等渠道泄漏至室外,泄漏程度與室內(nèi)聲源聲壓及其聲場(chǎng)分布、圍護(hù)結(jié)構(gòu)隔聲、室外噪聲水平、安全距離等因素有關(guān)。對(duì)聲音信息泄漏的防護(hù)可分為2種途徑:一種是屏蔽,即采用吸聲、隔聲、減振等措施將室內(nèi)聲音阻擋在場(chǎng)所邊界內(nèi)或使泄漏的聲音充分衰減,但需要對(duì)建筑圍護(hù)結(jié)構(gòu)和內(nèi)部管道等設(shè)施進(jìn)行改造,成本高昂,維護(hù)升級(jí)困難,靈活性差;另一種是干擾,即向聲音泄漏路徑或竊聽(tīng)風(fēng)險(xiǎn)位置施加其他聲音,以干擾接收者對(duì)泄漏語(yǔ)音的理解和恢復(fù),這一技術(shù)稱(chēng)為聲掩蔽(sound masking)。該方法可以彌補(bǔ)場(chǎng)所的聲學(xué)缺陷,具有使用靈活、成本低、可重用等優(yōu)點(diǎn),成為保障聲音信息安全的重要技術(shù)手段。
2 聲掩蔽技術(shù)現(xiàn)狀
聲掩蔽技術(shù)是基于人耳的聽(tīng)覺(jué)掩蔽效應(yīng)提出的,即一個(gè)聲音的存在使另一個(gè)聲音的聽(tīng)覺(jué)閾值提高而不易被聽(tīng)到的現(xiàn)象。利用掩蔽效應(yīng),通過(guò)向目標(biāo)區(qū)域施加特定的掩蔽聲,可以掩蓋和干擾泄漏的語(yǔ)音,保護(hù)語(yǔ)音信息的安全。按照防范對(duì)象,聲掩蔽技術(shù)可分為2種應(yīng)用領(lǐng)域:一種是針對(duì)無(wú)意聽(tīng)者的語(yǔ)音隱私保護(hù),常見(jiàn)于開(kāi)放式辦公室、醫(yī)院、銀行、話(huà)務(wù)中心等人員密集但隔聲不佳的場(chǎng)所,其目的在于避免談話(huà)被他人聽(tīng)到或?qū)λ嗽斐筛蓴_;另一種是針對(duì)惡意聽(tīng)者的語(yǔ)音信息保護(hù),常用于產(chǎn)生敏感語(yǔ)音信息的場(chǎng)所。二者在應(yīng)用場(chǎng)景及技術(shù)路線上有很大不同。隱私保護(hù)主要針對(duì)空氣渠道泄漏的聲音和無(wú)意收聽(tīng),通常只需使用噪聲、流水聲、音樂(lè)等較為舒緩的聲音作為掩蔽聲,以提高背景聲壓水平,技術(shù)上主要關(guān)注掩蔽效果和舒適性。而信息保護(hù)用途針對(duì)的是潛在的惡意竊聽(tīng)者,其可能使用各種先進(jìn)的拾音、拾振裝置及語(yǔ)音復(fù)原技術(shù)進(jìn)行竊聽(tīng),因而對(duì)掩蔽聲的掩蔽能力有更高的要求;除了對(duì)空氣聲泄漏的防護(hù),還需防范振動(dòng)聲泄漏隱患;同時(shí),聲掩蔽系統(tǒng)的防破解、防破壞等安全問(wèn)題也需要考慮。
國(guó)際上對(duì)聲掩蔽技術(shù)的研究起步較早,美國(guó)、澳大利亞和歐洲一些國(guó)家都研制出了較為成熟的聲掩蔽產(chǎn)品。國(guó)外也出臺(tái)了相關(guān)標(biāo)準(zhǔn)規(guī)范,如美國(guó)情報(bào)部門(mén)在2002年制定了專(zhuān)門(mén)規(guī)范,對(duì)敏感信息隔離設(shè)施的隔聲及聲掩蔽等聲學(xué)防護(hù)措施提出了要求;美國(guó)軍方也頒布了相關(guān)標(biāo)準(zhǔn)對(duì)軍用敏感信息隔離設(shè)施提出了聲音防護(hù)要求。國(guó)外研制的聲掩蔽產(chǎn)品眾多,但可獲得的技術(shù)資料和產(chǎn)品大多針對(duì)隱私保護(hù)等普通應(yīng)用,且漢語(yǔ)與英語(yǔ)有較大區(qū)別,國(guó)外技術(shù)未必適合漢語(yǔ)特征。因此,研發(fā)安全可控的聲掩蔽技術(shù)和產(chǎn)品勢(shì)在必行。我國(guó)的聲掩蔽技術(shù)、產(chǎn)品和規(guī)范目前尚不完善,聲掩蔽系統(tǒng)的有效性和安全性尚有待驗(yàn)證。
3 聲掩蔽系統(tǒng)的關(guān)鍵技術(shù)
典型的聲掩蔽系統(tǒng)通常由掩蔽聲發(fā)生器和輸出終端組成。其中,掩蔽聲發(fā)生器產(chǎn)生掩蔽信號(hào),并對(duì)其強(qiáng)度和頻譜等特征進(jìn)行調(diào)節(jié);輸出終端通過(guò)揚(yáng)聲器或激振器等換能裝置將掩蔽聲的電信號(hào)轉(zhuǎn)換為空氣聲或振動(dòng)聲信號(hào)。以下對(duì)聲掩蔽系統(tǒng)的關(guān)鍵技術(shù)進(jìn)行分析。
3.1 掩蔽聲源的設(shè)計(jì)
足夠強(qiáng)的掩蔽聲可以掩蓋泄漏的語(yǔ)音,但同時(shí)會(huì)對(duì)附近人員產(chǎn)生干擾,影響其聽(tīng)覺(jué)舒適度。因此,掩蔽聲的掩蔽效果和舒適性通常是矛盾的。掩蔽聲源的設(shè)計(jì)目標(biāo)是設(shè)計(jì)高效、舒適的掩蔽信號(hào),以更小的掩蔽強(qiáng)度達(dá)到更優(yōu)的掩蔽效果。常見(jiàn)的掩蔽聲源可以歸納為以下3類(lèi)。
3.1.1噪聲
噪聲是自然界中最常見(jiàn)的干擾聲源,因此常用作掩蔽聲,如白噪聲、粉噪聲、空調(diào)噪聲、群口噪聲(多人同時(shí)說(shuō)話(huà)的噪聲,也稱(chēng)babble噪聲)等。但噪聲與被掩蔽語(yǔ)音的相關(guān)性低,掩蔽效率不高。對(duì)常見(jiàn)噪聲掩蔽能力的實(shí)驗(yàn)表明,語(yǔ)音信號(hào)與掩蔽聲的功率比(信掩比)在-15dB以下時(shí),被掩蔽的語(yǔ)音基本不可懂,0dB以上基本完全可懂,在-10~0dB時(shí)掩蔽效果與掩蔽聲源關(guān)系密切,常見(jiàn)噪聲中babble噪聲最優(yōu)、粉噪聲次之、白噪聲最差。這是因?yàn)閎abble噪聲由多人語(yǔ)音構(gòu)成,與目標(biāo)語(yǔ)音具備一定的相似性,同其他噪聲相比有更好的掩蔽能力。例如,信掩比在-12dB時(shí)babble噪聲可使單詞可懂度下降到10%左右,而相同條件下的空調(diào)噪聲掩蔽后的單詞可懂度接近60%。但babble噪聲隨時(shí)間波動(dòng)更劇烈,且包含可被理解的語(yǔ)義信息,因此,同白噪聲等平穩(wěn)噪聲相比,相同聲壓下的舒適性較差。
3.1.2自然聲
自然界產(chǎn)生的聲音(如瀑布、降雨、溪流、鳥(niǎo)鳴、風(fēng)聲等)通常具有很好的聽(tīng)覺(jué)舒適度,對(duì)人的消極影響小,因此常用于聲景觀和聲掩蔽系統(tǒng)中。與噪聲相同,自然聲也存在掩蔽能力不足的缺陷。實(shí)驗(yàn)表明,在各種自然聲中流水聲表現(xiàn)出較高的掩蔽效率和舒適性。
3.1.3類(lèi)語(yǔ)音
聲音的掩蔽效應(yīng)可以分為能量掩蔽和信息掩蔽,前者通過(guò)掩蔽聲在時(shí)間和頻率上的能量重疊對(duì)目標(biāo)語(yǔ)音形成干擾,而后者產(chǎn)生的機(jī)理尚不十分明確,通常被認(rèn)為是掩蔽聲提高了聽(tīng)覺(jué)中樞系統(tǒng)的加工負(fù)荷,使其處理目標(biāo)語(yǔ)音時(shí)資源不足。同能量掩蔽相比,信息掩蔽利用了人腦更深層次的信息處理機(jī)制,可能以更低的能量實(shí)現(xiàn)更高效的掩蔽。研究表明,提高掩蔽聲和目標(biāo)語(yǔ)音的相似性是產(chǎn)生信息掩蔽的可能途徑,特別是認(rèn)知、語(yǔ)義等特征上的相似性會(huì)極大提高聽(tīng)者的區(qū)分難度。
類(lèi)語(yǔ)音(speech-like noise)是一種具備語(yǔ)音特征但又沒(méi)有明確語(yǔ)義的聲音信號(hào),即聽(tīng)上去有人說(shuō)話(huà)但又不知所云。類(lèi)語(yǔ)音在心理聲學(xué)特征上與被掩蔽語(yǔ)音接近,因此掩蔽效率比噪聲和自然聲更高。同時(shí),語(yǔ)義的缺失使其對(duì)周?chē)俗⒁饬Φ挠绊憸p小,有利于改善掩蔽聲的舒適性。一種實(shí)現(xiàn)策略是通過(guò)目標(biāo)語(yǔ)音來(lái)構(gòu)建掩蔽聲,以獲得二者最佳的相似性。例如,將實(shí)時(shí)采集的目標(biāo)語(yǔ)音分段并逐段進(jìn)行時(shí)間反轉(zhuǎn)可破壞其語(yǔ)義信息但保留其聲學(xué)特征,因而成為構(gòu)造類(lèi)語(yǔ)音掩蔽聲的一種有效方法,即時(shí)間反轉(zhuǎn)法。研究表明,與空調(diào)噪聲、babble噪聲等掩蔽聲源相比,時(shí)間反轉(zhuǎn)類(lèi)語(yǔ)音具有最強(qiáng)的掩蔽能力,在-12dB信掩比下句子可懂度幾乎為0。但同babble噪聲類(lèi)似,其舒適性不如平穩(wěn)噪聲和自然聲。此外,需要特別注意的是,盡管時(shí)間反轉(zhuǎn)類(lèi)語(yǔ)音生成方法可以對(duì)幀長(zhǎng)等參數(shù)進(jìn)行保護(hù),但其聲音信息完全來(lái)自目標(biāo)語(yǔ)音,一旦反轉(zhuǎn)規(guī)則被破解將完全喪失掩蔽能力,因此設(shè)計(jì)中需要更充分地考慮算法的安全性。
除上述3類(lèi)聲源外,音樂(lè)等類(lèi)型的聲音也可用作掩蔽聲。不同類(lèi)型的掩蔽聲源在掩蔽效率、舒適性及安全性方面各有不同,混合使用則有望取長(zhǎng)補(bǔ)短。例如,可以用平穩(wěn)噪聲進(jìn)行基礎(chǔ)的能量掩蔽,用類(lèi)語(yǔ)音實(shí)現(xiàn)高效的信息掩蔽,用自然聲或音樂(lè)改善舒適性,同時(shí)復(fù)雜的掩蔽聲特征也提高了竊聽(tīng)者還原目標(biāo)語(yǔ)音的難度。但可用于掩蔽的聲源眾多,混合方式及各聲源的比例不勝枚舉,如何設(shè)計(jì)出更高效、更安全、更舒適的掩蔽聲仍需進(jìn)一步研究。
3.2 掩蔽聲的調(diào)節(jié)
聲掩蔽系統(tǒng)的使用場(chǎng)景不同于傳統(tǒng)的擴(kuò)聲系統(tǒng),對(duì)聲源進(jìn)行高保真的聲音重放不是主要目的。相反,若根據(jù)掩蔽聲源、目標(biāo)語(yǔ)音及現(xiàn)場(chǎng)聲學(xué)環(huán)境的特征對(duì)掩蔽聲進(jìn)行調(diào)節(jié),則可能改善系統(tǒng)的性能。例如,針對(duì)噪聲、自然聲等作為掩蔽聲源與目標(biāo)語(yǔ)音相似度不足的問(wèn)題,可以通過(guò)濾波、均衡等處理使其具備與語(yǔ)音相近的頻譜,以提高掩蔽效率。更進(jìn)一步地,由于建筑圍護(hù)結(jié)構(gòu)的隔聲在不同頻率處不同,泄漏的語(yǔ)音與室內(nèi)語(yǔ)音在頻譜上存在較大差異,若將目標(biāo)語(yǔ)音與圍護(hù)結(jié)構(gòu)隔聲等特征作為掩蔽聲頻譜調(diào)節(jié)的依據(jù),可產(chǎn)生更高效、更精細(xì)的掩蔽聲。針對(duì)類(lèi)語(yǔ)音等掩蔽聲源與目標(biāo)語(yǔ)音特征相似而舒適性不高的問(wèn)題,向其中適當(dāng)增加混響可以在保持掩蔽效果的同時(shí)提高舒適性。根據(jù)目標(biāo)語(yǔ)音聲壓的變化自適應(yīng)地調(diào)節(jié)掩蔽聲的聲壓,可以獲得更為穩(wěn)定的掩蔽效果。此外,對(duì)掩蔽聲源進(jìn)行隨機(jī)處理可以擴(kuò)大掩蔽聲的樣本空間,提高其被破解或預(yù)測(cè)的難度,增加系統(tǒng)的安全性。
3.3 掩蔽聲的輸出
針對(duì)需要防護(hù)的聲音泄漏渠道,掩蔽聲的輸出分為空氣聲和振動(dòng)聲(或固體聲)2種類(lèi)型。
3.3.1空氣聲掩蔽
由揚(yáng)聲器作為輸出換能器,對(duì)經(jīng)由空氣傳播的聲音泄漏進(jìn)行防護(hù)。傳統(tǒng)的以隱私保護(hù)為目的的聲掩蔽系統(tǒng)大多為此種類(lèi)型,通常在圍護(hù)結(jié)構(gòu)周邊存在聲音泄漏隱患的空間內(nèi)使用,如走廊、吊頂、通風(fēng)管道等,特別是走廊內(nèi)的門(mén)、窗等薄弱區(qū)域。揚(yáng)聲器的部署位置和密度應(yīng)綜合考慮掩蔽聲的空間衰減、揚(yáng)聲器的指向性、背景噪聲水平、室內(nèi)聲源位置、聲音泄漏位置和泄漏程度等因素,使掩蔽聲的聲場(chǎng)分布與聲音泄漏的分布相匹配。
3.3.2振動(dòng)聲掩蔽
由激振器作為輸出換能器,產(chǎn)生振動(dòng)信號(hào),對(duì)經(jīng)由固體振動(dòng)傳播的聲音泄漏進(jìn)行防護(hù)。室內(nèi)語(yǔ)音將導(dǎo)致墻體、門(mén)、窗、管道等固體結(jié)構(gòu)的微弱振動(dòng),由于固體中的聲波衰減慢、傳播距離遠(yuǎn),而人耳又不易察覺(jué),故振動(dòng)成為廣泛存在但又容易被忽視的聲音泄漏渠道,也是極易被利用的泄密隱患。例如,窗戶(hù)的振動(dòng)可能被激光拾振器、指向性傳聲器等裝置在遠(yuǎn)距離外探測(cè)到,墻體的振動(dòng)可能被埋置的拾振器或光纖傳聲器采集,管道的振動(dòng)可能被遠(yuǎn)端的拾振器拾取。雖然空氣聲掩蔽裝置產(chǎn)生的聲音可以在圍護(hù)結(jié)構(gòu)上形成振動(dòng)干擾,但實(shí)驗(yàn)表明,正常聲壓下空氣聲掩蔽無(wú)法掩蓋泄漏的振動(dòng)聲。因此,在窗戶(hù)、門(mén)、墻壁、管道壁等振動(dòng)聲泄漏的高風(fēng)險(xiǎn)區(qū)域應(yīng)施加振動(dòng)聲掩蔽,并結(jié)合圍護(hù)結(jié)構(gòu)的構(gòu)造、室內(nèi)聲源分布、受控區(qū)域分布及安全距離等因素進(jìn)行綜合部署。
4 聲掩蔽系統(tǒng)的評(píng)價(jià)
4.1 有效性
對(duì)同一種掩蔽聲源,其輸出功率越高,則掩蔽能力越強(qiáng),但作為一種噪聲源對(duì)周?chē)说挠绊懸苍酱。因此,聲掩蔽系統(tǒng)的有效性可用功率約束條件下的掩蔽效果來(lái)評(píng)價(jià),或稱(chēng)為掩蔽效率。與用信噪比描述噪聲的相對(duì)功率類(lèi)似,掩蔽聲的相對(duì)功率可用“信掩比”來(lái)描述,即被掩蔽語(yǔ)音信號(hào)與掩蔽聲的功率之比,并用二者聲壓級(jí)(對(duì)空氣聲)或加速度級(jí)(對(duì)振動(dòng)聲)之差來(lái)測(cè)量和計(jì)算,也常稱(chēng)作目標(biāo)-掩蔽比(Target-to-Masker Ratio,TMR)。掩蔽效果則用掩蔽后的語(yǔ)音質(zhì)量、清晰度、可懂度等反映語(yǔ)音損傷程度的指標(biāo)來(lái)評(píng)價(jià),可以分為主觀與客觀2類(lèi)。相同信掩比條件下,若掩蔽后的語(yǔ)音質(zhì)量越差、越難聽(tīng)懂,則掩蔽效率越高。
4.1.1主觀評(píng)價(jià)
通過(guò)聽(tīng)音實(shí)驗(yàn),由受試者對(duì)掩蔽后的語(yǔ)音進(jìn)行主觀評(píng)價(jià)。常用方法包括以下2種。
(1)診斷押韻測(cè)試
國(guó)家標(biāo)準(zhǔn)GB/T 13504-2008提供了一種診斷押韻測(cè)試(Diagnostic Rhyme Test,DRT)方法,利用輔音對(duì)語(yǔ)音清晰度貢獻(xiàn)大、對(duì)噪聲敏感的特點(diǎn),設(shè)計(jì)押韻的字表,由聽(tīng)音人記錄聽(tīng)到的字,并統(tǒng)計(jì)正確識(shí)別的比例。標(biāo)準(zhǔn)將DRT得分分為5個(gè)等級(jí),其中得分小于65%時(shí),音質(zhì)評(píng)價(jià)等級(jí)為不可接受。
(2)清晰度/可懂度測(cè)試
國(guó)家標(biāo)準(zhǔn)GB/T 15508-1995提供了一種語(yǔ)言清晰度測(cè)試(speech articulation test)方法,朗讀或播放一組意義不連貫的音節(jié),統(tǒng)計(jì)聽(tīng)音人正確記錄的比例?啥葴y(cè)試可采用類(lèi)似的方法,將語(yǔ)料更換為有意義的詞或句,并統(tǒng)計(jì)聽(tīng)懂的比例。標(biāo)準(zhǔn)給出了音節(jié)清晰度與單詞可懂度的統(tǒng)計(jì)關(guān)系,清晰度在40%以?xún)?nèi)時(shí),單詞可懂度近似等于音節(jié)清晰度的1.5倍。
4.1.2客觀評(píng)價(jià)
主觀實(shí)驗(yàn)耗時(shí)耗力,現(xiàn)場(chǎng)測(cè)試時(shí)部分位置可能難以到達(dá)。因此,可以借助一些與主觀評(píng)價(jià)比較一致的客觀評(píng)價(jià)方法,以簡(jiǎn)化測(cè)試過(guò)程。常用的客觀評(píng)價(jià)方法主要有以下4種。
(1)清晰度指數(shù)
清晰度指數(shù)(Articulation Index,AI)由國(guó)家標(biāo)準(zhǔn)GB/T 15485-1995推薦,依據(jù)語(yǔ)音的各個(gè)頻帶對(duì)清晰度的貢獻(xiàn)不同,測(cè)量各頻帶的信噪比并加權(quán)平均,得到0~1之間的AI值。標(biāo)準(zhǔn)還給出了AI與音節(jié)清晰度、單詞可懂度和單句可懂度之間的統(tǒng)計(jì)關(guān)系。若要求單詞可懂度不超過(guò)20%,則AI一般應(yīng)不超過(guò)0.05,AI在該范圍內(nèi)近似等于單句可懂度。AI已被澳大利亞等國(guó)家采納為語(yǔ)音私密度的評(píng)價(jià)標(biāo)準(zhǔn),具備私密性的AI通常也不超過(guò)0.05。美國(guó)材料與試驗(yàn)協(xié)會(huì)標(biāo)準(zhǔn)ASTM E1130-16也提供了一種基于AI的開(kāi)放空間內(nèi)語(yǔ)音私密度的客觀測(cè)量方法,支持對(duì)聲掩蔽效果的評(píng)價(jià)。
(2)語(yǔ)音可懂度指數(shù)
語(yǔ)音可懂度指數(shù)(Speech Intelligibility Index,SII)在AI的基礎(chǔ)上得到改進(jìn),并納入美國(guó)標(biāo)準(zhǔn)ANSI S3.5-1997,取值也為0~1。具備私密性的SII通常不超過(guò)0.1。
(3)語(yǔ)音傳輸指數(shù)
語(yǔ)音傳輸指數(shù)(Speech Transmission Index, STI)是國(guó)家標(biāo)準(zhǔn)GB/T 12060.16-2017推薦的可懂度客觀評(píng)價(jià)方法,能夠反映包括噪聲、混響、非線性失真及擴(kuò)聲系統(tǒng)在內(nèi)的語(yǔ)音傳輸通道上各種干擾因素對(duì)可懂度的影響,取值范圍0~1,最差等級(jí)為STI<0.36。具備私密性的STI一般不超過(guò)0.1。但該方法對(duì)起伏噪聲敏感,對(duì)于類(lèi)語(yǔ)音等具備波動(dòng)性的非平穩(wěn)掩蔽聲,評(píng)價(jià)效果并不理想。
(4)語(yǔ)音質(zhì)量感知評(píng)價(jià)
語(yǔ)音質(zhì)量感知評(píng)價(jià)(Perceptual Evaluation of Speech Quality,PESQ)是國(guó)際電信聯(lián)盟(ITU)建議的基于人類(lèi)聽(tīng)覺(jué)模型的語(yǔ)音質(zhì)量客觀評(píng)價(jià)算法。其主要過(guò)程是將原始語(yǔ)音與處理或失真后的語(yǔ)音經(jīng)過(guò)電平調(diào)整、濾波、時(shí)間對(duì)齊和聽(tīng)覺(jué)變換,提取其失真參數(shù)并映射成反映主觀平均意見(jiàn)分(Mean Opinion Score,MOS)的客觀分值,范圍-0.5~4.5。MOS將語(yǔ)音質(zhì)量分為5級(jí),最差等級(jí)分值為1。研究表明,PESQ<2.3時(shí),句子可懂度<50%;PESQ<2.0時(shí),句子可懂度<20%。但語(yǔ)音可懂度與語(yǔ)音質(zhì)量并不完全一致,特別是對(duì)低質(zhì)量語(yǔ)音,即低質(zhì)量并不一定意味著低可懂度。實(shí)驗(yàn)發(fā)現(xiàn),極低質(zhì)量的語(yǔ)音(如信噪比低于-5dB)PESQ得分與語(yǔ)音失真程度的關(guān)聯(lián)不再顯著。這是因?yàn)闃O低信噪比下語(yǔ)音被噪聲淹沒(méi),PESQ算法對(duì)語(yǔ)音的分析和處理(如時(shí)間對(duì)齊)將出現(xiàn)較大誤差,導(dǎo)致結(jié)果的不確定性加劇。
表1 聲掩蔽有效性的評(píng)價(jià)指標(biāo)
上述客觀指標(biāo)主要針對(duì)較高質(zhì)量語(yǔ)音的評(píng)價(jià)進(jìn)行設(shè)計(jì),在評(píng)價(jià)聲掩蔽系統(tǒng)或語(yǔ)音私密性方面存在局限性或未經(jīng)驗(yàn)證;同時(shí),能否用于評(píng)價(jià)振動(dòng)聲掩蔽的效果也有待研究。表1匯總了上述主、客觀評(píng)價(jià)指標(biāo),其中參考值為依據(jù)現(xiàn)有文獻(xiàn)給出的取值范圍。需要說(shuō)明的是,公開(kāi)文獻(xiàn)大多針對(duì)語(yǔ)音的隱私保護(hù),并未考慮各種竊聽(tīng)手段的威脅,而安全防護(hù)應(yīng)用通常有更高的要求,故參考值僅用于排除可能的語(yǔ)音泄漏隱患,不能作為評(píng)價(jià)保密性的依據(jù)。同時(shí),對(duì)低質(zhì)量語(yǔ)音的客觀評(píng)價(jià)結(jié)果通常不穩(wěn)定,可以允許一定的波動(dòng)。
此外,美國(guó)材料與試驗(yàn)協(xié)會(huì)標(biāo)準(zhǔn)ASTM E2638-10提供了一種封閉房間語(yǔ)音私密性的客觀測(cè)量方法,得到室外薄弱位置處的信噪比和語(yǔ)音隱私等級(jí)。但該標(biāo)準(zhǔn)只針對(duì)房間邊界外發(fā)生的有意或無(wú)意竊聽(tīng),不適用于借助電子或電聲設(shè)備進(jìn)行的惡意竊聽(tīng)。
4.2 安全性
聲掩蔽系統(tǒng)的安全性尚無(wú)明確界定,本文從聲掩蔽系統(tǒng)可能面臨的攻擊入手,對(duì)安全性進(jìn)行分析。
4.2.1主動(dòng)攻擊安全防護(hù)
主動(dòng)攻擊通過(guò)對(duì)聲掩蔽系統(tǒng)的入侵或破壞使其失去防護(hù)能力,如篡改掩蔽聲源和系統(tǒng)設(shè)置、破壞或替換輸出終端等。針對(duì)此類(lèi)攻擊,聲掩蔽系統(tǒng)應(yīng)具備權(quán)限管理策略,并設(shè)計(jì)聲源、線路、終端等組件的異常監(jiān)測(cè)及報(bào)警功能。
4.2.2被動(dòng)攻擊安全防護(hù)
被動(dòng)攻擊指通過(guò)對(duì)聲音信號(hào)的采集和分析,從中去除或削弱掩蔽聲并修復(fù)目標(biāo)語(yǔ)音。被動(dòng)攻擊的手段多樣、隱蔽且不斷發(fā)展,要求聲掩蔽系統(tǒng)在設(shè)計(jì)和使用過(guò)程中應(yīng)更加謹(jǐn)慎,建議遵循以下原則。
(1)掩蔽聲的產(chǎn)生應(yīng)具備良好的隨機(jī)性和非周期性。
(2)不同的設(shè)備應(yīng)避免使用相同的掩蔽聲源,并應(yīng)經(jīng)常更換。
(3)掩蔽聲與目標(biāo)語(yǔ)音的相關(guān)性應(yīng)適度。二者特征越接近,越難被分離;但掩蔽聲的生成不應(yīng)過(guò)度使用目標(biāo)語(yǔ)音的特征,特別是與語(yǔ)義、聲紋等敏感信息相關(guān)的特征,以防止通過(guò)分析、破解掩蔽聲而實(shí)施的信息竊取。
4.3 舒適性
掩蔽聲的存在將對(duì)周?chē)娜水a(chǎn)生干擾,導(dǎo)致聽(tīng)覺(jué)舒適性降低。舒適性一般以人的主觀感受來(lái)評(píng)價(jià),如滿(mǎn)意度、煩惱度、干擾度、侵入感、自然度、注意力集中度等。盡管在保密場(chǎng)合下,舒適性不是關(guān)注的重點(diǎn),但良好的舒適性將提高參與者合理使用聲掩蔽系統(tǒng)的積極性。因此,聲掩蔽系統(tǒng)的設(shè)計(jì)和部署還應(yīng)綜合考慮掩蔽效果和舒適性的平衡問(wèn)題。一般來(lái)說(shuō),相同聲壓條件下,平緩的聲音比劇烈波動(dòng)的聲音更舒適,如平穩(wěn)噪聲比babble噪聲舒適、流水聲比雷聲舒適;沒(méi)有語(yǔ)義或聽(tīng)不懂的聲音比能聽(tīng)懂的聲音更舒適,如類(lèi)語(yǔ)音和外語(yǔ)通常比母語(yǔ)更不容易分散人的注意力;此外,通過(guò)控制室內(nèi)說(shuō)話(huà)音量、設(shè)置安全距離、合理使用振動(dòng)聲掩蔽等都可以減小所需的掩蔽聲聲壓,從而改善舒適性。
5 結(jié)語(yǔ)
在聲音信息泄漏途徑多而隱蔽、竊聽(tīng)手段日益先進(jìn)的形勢(shì)下,聲掩蔽技術(shù)的應(yīng)用將是一項(xiàng)復(fù)雜的系統(tǒng)工程。如何設(shè)計(jì)高效、安全、舒適的聲掩蔽系統(tǒng),以及如何準(zhǔn)確、可靠地進(jìn)行評(píng)價(jià),都有待進(jìn)一步研究。未來(lái),隨著我國(guó)對(duì)聲音信息安全的日益重視和相關(guān)標(biāo)準(zhǔn)的出臺(tái),聲掩蔽技術(shù)和產(chǎn)品將得到快速發(fā)展和廣泛應(yīng)用。
(原載于《保密科學(xué)技術(shù)》雜志2023年3月刊)