当前位置:首页 期刊杂志

不同录音环境对语音特征的影响研究

时间:2024-08-31

陈维娜, 曾庆发

(1.中国人民公安大学刑事科学技术学院, 北京 100038; 2.郑州市公安局, 河南郑州 450000)

0 引言

录音环境具有多样性,录音环境的不同对人的发音有一定的影响。在复杂多变的环境中能否确定检材录音与样本录音中的说话人系同一人,是声纹鉴定实践工作中的一道难题。

为确定不同录音环境对语音特征的改变,评估这些改变对声纹鉴定的检验结果的影响,通过实验的方式来分析和探讨,以期为声纹鉴定中语音的录制和鉴定意见的出具提供参考。

1 实验研究

1.1 实验设计

1.1.1 录音对象

实验邀请了5位在大学校园广播站从事播音主持工作的同学作为发音对象,这些同学的发音标准、稳定,抗干扰能力较强,发音人基本情况见表1。录音的内容包括试音材料和语段《北风和太阳》,其中包括丰富的单元音及复合元音。

表1 发音人基本信息

1.1.2 录音环境

实验选择宿舍、教室、食堂、操场4个场所进行录音。宿舍面积约20 m2,高度3.2 m,关闭门窗后封闭性较好,外界噪声小,基本没有混响效果。教室面积约70 m2,高度3.5 m,相对空旷,有一定外界噪声和回声。操场面积较大,比较空旷,常伴随有鸟鸣、风声、行人噪声等。食堂面积约500 m2,高度约4.5 m,噪声和混响效果较强。

1.2 实验步骤

1.2.1 录音

发音人熟悉录音语料后分别来到指定的4个录音场所,使用普通话较为自然、流畅地表达语料内容;同时用“声丽SM-008”麦克风连接联想Y480笔记本电脑进行录音,发音人与麦克风距离约为10 cm;将录音分类标注后保存成WAV格式并备份。

1.2.2 记录和分析语音特征

首先,从听觉上感受并判断同一人在不同录音环境下的语音差异;然后,通过PRAAT软件制作语音的宽带语图,观察并分析共振峰走向、音节间和音节内过渡音征等形态特征,记录下基频曲线、振幅曲线的分布特征;最后,提取元音共振峰频率值对语音特征的声学参数进行测量和分析。

1.2.3 得出实验结果

根据语音特征的记录和分析,总结归纳不同录音环境对语音特征的影响,确定不易受环境因素影响的语音特征、容易受到影响而发生变化的语音特征,为声纹鉴定实践提供依据。

2 检验与分析

2.1 听觉分析

2.1.1 宿舍环境

发音人在宿舍发音时,声音清脆,吐字清晰,语速相对平稳,音量适中;声音纯净但稍显干涩。

2.1.2 教室环境

发音人在教室发音时,有一定的混响效果,声音浑厚;在教室发音人会不自觉地降低音量,加快语速,吐字清晰度相对宿舍下降。

2.1.3 操场环境

发音人在操场发音时,音调提高,有拖音现象;声音清脆,吐字清晰,圆润感增强,干涩感降低。操场中常有多种噪声,如鸟鸣、行人脚步声、风声等,使得录音略微嘈杂。

2.1.4 食堂环境

发音人在食堂发音时,语速加快,音量也有明显提高,吐字急促,清晰度下降,混响效果明显。

同一人在上述4种不同的录音环境下朗读相同内容的语料,得到的录音样本在听感上存在差异,这些差异表现在语速、音强、音高、清晰度、饱满度等方面。其中,语速、音强、音高的不同是由于发音人在不同环境下的心理和生理主观感受不同所导致的;而语音的清晰度、饱满度等方面的差异主要是由于在不同录音环境下混响和噪声因素的干扰造成,是由于外部条件变化所致。

2.2 视谱比较

2.2.1共振峰走向特征

共振峰走向特征是指共振峰中心线在频率——时间平面上的曲线形态,它反映语音及其共振峰的动态特性。选择发音人在宿舍、教室、操场、食堂录制的4段语音中“太”、“北”、“叫”3个音节中的复合元音[ai]、[ei]、[iao]作为研究对象,观察同一发音人不同录音环境中的这些复合元音宽带语图共振峰走向特征是否存在差异,如图1~12所示。

图1~12是发音人M1在4种不同录音环境下复合元音共振峰走向的宽带语图,从中可以看出:在4种空间环境下,被检复合元音的共振峰走向特征反映均比较清晰;F1、F2的共振峰走向特征虽有细微变化,但总体比较稳定,而高次共振峰的走向呈现出不同程度的变化,其他4位发音人的共振峰走向特征也符合此规律。这说明受到不同录音环境下发音人发音状态、环境噪声和混响的影响,高次共振峰的走向特征容易产生变化,而低次共振峰的抗干扰能力较强,特征表现比较稳定。

2.2.2 音节间过渡音征

选择“大学”、“无锡”两个词语中首音节元音[a]、[u]到下一音节辅音[x]的过渡段来分析音节间过渡音征。对录音人在宿舍、教室、操场、食堂中的录音进行音节间过渡音征的观察和比较分析,根据过渡段的平稳性、连贯性,界限是否清晰,升降过程中是否出现明显断层等特点来判断同一人在不同录音环境下语音的过渡音征是否稳定,其语图是否有明显差异,如图13~20所示。

从宽带语图中可以看出,发音人F2的“大学”[a-x]过渡音征中[a]音向[x]音的攀升式过渡特点在不同环境中表现较为相似;但在宿舍和操场的录音环境下这种过渡的界限较为清晰、连贯,而在教室和食堂的录音环境下这种攀升式过渡的表现不显著、不连贯。从图中还能够发现,发音人F2的“无锡”[u-x]过渡音征中元音[u]向辅音[x]的攀升式过渡特点在不同环境中保持高度一致。这从一定程度上说明了同一人在不同场所发音时,音节间元音向辅音的过渡音征表现具有一定的稳定性,不易受到录音环境的干扰而发生较大的变化。这一规律在其他4位发音人的语音中也有所体现。

2.2.3 音节内过渡音征

对录音人在宿舍、教室、操场、食堂4种环境下语音中的音节内过渡音征进行分析。以音节“他”[ta]为例,分析音节内辅音[t]到元音[a]之间的过渡段走向形态,根据过渡段的平稳性、连贯性、是否界限清晰及其升降过程中是否出现明显断层等特点来确定同一人在不同录音环境下语音的音节内过渡音征是否也能保持稳定。结果显示同一人在不同环境下发“他”[ta]音节时,音节内辅音到元音的过渡音征基本保持一致,其过渡段较明显、清晰,没有明显的变化,如图21~24所示。

2.2.4 基频曲线

基音频率是单位时间内声带开闭的次数,也就是基音周期的倒数,简称为基频。基频是发音的重要因素之一,在不同录音环境下,基频曲线是否具有稳定性是值得探究的。提取3位男性发音人M1、M2和M3在不同录音环境下说的同一句话“有一回,北风和太阳在那争论谁的本事大”的基频曲线进行比较分析,结果如图25~36所示。

图1~12 发音人M1 4种录音环境下复合元音共振峰走向

从图25~36中可以看出发音人在宿舍和操场录音环境下的基频曲线比较相近,与在教室和食堂录音环境下的基频曲线存在一定差异。这说明,不同录音环境对发音人的基频曲线特征表现是有一定影响的,但这种影响在宿舍和操场这两类一个相对封闭、较小,一个相对开阔、较大的环境中却表现的不十分明显。

2.2.5 振幅曲线

同样选择“有一回,北风和太阳在那争论谁的本事大”这句话作为研究对象,分析比对3位男性发音人M1、M2和M3在不同录音环境下语音的能量曲线分布情况,结果见图37~48。

从图37~48中可以看出,同一发音人在不同环境中说同一段话语的能量分布均存在差异,无论是声强的绝对数值位置,还是曲线走向上都没有普遍的相同规律。分析这种现象产生的原因应该是在不同的环境下,录音人的说话状态、发音音量均不相同,导致了其音强曲线分布存在差异。

2.3 声学参数的测量与分析

选取录音人在4种不同环境下发音中的“大”、“衣”、“足”3个音节的单元音[a]、[i]、[u]进行声学参数定量分析,提取其共振峰频率数值,测量3次后取平均值再进行统计分析,结果见表2。

从不同录音环境下同一人发[a]、[i]、[u]3个单元音共振峰的峰值、均值、标准差和变异系数中可以看出录音环境对共振峰的峰值有一定的影响:对[a]音的影响较小,其共振峰峰值的变异系数均小于10%;对[i]音的F1影响较大,其变异系数超过10%,对[i]音的其他共振峰峰值影响较小;对[u]音的F1、F2影响较大,其变异系数均超过10%,F2的变异系数甚至超过了20%,对[u]音的F3、F3峰值影响较小。

图13~20 发音人F2 4种录音环境下音节间过渡音征形态

图21~24 发音人M2 4种录音环境下音节内过渡音征形态

3 实验结果

通过实验研究发现,不同的录音环境对声纹鉴定有一定的影响,这些影响表现在:

(1) 不同录音环境下同一人的发音在听感上存在差异,如语音的清晰度、饱满程度等,在一定程度上影响了语音的听觉分析。

(2) 在不同录音环境下,同一人的共振峰走向特征表现存在一定差异,其中复合元音的低次共振峰走向频谱特征F1、F2表现稳定,高次共振峰走向频谱特征F3、F4富于变化。

(3) 同一人在宿舍、教室、操场、食堂4种不同录音环境下的语音,其音节内、音节间过渡音征形态特征基本稳定,受环境的影响不大。

(4) 同一人、相同内容的发音在不同录音环境下的基频曲线特征存在差异;其中,基频曲线在宿舍和操场录音环境中表现相近,而在其他录音环境中存在明显差异。

(5) 不同录音环境对同一人发音的振幅曲线具有较大影响;即使发音内容相同,在不同录音环境下语音的振幅曲线也存在着较大的差异。

(6) 定量分析同一人发音中的[a]、[i]、[u]单元音共振峰频率,发现不同录音环境对[i]音的F1影响较大,[u]音的F1、F2影响较大;对[a]音,[i]音的其他共振峰,[u]音的高次共振峰虽有影响,但变异系数均在10%以内。

图25~36 不同发音人4种录音环境下基频曲线

图37~48 不同发音人4种录音环境下能量曲线

表2 同一发音人4种录音环境下单元音共振峰频率

4 结语

从实验中能够发现,不同录音环境因空间、场所的配置不同,影响其录制的语音在听觉分析、视谱比较和声学参数等语音特征的反映,这种影响会对声纹鉴定造成一定障碍,甚至影响到最终的鉴定结果。但是,在司法实践中,受到条件限制,不可能总是保证检材录音和样本录音是在同一空间环境下录制形成,这就要求鉴定人员在对这类案件进行检验之前要充分掌握待检录音的录制环境和条件,熟悉不同录音环境对语音特征的影响,尽量选用稳定的语音特征进行检验、鉴定,对易受到影响的振幅曲线特征、高次共振峰走向特征等慎重使用,以期科学、客观地得出鉴定意见。当然,在条件容许的情况下,应该尽可能地使检材录音和样本录音在相同环境下录制,如果条件有限,可以参考上述实验结果,选择无混响的环境,如面积较小的宿舍、办公室或开阔、噪音较小的操场、室外进行。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!