张丹丹:新生儿情绪性语音加工的正性偏向——来自事件相关电位的证据论文

摘要准确解码语音中的情绪信息能让个体更好地适应社会环境, 此能力对新生儿和婴儿尤其重要, 因为人类刚出生时听觉系统远比视觉系统发育得完善。虽然已有研究表明5～7月龄的婴儿能分辨不同情绪种类的语音, 但目前对新生儿的研究还非常少。人类是否在出生时即具有分辨不同种类情绪性语音的能力？新生儿对情绪的加工是否存在正性或负性偏向？本文选用odd-ball范式考察高兴、恐惧、愤怒三种韵律性语音在1～6天龄新生儿大脑中诱发的事件相关电位。实验1直接对比三种情绪性条件, 发现新生儿大脑的额区(F3和F4电极点)可以区分情绪性语音的正负性, 正性(高兴)语音诱发的“失匹配反应”幅度明显大于负性(愤怒和恐惧)语音。实验2采用偏差和标准刺激反转的odd-ball范式, 证实了实验1的结果并非源于三种情绪语音物理属性的差异。本文的结果提示, 新生儿大脑可自动辨别正性与负性情绪语音, 但尚不能将愤怒和恐惧两种负性语音区分开来。更重要的是, 高兴语音比两种负性语音诱发了更大的失匹配反应, 这一结果首次从神经学层面(电生理指标)为新生儿情绪性语音加工的正性偏向提供了证据。

关键词新生儿; 正性偏向; 高兴语音; 恐惧语音; 愤怒语音

1 引言

语音(即人发出的说话声)是我们在日常生活中接触最为频繁的声音类型, 它不仅能传递语义信息,还能传达说话人的情绪状态(Belin, Fecteau, & Bédard,2004)。对语音中情绪信息的准确解码能让个体更好地适应社会环境(Decety & Howard, 2013; Frühholz &Grandjean, 2013; Hawk, Van Kleef, Fischer, & Van der Schalk, 2009)。在生长发育早期, 新生儿(年龄为0～28天)及婴儿(年龄为1～12月)的听觉系统比视觉系统发育得更加完善, 因此语音中的情绪比面孔等视觉载体所传达的情绪对婴儿的生存和发展更为重要(Grossmann, 2010; Vaish, Grossmann, & Woodward,2008; Vaish & Striano, 2004)。

语音中的情绪可由语义传达, 也可通过声音的频率、响度及节律等特征的有机组合而表达(Brük,Kreifelts, & Wildgruber, 2011)。考虑到小婴儿尤其是新生儿尚不具备语义理解的能力, 本文仅探讨对后者, 即对语音中情绪性韵律(emotional prosody)的加工。新生儿的听觉系统已完全具备了加工音调的能力(Háden et al., 2009), 其大脑的右侧(相比于左侧)颞上沟和颞中回会被语音中变化的韵律显著激活(Arimitsu et al., 2011; Telkemeyer et al., 2009),同时他们的额叶对音调不停变化的语音(相比于音调一层不变的语音)有特异性的激活, 这些结果提示此发育阶段的大脑已可区分语音中不同的韵律模式(Saito et al., 2007)。在情绪性语音(或旋律)加工方面, 虽然已有研究表明, 5月龄的婴儿在听音乐时能区分悲伤和高兴的旋律(Flom & Pick, 2012),5～7月龄的婴儿能分辨不同情绪种类的语音(Flom& Bahrick, 2007), 7月龄的婴儿能捕捉到面孔与语音中一致性的情绪信息(Grossmann, Striano, &Friederici, 2005), 但目前对人类刚出生的时期, 即新生儿阶段的研究还非常少。

于是，习惯了大手大脚的韩莎，不得不算计着过日子。星巴克没了，西餐没了，进口水果也不敢买了，甚至买两斤排骨，杜飞都要心疼半天。

人类是否在出生时即具有分辨不同种类情绪性语音的能力？如果有, 新生儿对情绪的加工是否存在正性或负性偏向？这第二个问题的提出基于以下事实：已知儿童、青少年、成年人对情绪信息的加工存在负性偏向(negativity bias), 即对负性信息投入更多的注意、评价、记忆等认知资源(Ito,Larsen, Smith, & Cacioppo, 1998), 但此情绪加工的负性偏向似乎并不是与生俱来的。Vaish等人(2008)总结了基于面孔和语音的研究发现, 婴儿在6～7月龄后才表现出明显地对负性情绪的加工偏向。例如,视觉通路的研究表明, 6月龄婴儿的大脑对恐惧(相比于中性)面孔注视的物体表现出更大的中央区事件相关负成分(Hoehl & Striano, 2010); 7月龄婴儿对恐惧(相比于高兴)面孔的注视时间更长, 中央区负成分的幅度更大(Peltola, Leppänen, Mäki, &Hietanen, 2009)。听觉通路的研究表明, 7月龄婴儿的大脑对愤怒(相比于高兴和中性)语音表现出右侧颞叶的显著激活(Grossmann, Oberecker, Koch, &Friederici, 2010), 且额区及中央区呈现出更大的事件相关负成分(Grossmann et al., 2005)。而支持早期正性加工偏向的研究显示, 5月龄婴儿在听赞赏性(相比于责备性)语音时表现出更多的微笑反应(Fernald, 1993); 4月龄婴儿对高兴面孔注视的时间明显长于愤怒和中性面孔(LaBarbera, Izard, Vietze,& Parisi, 1976), 同时他们对高兴(相比于恐惧)面孔注视的物体显示出更大的额区及中央区负成分(Rigato, Farroni, & Johnson, 2010)。然而, 上述针对正负性情绪加工偏向的研究仅考察了月龄大于3月的婴儿, 目前对小月龄婴儿特别是新生儿的相关报道还非常少。

据我们所知, 仅有三项研究直接比较了新生儿对正性和负性情绪材料的加工。较早期的一项行为学研究发现, 与愤怒、悲伤和中性的语音相比, 高兴语音能在新生儿被试中引起更长时间的睁眼反应(Mastropieri & Turkewitz, 1999)。更近期的一项行为学研究考察了新生儿对高兴和恐惧面孔的注视时间, 发现他们对高兴面孔的注视时间更长(Farroni,Menon, Rigato, & Johnson, 2007)。随后Cheng等人(Cheng, Lee, Chen, Wang, & Decety, 2012)利用odd-ball范式研究了新生儿对情绪性语音加工的事件相关电位(event related potential, ERP), 首次为新生儿区分语音情绪提供了神经学层面(电生理指标)的证据。该研究发现恐惧语音比高兴语音在额-中央区诱发出了更大的失匹配电位。由于该ERP成分在新生儿中表现为正幅度(Dehaene-Lambertz,2000; Friederici, Friedrich, & Weber, 2002; Leppänen et al., 2004; Ruusuvirta, Huotilainen, Fellman, &Näätänen, 2009; Winkler et al., 2003), 与通常在成人中发现的失匹配负波极性相反, 我们称该成分为“失匹配反应” (mismatch response, MMR; Cheng et al., 2012; Zhang et al., 2014)。显然地, 在新生儿阶段仅有的三项研究对情绪加工的正负性偏向给出了相反的答案：前两项行为学实验支持正性偏向而Cheng等人(2012)的实验支持负性偏向。

本研究采用了Cheng等(2012)的情绪语音材料,该材料的有效性已经多项研究得到了证实(e.g., Fan,Hsu, & Cheng, 2013; Hung, Ahveninen, & Cheng, 2013;Zhang et al., 2014)。实验中共使用四个双音节"dada"语音, 它们分别表现出愤怒、恐惧、高兴、中性四种情绪(图1)。简言之, 语音材料的制作流程如下：一名年轻成年女性重复发出四种情绪条件下的“dada”声各15次; 这60份语音材料经由120名成年人进行情绪类型及强度的5点评分, 分别选出愤怒、恐惧、高兴、中性评分最高的4份材料作为实验材料; 利用音频编辑软件(Adobe Audition, Adobe Systems Inc., San Jose, USA)将实验材料编辑为相同的长度及响度。

2 方法

2.1 被试

实验1和实验2分别招募了25名和35名刚出生(一周内)的健康足月新生儿。两个实验中分别有7名和6名被试由于哭闹(脑电伪迹过大)未能完成数据采集。因此实验1的有效被试为18名(9男9女),胎龄38.9 ± 0.9周, 年龄3.2 ± 1.3天; 实验2的有效被试为29名(15男14女), 胎龄38.7 ± 1.0周, 年龄2.8 ± 1.2天。被试的纳入标准如下：1)出生体重符合胎龄; 2)实验前及实验过程中无异常临床表现; 3)实验前至少48小时未使用镇静剂; 4)耳声发射筛查未发现听力障碍(OAE, ILO88 Dpi, Otodynamics Ltd,Hatfield, UK); 5)生后1 min及5 min的Apgar评分不低于9分; 6) 6月龄时神经系统随访未发现异常。排除标准如下：1)缺氧缺血性脑病; 2)脑室出血或白质损伤(超声检查); 3)重度先天畸形; 4)中枢神经系统感染; 5)代谢疾病; 6)惊厥或癫痫(临床表现)。

首先验证试验系统通信时间，远程监控平台与掘进机距离为75 m，传输数据所用的网线长度为200 m，由掘进机远程监控平台向机载PCC发送1帧数据，PCC接收指令后返回共5、10、15与20 MB数据，使用工控机计时器得总通信时间为0.039 2、0.078 3、0.117 2与0.156 3 s，此数据量大小远大于系统正常运行时的正常数据传输量，因此通信时间可以满足控制需求。

需要注意的是进行仿写训练，应选准范文的仿写点，注意到内容与形式的统一，这样才能使学生吸收前人的经验，提高知识迁移的能力，从而更好地促使阅读，形成一种良性的循环。“夫缀文者情动而辞发”，学生与文本的深层次对话，在学生的情感世界里激起层层涟漪。可以说，教师创造性地运用教材，凭借读写结合的方式，引导学生把文本语言内化为自己的语言，从而实现语言的外化，达到跳出文本用语言，加深对文本的感悟，体味“语文味”。

2.2 实验材料

综上所述, 目前对新生儿情绪性语音加工的研究还非常缺乏, 且在“情绪加工的正负性偏向”问题上出现了看似矛盾的结论。新生儿被试是一组特殊的群体, 他们无法按照主试的意愿安静并专注地完成实验, 在实验中的运动伪迹等会对行为学及神经学指标产生较大的干扰, 因此对新生儿群体的研究往往需要累积较多的证据才能得出相对可靠的结论。本研究即以此为目的, 我们拟通过两项实验,利用ERP技术考察新生儿对高兴、愤怒、恐惧语音的大脑反应。参考Cheng等人(2012)的研究, 本实验采用odd-ball范式播放语音材料, 这是因为该范式比其他被动任务范式(例如两类刺激以等概率播放)在检测被试对不同刺激的分辨能力方面具有更高的敏感性(Ferrari, Bradley, Codispoti, & Lang,2010)。实验1采用经典的odd-ball范式, 在三个block中分别诱发三种情绪语音相应的ERP波形,通过直接比较三种条件下的MMR幅度考察新生儿大脑对正负性情绪的敏感性。实验2采用偏差和标准刺激反转的odd-ball范式, 一方面重复验证实验1的结果, 一方面排除实验1中情绪间MMR的差异来源于情绪语音物理属性差异的可能性。在本次研究中, 我们采用了与Cheng等人(2012)相同的实验材料。根据Cheng等人(2012)的结果, 本文假设：人类出生后即具有分辨正负情绪性语音的能力, 并且可能对负性情绪存在一定的加工偏向, 即愤怒和(或)恐惧语音比高兴语音能诱发更大幅度的MMR。

图1 四种情绪语音材料的波形图(oscillogram)和声谱图(spectrogram)。

2.3 实验过程

实验在北京大学第一医院儿科病房进行, 病房背景噪声约30dB SPL (希玛噪音计AS804, 东莞万创电子制品有限公司, 东莞, 中国)。语音材料通过入耳式主动降噪耳机播放(IER-NW500N, Sony Corp.,Tokyo, Japan), 平均响度为50 dB SPL。

被试进食结束后10 min开始实验准备(安置脑电电极等), 准备过程少于10 min。之后保持实验室安静, 让被试进入自然睡眠。实验过程中采用“振幅整合脑电图”技术(Olympic CFM 6000, Natus, Seattle,USA)实时监测被试的睡眠-觉醒状态(图2A), 振幅整合脑电图的电极放置于CP3及CP4位置, 该睡眠监测仪与本研究考察的脑电信号系统独立。被试一旦进入“活动睡眠”状态(active sleep, 相当于成人的快速眼动睡眠期)并稳定3～5 min后开始播放语音材料。振幅整合脑电图技术及新生儿睡眠分期可参考本课题组前期发表的相关文献(Zhang et al., 2011;2014)。

实验1含一个session, 每名新生儿收听高兴、愤怒、恐惧各1个block, 情绪语音作为偏差刺激,中性语音作为标准刺激。实验2含两个session, 每个session包括高兴、愤怒、恐惧各1个block。在其中一个session中, 情绪语音作为偏差刺激, 中性语音作为标准刺激; 而在另一个session中偏差和标准刺激反转, 即情绪语音作为标准刺激, 中性语音作为偏差刺激。每名新生儿进行两个session的实验, session的顺序在被试间平衡。

图2 实验及数据采集。A, 新生儿在实验中(图中的显示屏用于睡眠-觉醒状态的实时监测);B, 实验1考察的6个通道的脑电电极位置。

实验采用oddball范式(Cheng et al., 2012; Zhang et al., 2014), 被试在睡眠中被动收听情绪性语音材料。按照情绪条件, 被动收听任务包含高兴、愤怒、恐惧3个block, block之间有10 s的间隙, block的顺序在被试间平衡。每个block含500个试次, 其中标准刺激400个试次, 偏差刺激100个试次。每两个偏差刺激之间至少含两个标准刺激。每条语音刺激长度为350 ms, 刺激间隔为450～850 ms (Hirasawa,Kurihara, & Konishi, 2002; Zhang et al., 2014), 即每个block的500个试次共用时500 s (8.3 min)。

2.4 数据采集及分析

脑电数据由HANDYEEG系统采集(Micromed,Treviso, Italy), 采样率256 Hz, 电极-头皮间的电阻低于5 kΩ。以左侧乳突为参考电极。为了与已有的研究一致(Cheng et al., 2012; Zhang et al., 2014),实验1考察F3, F4, C3, C4, P3, P4共6个电极点上的脑电信号(图2B)。实验2根据Cheng等人(2012)以及实验1的结果, 简化了数据采集操作, 仅考察F3和F4电极点上的脑电信号。

㉖参见应品广《中国需要什么样的竞争中立?(下)——不同立场之比较及启示》，《中国价格监管与反垄断》2015年第3期。

脑电离线转为双侧乳突平均参考, 之后分别经过滤波(0.01～30 Hz)、分段(-200～1000 ms)、基线矫正(-200～0 ms)、剔除幅度超过±150 μV的试次。本文采用平均幅度来衡量MMR, 时间窗为语音刺激开始呈现后的300～500 ms (Cheng et al., 2012; Zhang et al., 2014)。

统计分析采用SPSS Statistics 20.0 (IBM Corp.,Somers, USA)。描述性统计量表示为“均值±标准差”。显著性水平为p〈 0.05。多重比较采用Bonferroni矫正。采用Greenhouse-Geisser方法矫正自由度。对MMR的平均幅度进行双因素重复测量方差分析,两个被试内因素分别为语音情绪类型(愤怒、恐惧、高兴)和电极点(实验1：F3、F4、C3、C4、P3、P4;实验2：F3、F4)。

本文考察的MMR是新异刺激(较之于标准刺激)在新生儿大脑诱发的一个脑电正成分, 它相当于成人大脑额区(或额-中央区)产生的失匹配负波(mismatch negativity, MMN)。听觉MMN的峰值常出现在刺激呈现后150～250 ms, 新异刺激与标准刺激的波形相减即得到一个负波(Näätänen, Paavilainen,Rinne, & Alho, 2007)。MMN反映大脑对刺激间差异的自动化的探测能力, 由于其产生不需要注意的参与, 该成分被认为是最适合用于婴儿的脑功能研究的ERP成分之一。本文及其他新生儿听觉研究(Cheng et al., 2012; Dehaene-Lambertz, 2000;Friederici et al., 2002; Leppänen et al., 2004;Ruusuvirta et al., 2009; Winkler et al., 2003)观察到的MMR可看作是MMN在发育早期的雏形, 由于新生儿的大脑发育还极为不成熟, 此阶段的MMR表现为正成分, 且潜伏期延后。已有的脑电溯源分析表明MMN/MMR的神经源在颞上沟(superior temporal sulcus, STS), 该脑区(特别是右侧STS)恰好是成人加工情绪性语音的脑区(Belin, Zatorre,Lafaille, Ahad, & Pike, 2000; Ethofer et al., 2012)。虽然由于ERP技术的低空间分辨率, 我们并不能断言情绪性语音加工的核心脑区在新生儿阶段已有相当程度的功能分化, 本文的结果至少说明人类出生时即可自动地分辨情绪性语音的正负性, 且对正性情绪信息更加敏感。

新生儿家属被告知了研究的目的和内容, 实验前均签署了知情同意书。实验方案获得了北京大学医学伦理委员会的批准。

新生儿高胆红素血症是目前临床上常见的疾病，发病率较高，多由于胆红素在体内累积过多引起[1]，发病原因尚不明确，每年约一半以上的新生儿在出生24 h后，生理性高胆红素血症会引起轻度的黄疸，主要表现为皮肤、黏膜和巩膜黄染[2]，影响患儿的肝功能代谢，严重的可导致神经系统受损，影响患儿的智力发育[3]，对患儿的生命健康造成不可逆的影响。目前临床上针对高胆红素血症采取蓝光照射治疗，而良好的护理干预措施在治疗过程中显得尤为重要。为此，我院针对新生儿高胆红素患儿在蓝光照射治疗过程中，辅助以优质护理措施，取得了良好的效果。

3 结果

3.1 实验1

情绪的主效应显著,F(2, 34)=5.27, p= 0.012,=0.235。高兴语音诱发的MMR (此处为绝对幅度; 3.49 ± 1.23 μV)显著大于愤怒语音诱发的MMR(2.90 ± 1.25 μV), p=0.010; 高兴和恐惧条件下的MMR无显著差异(3.12 ± 1.18 μV, p=0.138); 恐惧和愤怒条件下的MMR无显著差异(p=0.893)。电极点的主效应不显著,F(5, 85) 〈 1。情绪和电极点的交互作用显著, F(10, 170)=2.41, p= 0.025,=0.125 (图3)。简单效应分析表明, 在F3电极点上情绪效应显著(F(2, 34)=13.94, p〈 0.001)：高兴语音诱发的MMR (3.92 ± 1.17 μV)显著大于愤怒语音诱发的MMR (2.40 ± 1.33 μV), p 〈 0.001; 高兴语音诱发的MMR略大于恐惧语音诱发的MMR (3.15 ±1.02 μV), 但仅边缘显著, p=0.059; 恐惧和愤怒条件下的MMR无显著差异, p=0.077。在F4电极点上情绪效应显著(F(2, 34)=21.12, p〈 0.001)：高兴语音诱发的MMR (3.88 ± 1.07 μV)显著大于愤怒(2.77 ± 0.90 μV, p 〈 0.001)及恐惧(2.93 ± 1.07 μV, p =0.001)语音诱发的MMR; 恐惧和愤怒条件下的MMR无显著差异(p=1.000)。在其他四个电极点, 情绪效应不显著, F (2, 34) 〈 1。

实验2采用了偏差和标准刺激反转的odd-ball范式, 需要计算由同一种情绪语音材料诱发的偏差刺激和标准刺激间的差异波(例如高兴条件下的差异波等于高兴作为偏差刺激的ERP减去高兴作为标准刺激的ERP)。考虑到差异波的低信噪比特性,实验2招募了比实验1更多的被试(18 vs.29)以增强统计的显著性。

图3 实验1结果：三个情绪条件及中性条件的MMR波形图(F3及F4电极点)。注：中性条件的波形由标准刺激试次叠加, 由于试次数量12倍于三个情绪条件, 故波形更光滑(本文未将中性条件的幅度纳入统计分析)。

图4 实验2结果：三个情绪条件的原始波及差异波(图示数据为F3和F4电极点的均值)。A, 情绪语音为偏差刺激, 中性语音为标准刺激(重复实验1); B, 情绪语音为标准刺激,中性语音为偏差刺激; C, 同一种情绪语音诱发的差异波(偏差条件减去标准条件)。

3.2 实验2

本实验获得了三种情绪条件作为偏差刺激(图4A)和标准刺激的波形(图4B), 也计算出了同一种情绪语音诱发的偏差刺激与标准刺激之差的差异波(图4C)。当情绪语音作为偏差刺激时, 与实验1类似, 情绪的主效应显著, F(2, 56)=6.94, p= 0.002,=0.197 (图4A)。高兴语音诱发的MMR (此处为绝对幅度; 3.38 ± 1.14 μV)显著大于愤怒(2.23 ±1.56 μV, p=0.009)和恐惧语音诱发的MMR (2.37 ±1.37 μV, p=0.008); 恐惧和愤怒条件下的MMR无显著差异(p=1.000)。电极点的主效应不显著,F (1, 28) 〈1。当情绪语音作为标准刺激时, 情绪效应不显著(F(2, 56) 〈 1, 高兴= 1.45 ± 1.06 μV, 愤怒= 1.43 ±1.19 μV, 恐惧= 1.54 ± 1.15 μV; 图4B), 电极点的主效应不显著, F (1, 28) 〈 1。对差异波进行统计,发现情绪主效应显著, F(2, 56)=4.14, p= 0.021,=0.129 (图4C)。高兴语音诱发的差异波(1.97 ± 1.64 μV)大于愤怒(0.75 ± 1.72 μV, p=0.058; 边缘显著)和恐惧语音诱发的差异波(0.88 ± 1.81 μV, p=0.048); 恐惧和愤怒条件下的差异波无显著差异(p=1.000)。电极点的主效应不显著,F (1, 28) 〈 1。

选取自“有机污染物的正辛醇/水分配系数预测及QSPR研究”。将美国国家环境保护局推荐的105种优先毒性污染物作为考察对象，即样本量N=105。按化学结构可分为卤代（烷、烯）烃类，苯系物，酚类，多环芳烃类，亚硝胺类等10个类系化合物。响应分配系数实验值选自SRC公司的PHYSPROP数据库。

4 讨论

本研究采用ERP技术, 通过两项实验考察了出生后一周以内的新生儿(平均年龄3天)在被动收听不同情绪种类(高兴、愤怒、恐惧)的韵律性语音时的大脑神经响应。实验发现新生儿大脑的额区(F3和F4电极点)可以区分情绪性语音的正负性,正性(高兴)语音诱发的MMR幅度明显大于负性(愤怒和恐惧)语音。这一结果首次从神经学层面(电生理指标)为新生儿情绪性语音加工的正性偏向提供了证据。

实验1在统计时并未使用传统的“差异波”, 而是基于原始波形直接比较三种情绪条件的MMR幅度(Cheng等人(2012)的研究亦如此)。这主要是因为与健康成人的ERP数据相比, 新生儿数据的信噪比非常低(主要由运动伪迹造成), 因而使用差异波会引入较明显的噪声(减法会将标准刺激条件的噪声引入所有的情绪条件)。

本文得到的“新生儿对情绪加工的正性偏向”的结论不符合实验前的假设, 即与Cheng等人(2012)的实验结果相反。我们认为可能的原因有三点。第一, Cheng等人(2012)采用了odd-ball范式的变式(随机设计), 同时将两种偏差刺激(即高兴和恐惧语音)以各10%的概率混入到标准刺激(即中性语音)中, 继而发现恐惧语音诱发的MMR比高兴语音诱发的MMR更大。本研究采用了经典的odd-ball范式(block设计), 将高兴、愤怒、恐惧三种语音分别以20%的概率混入到3个block中, 发现高兴语音诱发的MMR比愤怒和恐惧语音诱发的MMR更大。我们认为, Cheng等人(2012)的随机设计在同一个时间段中混入了高兴和恐惧语音, 而这二者诱发的正性和负性情绪效应可能存在一定程度的相互抵消, 从而降低了结果的有效性。当然, 两种odd-ball方案中哪种更适用于考察本问题还有待进一步讨论, 此处仅提供两项研究结果不一致的可能原因。第二, Cheng等人(2012)的实验在新生儿清醒或睡眠时均有进行, 而本研究严格控制了被试的状态, 即仅在新生儿的“活动睡眠”阶段(类似于成人“快速动眼睡眠”阶段)采集ERP数据。考虑到MMN/MMR会受到睡眠-觉醒状态的影响(Hirasawa et al., 2002; Zhang et al., 2014), 这也可能是两项实验结果不一致的原因。第三, 由于眼动、体动等运动伪迹, 新生儿ERP数据的信噪比远远低于成人数据, 降低了单次实验结果的可靠性。因此, 我们认为继续进行系列实验才能对“新生儿情绪偏向”问题给出准确的回答。

本文继Mastropieri等人(1999)和Farroni等人(2007)的行为学实验, 首次提供了新生儿情绪加工正性偏向的神经电生理证据。除了直接考察新生儿对正负性情绪的加工, 还有一些研究也从侧面支持了新生儿的正性情绪偏好。例如, 不少研究发现,与“成人用语” (adult-directed speech)相比, 新生儿更偏好“婴儿用语” (infant-directed speech, 一种提高音调、加重重音、语调更欢快的说话方式) (Cooper& Aslin, 1990; Singh, Morgan, & Best, 2002), “婴儿用语”而非“成人用语”可显著激活新生儿的额区(Saito et al., 2007)。另外, 与陌生人的声音相比, 新生儿更喜欢母亲的声音(DeCasper & Fifer, 1980)。这些发现的可能原因之一是儿语和母亲的声音通常表现出更多的积极情绪(Saito, Fukuhara, Aoyama,& Toshima, 2009; Singh et al., 2002), 因此它们可作为正性情绪偏向的间接证据。前文已指出, 虽然“负性偏向”是情绪加工中的一个普遍现象, 但该偏向仅当婴儿发育到6～7月龄之后才能被稳定地观察到,而此前婴儿似乎对正性情绪信息更感兴趣(Vaish et al., 2008)。情绪加工偏好由正性向负性的转变可以通过“范围-频率假说” (range-frequency hypothesis;Parducci, 1995)进行解释。简言之, 新生儿及小婴儿在日常生活中频繁地接收到来自抚养者的积极情绪信号, 习得抚养者的正性情绪线索(例如高兴的声音或表情)与良好照料(拥抱、抚摸、喂食)的联结会使他们从抚养者那里得到更多生理养分和心理抚慰。相反, 此阶段他们暴露在负性情绪环境中的概率极小, 同时由于他们的运动能力不足, 无法主动逃避危险, 即使他们对负性线索加强了关注也并不能获得明显的生存优势。直到6～7月龄之后, 婴儿运动能力快速发展, 他们开始主动探索周边世界,伴随而来的是来自抚养者的逐渐增多的负性提示(例如父母惊恐的表情或呵斥), 婴儿此时需要对这些负性信息进行更快和更准确的加工(例如Grossmann et al., 2005; 2010; Hoehl & Striano, 2010; Peltola et al., 2009), 从而使自己免受或少受伤害。因此, 婴儿出生后先表现出对情绪加工的正性偏向, 之后再发展为负性偏向, 这对人类早期的发育和发展具有重要作用。认识此情绪加工的发展规律有利于我们制定更科学的育儿方案, 同时可帮助我们及早发现情绪和认知发育有障碍的患儿(例如自闭症患儿)。

总结来说, 本研究试图回答两个问题：新生儿能否区分不同种类的情绪？他们对情绪信息的加工是否存在正性或负性偏向？实验采用了经典的odd-ball范式以及偏差和标准刺激反转的odd-ball范式, 在三个block中分别考察高兴、愤怒、恐惧三种语音诱发的MMR。两项实验的结果一致证明,新生儿大脑可自动辨别正性与负性情绪语音, 但尚不能将愤怒和恐惧两种负性语音区分开来。更重要的是, 高兴语音比两种负性语音诱发了更大的MMR幅度, 这一结果从神经电生理的层面证实了新生儿对情绪语音加工的正性偏好。我们认为出生后的这种正性偏好是符合进化规律的一种认知模式, 它可以帮助人类在宫外发育的最早期获得更多的食物和抚养者的关爱。

参考文献

Arimitsu, T., Uchida-Ota, M., Yagihashi, T., Kojima, S.,Watanabe, S., Hokuto, I., … Minagawa-Kawai, Y.(2011).Functional hemispheric specialization in processing phonemic and prosodic auditory changes in neonates.Frontiers in Psychology, 2, 202.

Belin, P., Fecteau, S., & Bédard, C.(2004).Thinking the voice：Neural correlates of voice perception.Trends in Cognitive Sciences, 8(3), 129–135.

Belin, P., Zatorre, R.J., Lafaille, P., Ahad, P., & Pike, B.(2000).Voice-selective areas in human auditory cortex.Nature,403(6767), 309–312.

Brük, C., Kreifelts, B., & Wildgruber, D.(2011).Emotional voices in context：A neurobiologicalmodel of multimodal affective information processing.Physics of Life Reviews,8(4), 383–403.

Cheng, Y.W., Lee, S.Y., Chen, H.Y., Wang, P.Y., & Decety, J.(2012).Voice and emotion processing in the human neonatal brain.Journal of Cognitive Neuroscience, 24(6),1411–1419.

Cooper, R.P., & Aslin, R.N.(1990).Preference for infant-directed speech in the first month after birth.Child Development, 61(5), 1584–1595.

DeCasper, A.J., & Fifer, W.P.(1980).Of human bonding：Newborns prefer their mothers' voices.Science, 208(4448),1174–1176.

Decety, J., & Howard, L.H.(2013).The role of affect in the neurodevelopment of morality.Child Development Perspectives, 7(1), 49–54.

Dehaene-Lambertz, G.(2000).Cerebral specialization for speech and non-speech stimuli in infants.Journal of Cognitive Neuroscience, 12(3), 449–460.

Ethofer, T., Bretscher, J., Gschwind, M., Kreifelts, B.,Wildgruber, D., & Vuilleumier, P.(2012).Emotional voice areas：Anatomic location, functional properties, and structural connections revealed by combined fMRI/DTI.Cerebral Cortex, 22(1), 191–200

Fan, Y.T., Hsu, Y.Y., & Cheng, Y.W.(2013).Sex matters：nback modulates emotional mismatch negativity.NeuroReport,24(9), 457–463.

Farroni, T., Menon, E., Rigato, S., & Johnson, M.H.(2007).The perception of facial expressions in newborns.European Journal of Developmental Psychology, 4(1), 2–13.

Fernald, A.(1993).Approval and disapproval：Infant responsiveness to vocal affect in familiar and unfamiliar languages. Child Development, 64(3), 657–674.

Ferrari, V., Bradley, M.M., Codispoti, M., & Lang, P.J.(2010).Detecting novelty and significance.Journal of Cognitive Neuroscience, 22(2), 404–411.

Flom, R., & Bahrick, L.E.(2007).The development of infant discrimination of affect in multimodal and unimodal stimulation：The role of intersensory redundancy.Developmental Psychology, 43(1), 238–252.

Flom, R., & Pick, A.D.(2012).Dynamics of infant habituation：Infants’ discrimination of musical excerpts.Infant Behavior and Development, 35(4), 697–704.

Friederici, A.D., Friedrich, M., & Weber, C.(2002).Neural manifestation of cognitive and precognitive mismatch detection in early infancy.NeuroReport, 13(10), 1251–1254.

Frühholz S., & Grandjean D.(2013).Processing of emotional vocalizations in bilateral inferior frontal cortex.Neuroscience and Biobehavioral Reviews, 37(10), 2847–2855.

Grossmann, T.(2010).The development of emotion perception in face and voice during infancy.Restorative Neurology and Neuroscience, 28(2), 219–236.

Grossmann T., Striano T., & Friederici A.D.(2005).Infants'electric brain responses to emotional prosody.NeuroReport,16(16), 1825–1828.

Grossmann, T., Oberecker, R., Koch, S.P., & Friederici, A.D.(2010).The developmental origins of voice processing in the human brain.Neuron, 65(6), 852–858.

Háden, G.P., Stefanics, G., Vestergaard, M.D., Denham, S.L.,Sziller, I., & Winkler, I.(2009).Timbre-independent extraction of pitch in newborn infants.Psychophysiology, 46(1),69–74.

Hawk, S.T., Van Kleef, G.A., Fischer, A.H., & Van Der Schalk, J.(2009)."Worth a thousand words"：Absolute and relative decoding of nonlinguistic affect vocalizations.Emotion, 9(3), 293–305.

Hirasawa, K., Kurihara, M., & Konishi, Y.(2002).The relationship between mismatch negativity and arousal level.Can mismatch negativity be an index for evaluating the arousal level in infants? Sleep Medicine, 3(S2), S45–S48.

Hoehl, S., & Striano, T.(2010).The development of emotional face and eye gaze processing.Developmental Science,13(6), 813–825.

Hung, A.Y., Ahveninen, J., & Cheng, Y.(2013).Atypical mismatch negativity to distressful voices associated with conduct disorder symptoms.Journal of Child Psychology and Psychiatry, 54(9), 1016–1027.

Ito, T.A., Larsen, J.T., Smith, N.K.&, Cacioppo, J.T.(1998).Negative information weighs more heavily on the brain：The negativity bias in evaluative categorizations. Journal of Personality and Social Psychology, 75(4), 887–900.

LaBarbera, J.D., Izard, C.E., Vietze, P., & Parisi, S.A.(1976).Four- and six-month-old infants’ visual response to joy,anger and neutral expressions.Child Development, 47(2),535–538.

Leppänen, P.H.T., Guttorm, T.K., Pihko, E., Takkinen, S.,Eklund, K.M., & Lyytinen, H.(2004).Maturational effects on newborn ERPs measured in the mismatch negativity paradigm.Experimental Neurology, 190(S1), S91–S101.

Mastropieri, D., & Turkewitz, G.(1999).Prenatal experience and neonatal responsiveness to vocal expressions of emotion.Developmental Psychobiology, 35(3), 204–214.

Näätänen, R., Paavilainen, P., Rinne, T., & Alho, K.(2007).The mismatch negativity (MMN) in basic research of central auditory processing：A review.Clinical Neurophysiology, 118(12), 2544–2590.

Parducci, G.(1995).Happiness, pleasure, and judgment: The contextual theory and its applications.Hillsdale, NJ, US：Lawrence Erlbaum Associates, Inc..

Peltola, M.J., Leppänen, J.M., Mäki, S., & Hietanen, J.K.(2009).Emergence of enhanced attention to fearful faces between 5 and 7 months of age.Social Cognitive and Affective Neuroscience, 4(2), 134–142.

Rigato, S., Farroni, T.& Johnson, M.H.(2010).The shared signal hypothesis and neural responses to expressions and gaze in infants and adults. Social Cognitive and Affective Neuroscience, 5(1), 88–97.

Ruusuvirta, T., Huotilainen, M., Fellman, V., & Näätänen, R.(2009).Numerical discrimination in newborn infants as revealed by event-related potentials to tone sequences.European Journal of Neuroscience, 30(8), 1620–1624.

Singh, L., Morgan, J.L., & Best, C.T.(2002).Infants'listening preferences：Baby talk or happy talk? Infancy, 3(3), 365–394.

Saito, Y., Aoyama, S., Kondo, T., Fukumoto, R., Konishi, N.,Nakamura, K., … Toshima, T.(2007).Frontal cerebral blood flow change associated with infant-directed speech.Archives of Disease in Childhood.Fetal and Neonatal Edition, 92(2), F113–F116.

Saito, Y., Fukuhara, R., Aoyama, S., & Toshima, T.(2009).Frontal brain activation in premature infants' response to auditory stimuli in neonatal intensive care unit.Early Human Development, 85(7), 471–474.

Telkemeyer, S., Rossi, S., Koch, S.P., Nierhaus, T., Steinbrink,J., Poeppel, D., … Wartenburger, l.(2009).Wartenburger,Sensitivity of newborn auditory cortex to the temporal structure of sounds.Journal of Neuroscience, 29(47),14726–14733.

Vaish, A., Grossmann, T., & Woodward, A.(2008).Not all emotions are created equal：The negativity bias in socialemotional development. Psychological Bulletin, 134(3),383–403.

Vaish, A., & Striano, T.(2004).Is visual reference necessary?Contributions of facial versus vocal cues in 12-month-olds’social referencing behavior.Developmental Science, 7(3),261–269.

Winkler, I., Kushnerenko, E., Horváth, J., Čeponienė, R.,Fellman, V., Huotilainen, M., … Sussman, E.(2003).Newborn infants can organize the auditory world.Proceedings of the National Academy of Sciences of the United States of America, 100(20), 11812–11815.

Zhang, D.D., Liu, Y.Z., Hou, X.L., Sun, G.Y., Cheng, Y.W.,& Luo, Y.J.(2014).Discrimination of fearful and angry emotional voices in sleeping human neonates：A study of the mismatch brain responses.Frontiers in Behavioral Neuroscience, 8, 422.

Zhang, D.D., Liu, Y.F., Hou, X.L., Zhou, C.L, Luo, Y.J., Ye,D.T., & Ding.H.Y.(2011).Reference values for amplitude-integrated EEGs in infants from preterm to 3.5 months of age.Pediatrics, 127(5), e1280–e1287.

Early preference for positive over negative prosody in neonates:Evidence based on event-related potentials

ZHANG Dandan1,2; CHEN Yu1; AO Xiang1; SUN Guoyu3; LIU Lili3; HOU Xinlin3; CHEN Yuming1
(1 College of Psychology and Sociology, Shenzhen University, Shenzhen 518060,China)(2Shenzhen Key Laboratory of Affective and Social Cognitive Science, Shenzhen University, Shenzhen 518060,China)(3 Department of Pediatrics, Peking University First Hospital, Beijing 100034,China)

Abstract Our ability to process emotional prosody, that is the emotional tone of a speaker, is fundamental to human communication and adaptive behaviours.Very early in development, vocal emotional cues are more critical than facial expressions in guiding infants' behavior.However, the processing of emotional prosody in the very early days of life is still far from clearly understood.It is unclear whether the discrimination between prosodies with different emotional categories is present at birth.Furthermore, it is unknown whether there is a preferential orientation (negativity bias versus positivity preference) in neonates.

Here, we used event-related potentials (ERPs) to examine the ability of neonates (from 1 to 6 days old) to discriminate different types of emotions conveyed by speech prosody.The experiment was conducted in the neonatal ward of Peking University First Hospital, Beijing, China.Electroencephalogram recording was carried out when the infants were in a state of active sleep.Using an oddball paradigm, the current study investigated the neural correlates underlying automatic processing of emotional voices of happiness, fear and anger in 18(Experiment 1) and 29 (Experiment 2) sleeping neonates.In Experiment 1, each category of emotional prosody(20%) was separately mixed into emotionally neutral prosody (80%), forming three blocks with different emotions.In Experiment 2, we not only repeated the procedure of Experiment 1, but also reversed the standard and deviation stimuli in the odd-ball task.

Event-related potential data showed that the frontal scalp distribution (F3 and F4) of the neonatal brain could discriminate happy voices from both angry and fearful voices; the mismatch response (MMR) was larger in response to the deviant stimuli of happiness, compared with the deviant stimuli of anger and fear.However,the latter two stimuli, i.e., angry and fearful voices could not be differentiated.The MMR amplitudes at the other four electrodes, i.e., C3, C4, P3, and P4 did not show significant differences across emotional conditions.Note：the MMR is a prototype of the mismatch negativity, i.e.a preattentive component of the auditory ERP that shows a positive (MMR) or negative (MMN) displacement in response to deviant sounds compared to standard sounds in the oddball paradigm.

凸显社会管理成效，维护公平正义是社会管理的价值追求和最高准则，是社会管理水平高低的重要尺度。邓小平认为，维护人民群众根本利益是社会管理的价值追求。

The neural responses recorded here indicate very early preference for positive over negative stimuli, which is contrary to the ‘negativity bias’ phenomenon established in the affective prosody literature of adult and infant studies.It is suggest that the range-frequency hypothesis could help to interpret the transformation from the‘positivity preference’ during the first half year of life to the ‘negativity bias’ later in development.The present finding provides the first neuroelectrophysiological evidence for the hypothesis of positivity preference in neonatal participants.In addition, this special discrimination between positive and negative prosody in early life may provide a foundation for later emotion and social cognition development.

Key words neonate; positivity preference; happy prosody; fearful prosody; angry prosody

分类号B844

收稿日期：2018-07-31

* 国家自然科学基金(31571120), 深圳市基础研究自由探索项目(JCYJ20170302143246158), 以及北京市科委基金(Z161100002616011)的资助。

通信作者：陈玉明, E-mail：cympsy@szu.edu.cn

标签：语音论文; 新生儿论文; 情绪论文; 恐惧论文; 愤怒论文; 哲学论文; 宗教论文; 心理学论文; 心理过程与心理状态论文; 《心理学报》2019年第4期论文; 国家自然科学基金(31571120)深圳市基础研究自由探索项目(JCYJ20170302143246158)北京市科委基金(Z161100002616011)的资助论文; 深圳大学心理与社会学院论文; 深圳市情绪与社会认知科学重点实验室(深圳大学)论文; 北京大学第一医院儿科论文;