跨库语音情感识别技术研究_周锋, 张昕然, 著_9787568412230

语音情感识别（Speech Emotion Recognition，SER）是情感计算、模式识别、信号处理和人机交互领域的热门研究话题，SER的研究涉及特征提取、特征优选、分类器改进、特征融合等多种技术。语音情感识别是在同一数据库中进行的识别研究，主要应用于自然的人机交互领域，目前大部分的人机交互方式都依赖于触觉，如触屏、体感等，而语音情感计算可以帮助电子设备在人机交互中使用图像和语音作为输入，让用户与设备进行自然、直接的交流，就像人与人的交流一样。跨库语音情感识别则是在跨语料库的条件下进行的识别实验，在实际生活中的应用环境很广，如车载环境中使用的语音交互产品，以及通过视频音频刺激来进行情感状态评估的设备等。本书将全局隐空间加入情感模型，结合K近邻、核学习方法、特征线重心法和LDA算法,提出了用于情感识别的FFLDA+kemel-KNNFLC方法。针对跨库条件下情感特征类别的改进(扩充)研究,提出了基于听觉注意模型的语谱图特征提FF取方法，模型模拟人耳听觉特性,能有效探测语谱图上变化的情感特征。同时,利用时频原子对模型进行改进,取得频率特性信号匹配的优势,从时域上提取情感信息。

你还可能感兴趣

我要评论