一种基于脑神经模型的音频特征提取方法

2025年6月20日
数园网络
748

申请号:CN202510912582.9

申请人:华南理工大学|人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学|人工智能与数字经济广东省实验室(广州)

申请日:2025-07-03

授权日:2025-09-23

专利类型:发明

法律状态:授权

发明人:胡滨

摘要:本发明公开了一种基于脑神经模型的音频特征提取方法,包括,获取语音信号数据,对语音信号进行预处理,分割成N个语音片段;从每个语音片段中提取表征情绪状况的声学特征,将所述声学特征归一化处理后合成多通道语音频谱图;将多通道语音频谱图输入RBA‑FE模型,输出BDI分数,根据BDI分数进行抑郁程度预测分类,根据预测分类与实际分类的差异,调整RBA‑FE模型中各网络层的参数,获得最优RBA‑FE模型进行抑郁程度检测。本发明通过模拟人脑听觉皮层中的细胞选择性,采用自适应激活机制解决LSTM的过拟合和不抗噪,实现了不同噪声干扰下抑郁语音的精准识别。

摘要附图: