一种基于脑神经模型的音频特征提取方法

2025年6月20日

数园网络

1153

申请号：CN202510912582.9

申请人：华南理工大学|人工智能与数字经济广东省实验室(广州)

专利权人：华南理工大学|人工智能与数字经济广东省实验室(广州)

申请日：2025-07-03

授权日：2025-09-23

专利类型：发明

法律状态：授权

发明人：胡滨

摘要：本发明公开了一种基于脑神经模型的音频特征提取方法，包括，获取语音信号数据，对语音信号进行预处理，分割成N个语音片段；从每个语音片段中提取表征情绪状况的声学特征，将所述声学特征归一化处理后合成多通道语音频谱图；将多通道语音频谱图输入RBA‑FE模型，输出BDI分数，根据BDI分数进行抑郁程度预测分类，根据预测分类与实际分类的差异，调整RBA‑FE模型中各网络层的参数，获得最优RBA‑FE模型进行抑郁程度检测。本发明通过模拟人脑听觉皮层中的细胞选择性，采用自适应激活机制解决LSTM的过拟合和不抗噪，实现了不同噪声干扰下抑郁语音的精准识别。

摘要附图：

CN202510912582.9-一种基于脑神经模型的音频特征提取方法

许可范围：全国

合作方式：先用后付

开放许可期限：以协商为准

联系人：司老师

联系电话：020-88322793

邮箱：ip@pazhoulab.cn