面向客服场景的生成匹配式大模型构建方法、介质及设备

2025年6月20日
数园网络
17

申请号:CN202311760197.4

申请人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

专利权人:华南理工大学 | 人工智能与数字经济广东省实验室(广州)

申请日:2023-12-20

授权日:2024-08-27

专利类型:发明

法律状态:授权

发明人:张通 | 邓忠易 | 陈俊龙

摘要:本发明提供了一种面向客服场景的生成匹配式大模型构建方法、介质及设备;该方法包括依次执行的模型设定阶段、预训练阶段、领域迁移阶段和下游微调阶段;预训练阶段是指:采用跨领域中文语料库的文本作为样本,对智慧客服大模型的大模型基座进行预训练;领域迁移阶段是指:采用客服场景数据作为样本;对智慧客服大模型的大模型基座进行弱监督训练;下游微调阶段是指:采用客服场景人工标注数据作为样本,对智慧客服大模型进行训练以学习新业务的相关知识。该方法分阶段逐步地实现和优化大模型的功能,使其具备深度挖掘大规模客服文本数据知识的能力,同时对新增的业务需求和变化的业务内容具备精准迁移和快速扩展的能力。

摘要附图: