一种从自然语言描述文本中重建出三维人体的三维重建方法及装置

2025年6月20日
数园网络
790

申请号:CN202411770211.3

申请人:人工智能与数字经济广东省实验室(广州)

专利权人:人工智能与数字经济广东省实验室(广州)

申请日:2024-12-04

授权日:2025-09-30

专利类型:发明

法律状态:授权

发明人:谭明奎 | 杨逸凡 | 张书海 | 邓泽帅 | 刘东 | 黄子雄 | 罗海林 | 周凯 | 杨嘉豪

摘要:本申请涉及一种从自然语言描述文本中重建出三维人体的三维重建方法及装置,涉及计算机视觉技术领域,该方法包括:通过人体模版构建的初始三维高斯场进行图像渲染,得到人体图像和深度图像,利用目标时刻的高斯噪声对图像进行加噪,得到噪声图像集,噪声图像集结合提升权重的提示词进行扩散估计,得到上一个时刻的高斯噪声,结合两个时刻的高斯噪声进行梯度回传,并利用三维高斯场中的手部深度图进行损失更新,得到更新后的进行三维重建后的三维人体。本申请利用深度损失,对齐人体模型与局部身体部位深度,从而使得生成的3D人体能精确捕捉到人体部位的复杂特征,恢复精细的人体部位,解决现有的三维人体构建技术无法生成精确的身体部位的问题。

摘要附图: