谁能模仿我的笔迹?AI:我比你更擅长书写!

2024年1月17日
琶洲实验室
654

在社交媒体上使用电脑字体,是否总感觉缺乏个性?试想一下,如果你能在网络聊天和发布动态时运用自己独特的手写字体,那将是多么有趣的事情!现在,这个愿望正在被琶洲实验室、华南理工大学、新加坡国立大学以及香港理工大学的学者们实现!

梦想很美好,AI来实现

常言道:“字如其人,见字如见人”。拥有一款属于自己的手写字体并在社交媒体上使用,可以更好地展示个人风格,这听起来非常酷。然而,实现这一目标却相当困难。

汉字的数量极其庞大。据最新的国标GB18030-2022《信息技术 中文编码字符集》显示,该标准包含了87887个汉字。甚至有报道称,一位视频网站的博主曾花费了18个小时来书写超过7000个汉字,期间他使用了整整13支笔,手都写麻了!

但如今,迅猛发展的人工智能技术已经能够帮助我们实现这个想法。研究者们计划提出一个会模仿笔迹的AI模型,仅需使用者提供少量的手写样本(大约15张),就能提取笔迹中蕴含的书写风格(字符的大小、倾斜程度、横宽比、笔画的长短和曲率等),并且临摹该风格去合成更多的文字,用很少的时间就可以为使用者合成一套完整的、能够体现个人风格的手写字体

路线已明确,研究正深入

为了最大化地开发、利用好笔迹模仿AI模型,研究者从应用价值和用户体验的角度出发,对模型的输入和输出模态进行了深入思考。

通常来讲,我们有两种方式可以生成文字,一种是在电脑上直接写字,即在线文字;另一种是先在纸上写好,然后拍照、扫描录入电脑,即离线文字。研究者发现,直接在电脑上写的文字包含了更多有用的信息,比如轨迹点、书写顺序等,将输出模态设置为在线文字,可以在未来广泛地运用于教机器写字和书法教育。但在日常生活中,普通用户更倾向于通过手机拍照获取离线文字,相比使用平板、触摸笔等采集设备获取在线文字更加便捷。因此,将生成模型的输入模态设为离线文字将使用户使用起来更加方便。

综上所述,研究者的目标是提出一种风格化的在线手写文字生成模型。该模型可以模仿用户提供的离线文字中的书写风格,并根据用户的需求生成具有可控内容的手写笔迹。这项工作已经被bilibili百万粉丝Up主差评君报道过,想要知道实际上手使用效果的同学们可以点击下方视频观看。目前相关论文的代码和数据也已开源,网址是https://github.com/dailenson/SDT,对此感兴趣的同学们可以尝试使用!

关键问题

为了实现上述目标,研究者们需要对两个关键问题进行深入分析:

1. 用户只能提供少量的字符样本,能否仅从这些有限的参考样本中学习到用户独特的书写风格?换句话说,是否可以通过观察少量的参考样本来学会用户的书写风格?

2. 本文的研究目标不仅需要生成可控的文字风格,还需要生成可控的文字内容。因此,在学习到用户的书写风格之后,何高效地将该风格与文字内容结合起来,从而生成符合用户期望的手写笔迹?

本期结语

屏幕前的你快开动脑筋,对于AI模仿中文笔迹,你认为还有什么需要解决的关键问题?下期推文与作者一起深入了解研究者的思考与方案,不要错过哦!

欢迎大家关注“琶洲实验室科普号”,更多人工智能与数字经济的趣味科普,等你来探!

作者介绍

参考资料

[1] Dai, Gang and Zhang, Yifan and Wang, Qingfeng and Du, Qing and Yu, Zhuliang and Liu, Zhuoman and Huang, Shuangping. Disentangling Writer and Character Styles for Handwriting Generation, CVPR. 2023.

[2] Github: https://github.com/dailenson/SDT

[3] bilibili: https://b23.tv/m8aXneY