问策数字经济|琶洲实验室陈俊龙院士:从创新和应用两端发力大模型

2023年7月18日
琶洲实验室
685

“大模型的涌现,并不意味着这个行业的门槛低。人工智能大模型的研发需要高超的技术实力和丰富的经验,而且需要大量的计算资源和时间来训练和优化模型。因此,能够发布大模型的厂商通常都具备较高的技术水平和资源实力。”

琶洲实验室副主任、欧洲科学院院士陈俊龙建议,注重产业综合规划,打响广东大模型招牌,一是推动应用场景的横向拓展,实现全场景、全产业链落地应用;二是推动模型的纵向拓展,发展AI智能通用大模型。

“大模型热”是市场需求

南方+:各大厂商都在发布大模型,您认为背后还存在哪些因素?

陈俊龙:大模型的兴起,背后可能存在以下因素:首先是市场需求,大模型通常在解决复杂问题上有更强的性能。面对自然语言处理、图像识别、智能推荐等方面的各种挑战,像各大运营商的智能客服、安全领域的智能监控系统、电商平台的智能推荐系统等等都需要大模型的加持,以提供更准确、更智能的解决方案,满足市场需求,所以大家都在做。

其次是出于技术竞争需要,人工智能领域是一个高度竞争的行业,各大厂商都希望在技术上保持领先地位。发布大模型是技术实力和创新能力的展示,“秀肌肉”能为企业赢得声誉和市场份额。国内厂商例如百度,利用大模型业务推动,核心经营利润率自去年同期的17%增长至23%。

再次是数据、算力、算法的提升。发布大模型需要大量的数据和强大的算力,随着数据的积累和计算技术的进步,更多的企业能够满足发布大模型的条件。人工智能行业的一个“奇点”已来,可以说,大模型的涌现是必然。OpenAI在2021年推出了名为Codex的大型代码生成模型,该模型具备强大的代码理解和生成能力,最终问世的ChatGPT是长期技术积累的结果。

此外,前期布局也很重要,人工智能公司在这些方面有坚实基础,政府、院校、企业足够重视。大模型是人工智能合作和共建的重要平台,可以促进国内外的学术交流、技术分享、开源开放、标准制定等,构建更加健康和可持续的人工智能生态圈。

从基础理论、应用落地两端发力

南方+:大模型在发展中,还存在哪些挑战?

陈俊龙:首先,挑战来自于数据安全和隐私保护。大模型需要大量的高质量数据进行训练优化,但获取和处理这些数据可能面临一些挑战,如数据收集和隐私保护。这涉及到存储、处理和传输等多方技术和设施建设。其次,投资成本高:大模型需要庞大的计算资源来进行训练和推理。这可能导致高昂的成本和能源消耗,需要承担较高的风险。

此外,还面临道德和伦理问题:大模型的应用涉及到一些重要的道德和伦理问题,如公平性、公正性、歧视等。这是一个重要的挑战,是技术开发和应用无法绕开的问题。

南方+:以ChatGPT为代表的大模型,留下了怎样的启示,国内如何补短板,提高一些“根技术”的突破?

陈俊龙:长远来看,国内在大模型的功能和先进性上,离全球顶尖水平并没有特别大的差距。为了补齐短板,我们的学科建设、人才培养、政策扶持需要在以下方向发力:

注重跨国科研合作。中美两国在人工智能领域是全球的领头羊,然而单打独斗是不可取的。美国的 AI 领域高水平论文平均引用率为 44.99,中国的 AI 领域高水平论文平均引用率为 31.88。相比而言,中美合作论文的平均引用率达 51.2,其影响力明显高于中国和美国各自论文的平均引用水平,这表明跨国合作的科研成果在世界人工智能研发领域的展示和交流几率大大增加。

注重体系能力。我国的人工智能产业在应用端和服务端有极大的先发优势和广大的市场,但在人工智能基础理论方面的研究较欠缺。过去的研究中,往往展现市场带动研发的姿态,我们应当发挥政校引导优势,建立项目目标指引,从个别据点转为体系统筹,从基础理论、应用落地两端发力,使AI行业呈现健康的发展姿态。

注重底层硬件和框架自研。受限于AI高性能芯片的缺失,我国大模型的高算力需求终将面临瓶颈。需要加强芯片的设计和制造能力,提高芯片的性能和能效,多支持、扶持华为昇腾、摩尔线程等芯片、计算卡相关的设计和生产主体。此外,人工智能框架是搭建模型的基础,包括TensorFlow、PyTorch等。我国也有相应的深度学习框架,如百度的PaddlePaddle、华为的MindSpore,但知名度和普及率远不及前者。需要加强对框架的研究和开发,提高框架的性能和易用性。

推动各方资源开放共享

南方+:目前,深圳、琶洲等地纷纷发布政策措施,对政府来说,可以从哪些方面,推动AI大模型发展?

陈俊龙:政府应注重与资源、院校、用户的四方协同,合理制定发展战略:

发挥计算资源优势。在广州人工智能公共算力中心、深圳鹏城云脑、横琴人工智能超算中心、韶关数据中心集群的算力保障下,政府应大力推广算力共享与服务,促进院校与企业摆脱设备限制、简化软硬件平台的采购维护流程,将重心投入到算法和服务的研发中。

发挥实验室科研创新优势,推进“政产学研”共建。充分利用市内各高校、省属研究机构等实验室的人才优势,鼓励联合培养、资源共享等模式,以高福利、高待遇、高保障吸纳本土人才,培养人工智能专家。

坚守用户为本,宣传、开发人民需要的产品应用。随着创新形态演变,大众成为创新的主体,人工智能行业尤为突出。政府可以带头从政务服务、应用平台着手,将技术优势落到实处,创造社会价值。

政府牵头和谋划,让企业间共享发展机遇,实现互联互通、互利共赢。利用政府服务力量撬动社会资源和调配研究重心,各企业在把握核心竞争力的前提下,以开放式的姿态加入人工智能生态圈,深化跨领域互补、同领域合作,避免恶性竞争。

南方+记者 郜小平

阅读原文