新经济导刊|从ChatGPT到AGI:大模型创新面临的挑战

2023-06-29 09:57:00BY:lyw
【字体: 打印

2022年11月30日,美国OpenAI公司发布人工智能聊天机器人程序ChatGPT,引起全球广泛关注。ChatGPT是通用人工智能(AGI,Artificial General Intelligence)发展的重要里程碑,当前AGI正成为全球新一轮数字技术竞争的新赛道和制高点,必将对未来世界发展产生深远影响。而AI大模型的出现则是一个划时代的里程碑,以ChatGPT为代表的AI大模型实现了四个突破和跨越。大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。

《新经济导刊》近期刊发阿里研究院安筱鹏的文章《从ChatGPT到AGI:大国博弈的入场券、主战场和主力军》。文章指出,以ChatGPT为代表的通用人工智能技术产业有五大特点:颠覆性、涌现性、工程化、通用性和密集型。面对美国的领先优势,中国人工智能产业正处于奋起直追的关键时期,亟待找到一条人工智能高质量发展的新路,构建完整的AI技术生态和产业生态,培育算力和AI服务的统一大市场。而我国AI大模型技术创新与产业化,面临着统一大市场、高端芯片、数据资源和创新生态等多重挑战。

一是低水平智算中心建设,消解了我国统一大市场优势。由于ChatGPT的激发作用,全国多地市区县政府纷纷计划建设近百个本地化的智算中心,为本地企业提供服务。然而,这些低水平的智算中心无法提供公共云服务,也无法支持开源模型和高质量的AI大模型发展,分散的建设模式导致了市场的割裂,缺乏统一 的服务体系。相比之下,依靠大型科技公司打造大型模型才能弥补模型层面的差距。因此,全国各地的孤立智算中心建设仅是低水平的重复努力,削弱了我国在人工智能算力和服务市场上的优势,制约了AI企业的发展和生态建设。

二是AI高端芯片出口管制,增加了算力成本、延长了追赶周期。高性能、低成本算力是AI大模型技术创新和产业化的关键资源。然而,美国对高端芯片的出口管制限制了中国的算力获取,增加了技术风险和成本。这种管制导致算力性能差距扩大,技术调度和维护成本增加。为弥补差距,需要推广云计算和大规模集群调度技术,推动公共云服务的发展,充分利用大规模集群算力和成本优势,以缩小中美AI大模型产业的差距。

三是数据的规模少、质量低和处理能力弱,降低了人工智能大模型的“智商”。大模型的“智商”取决于所训练的数据量和知识密度。在我国,大模型数据面临以下几个问题:首先,互联网中文数据相对较少,中文网站仅占世界前100万网站的1.3%;其次,数据质量不高;第三,数据处理能力相对薄弱。通用大模型的预训练语料库高达3000亿条词条,涵盖了互联网网页、GitHub代码、电子图书馆、维基百科等。然而,我国能够对这些海量数据进行清洗、加工和处理的企业可谓凤毛麟角。

四是创新生态体系尚未形成,制约了创新型企业群体涌现。中美技术竞争的核心是创新生态体系的竞争。中国当前面临的挑战,首先是缺乏颠覆性技术创新的土壤,美国一直主导着人工智能基础模型架构的突破,开启了大规模模型竞赛;其次是创新基础设施薄弱,云计算底座不稳固;三是支持新技术的政策有待完善。OpenAI的启示在于,成功需要技术信仰、长期主义、风险投资、小公司创新和大公司商业化闭环。ChatGPT等技术的差距只是表象,本质上是创新机制、创新生态、创新文化之间的差距。

(整理/李桑羽)