前沿人工智能的发展现状③|算法与模型
数据、算力、算法作为人工智能的三大基本要素,相互依存、相互支撑,共同促进人工智能快速发展。本文将从算法与模型层面梳理前沿人工智能的发展现状。
|算法与模型发展现状
算法作为人工智能产业发展的核心要素之一,指的是强制给定的有限、抽象、有效、复合的控制结构,在一定的规则下实现特定的目的,具有神经网络、卷积神经网络、机器学习、深度学习等多种表现形态。对计算机来说,算法就是处理信息的原理与遵循。理想状态下,算法能够将人的思维过程以形式化的方式输入计算机,使其可以不停地执行命令从而实现所设定的目标。2022年11月30日,以ChatGPT为代表的AI大模型作为算法“作品”的新兴形态火爆出圈,推动算法走向AI大模型时代。ChatGPT发布仅一周就已拥有超过100万用户,在推出仅两个月后的2023年1月末,其月活用户已经突破1亿。作为史上用户增长速度最快的消费级应用程序,ChatGPT已然成为火爆全球的一款现象级产品。
Transformer架构开启算法模型快速发展时代,多模态通用AI大模型成为发展趋势。2017年,谷歌颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础。2018年,OpenAI和Google分别发布的GPT-1与BERT大模型,意味着预训练大模型成为自然语言处理领域的主流。以Transformer为代表的全新神经网络架构,奠定了大模型的算法架构基础,开启了大模型发展的新纪元,经历了单语言预训练模型、多语言预训练模型及多模态预训练模型发展,多模态通用AI大模型成为发展主流趋势。
我国AI大模型数量及研制主体数量可观,为市场增长提供发展新动力。2023年5月,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,在全球已发布的认知大模型中,美国和中国占比超80%,中国研发的大模型数量排名全球第二,且有超过半数的大模型实现开源。国家数据局局长刘烈宏在中国发展高层论坛2024年年会上透露,截至2024年3月25日,我国10亿参数规模以上的大模型数量超过100个,大型科技公司、科研院所和初创科技团队成为大模型研发主力军。2024年4月2日,国家互联网信息办公室发布的《生成式人工智能服务已备案信息》公告显示,截至2024年3月,我国已有117个大模型成功备案。AI大模型从专用AI作坊走向通用AI规模化工业化生产,在垂直应用领域不断深化落地,为市场增长提供发展新动力。
(摘自《前沿人工智能:发展与治理》一书,有删节)
图书简介《前沿人工智能:发展与治理》一书由清华大学文科资深教授、博士生导师,清华大学苏世民书院院长薛澜担任顾问。清华大学公共管理学院教授,人工智能国际治理研究院副院长,人工智能治理研究中心主任梁正担任主编。本书在解读前沿人工智能的技术原理、功能特征的基础上,呈现我国人工智能大模型的最新发展动态,以生动案例展现“人工智能+多场景”的价值前景,识别其在技术开发、部署和应用中产生的风险挑战,并对美国、欧盟等经济体的人工智能治理模式进行比较,深入剖析人工智能国际治理现状与挑战,提出构建前沿人工智能治理体系的发展方向和未来范式,力求为人工智能健康发展和有效治理提供有力支撑和有益参考。