6月13日,360公司发布认知型通用大模型“360智脑4.0”,又一家科技公司正式加入AI大模型队伍。去年年底以来,以ChatGPT为代表的大模型新应用掀起了人工智能发展的热潮,文心一言、讯飞星火、京东言犀、通义千问、商汤商量、混元助手等大模型应用先后亮相,有数据显示,中国10亿参数规模以上的大模型已发布79个,毫不夸张地说,“百模大战”已开启。大模型的意义是什么?我们真的需要那么多大模型吗?大模型比拼是产业发展的风口,还是过度膨胀的泡沫?


(资料图)

大模型是人工智能走向通用的关键

随着数字技术的发展,人工智能呈现出深度学习、人机协同、自主操控等新特征,以ChatGPT为代表的生成式AI应用应运而生,这类生成式AI应用背后的核心技术是大规模预训练模型即大模型。

当前,我国人工智能大模型正呈现蓬勃发展态势,《中国人工智能大模型地图研究报告》显示,中国已有14个省(区、市)开展大模型研发,从全球已发布的大模型看,中国和美国大幅领先,超过全球总数的80%。“中国在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群,涌现出多个具有行业影响力的预训练大模型。”中国科学技术信息研究所所长赵志耘在发布报告时表示。

从大模型目前的应用来看,国内通用类大模型在持续拓展应用领域,打造跨行业通用化的人工智能能力平台,应用正从办公、生活、娱乐向医疗、工业、教育等行业加速渗透,针对生物制药、遥感、气象等垂直领域的大模型应用也在不断深化落地。

“做大模型本就是人工智能的题中应有之义,以前在算力、数据条件有限的情况下做不了那么大的模型。小模型也能解决一些问题,但作用范围有限,大模型就是解决更通用、更复杂的问题,这是一个必然的方向。”智源研究院院长黄铁军在接受采访时表示。

大模型已成为人工智能从专业智能走向通用智能的关键技术。在业内人士看来,大模型凭借优越的泛化性、通用性、迁移性,有望加速通用人工智能的到来,建立万亿规模的下游应用生态,引发经济社会深刻变革。

大模型良性发展依然要去虚务实

连日来,各地纷纷加快大模型领域布局,北京市提出系统构建大模型等通用人工智能技术体系,开展大模型创新算法及关键技术研究;上海市积极培育了一批大模型研发团队,加快研究打造大模型生态集聚和创新应用高地;深圳市提出研发基于国际主流大模型的创新产品。

在商业加速落地和政策引领推动下,大模型将加速推动人工智能产业发展。但同时,各企业纷纷布局大模型,其产品存在水平参差不齐、创新不足等问题。一些测评机构发布的数据显示,国产大模型在智商、情商、工作提效能力等方面与国外大模型还有较大差距。此外,大模型需要高素质AI人才,而目前我国相关人才还不充足。

如今的人工智能“百模大战”正如当年的互联网“百团大战”,到底哪些应用留得下来,还要经过一番市场的洗礼。“最终大模型应用生态遵循赢者通吃,对于用户来说,好用才是大模型应用的关键。要鼓励大模型之间展开深度市场竞争,由市场筛选出胜利者,然后围绕1~2个胜利者,进行B端赋能,做出有中文互联网特色的AI应用。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林表示,但同时也要避免一哄而上,警惕资本的泡沫和资源的浪费,相关部门也要加强引导和规划,整合优势力量加强基础技术创新,营造有利于产业发展的良性生态。

在盘和林看来,大语言模型是通用AI,需要和很多细分行业领域结合,开发细分应用。360公司创始人周鸿祎也表示,中国进入“百模大战”,除基础能力外,更重要的是应用场景的比拼。为此,此次360发布的智脑大模型也率先落地搜索场景,并将接入浏览器、搜索、安全卫士等应用场景。

大模型训练所需要的计算和存储资源大过以往任何的互联网应用,大模型应用的成熟离不开持续的大规模算力投入以及足够的研发资金,需要足够的实力做支撑。有测算显示,GPT-3训练成本单次约500万美元,训练数据约为《人民日报》45万年的文字量。对于中国企业来说,打造聚焦中国市场实际应用场景的产品更具实际意义。

与此同时,大模型应用涉及海量的数据和应用场景,会带来许多不容忽视的安全威胁和始料未及的伦理问题,也给监管提出了新的挑战。周鸿祎表示,大模型带来很多安全挑战,360创新性建立大模型安全风险评估体系“AISE”,在开发阶段就重视安全问题。对此,监管部门也要紧跟新技术发展趋势,提前研判可能出现的安全风险。

大模型的发展说到底还是一场技术的比拼,科技巨头跃跃欲试过后,比拼噱头和抢占市场的热潮终将褪去,真正能经受住市场考验的还是技术含量高、用户体验好、落地应用实际高效的产品。对于科技巨头来说,要回到技术向善的初心上,加大算法投入,加强基础技术研发,探索出满足中国市场需求、真正有助于提升生产生活效能的大模型应用。

推荐内容