大模型热潮引爆后,短短几个月,国内就已有数十家公司先后宣布进入大模型领域,然而到了产业落地阶段,所有人都是“摸着石头过河”,缺乏既有的行业经验、标准和指引,业界关于大模型的疑惑也越来越多。


(资料图片仅供参考)

比如,此前有不少报道称,大模型是“豪华游戏”,训练一次千亿大模型动辄要几千万美元,可是市面上为什么还会出现许多大模型?市场真的需要那么多大模型?企业选择基础大模型需要注意哪些问题?

就相关问题,百度集团副总裁侯震宇和百度智能云副总裁朱勇近日接受媒体采访,进行了解答和探讨。

大模型门槛高不高,要看是哪一类玩家

朱勇告诉记者,大模型的“门槛”是一个相对概念,因为整个大模型领域有三大类“玩家”。

第一类负责从零开始建造“基础大模型”,这一类肯定属于“豪华游戏”,无论是对数据、算力还是人才的要求都非常高。

比如在算力方面,需要大量投入大量高性能GPU芯片。在数据方面,需要“相当于几百万个人一生的阅读量”的数据量以及高质量的标注数据。除此之外还需要大量精通算法、有丰富AI实践经验的人才。“就好比是厨师做菜,不同的厨师用同样的原材料做出来的菜,口味都不一样”朱勇说。

百度智能云事业群副总裁 朱勇

第二类“玩家”负责做“行业大模型”,门槛相比第一类大大降低,行业大模型主要是在“基础大模型”的基础之上,通过注入特定行业、领域或企业数据,进行针对性的定制化,让它能更好的服务好特定行业场景。

第三类“玩家”负责在这两类大模型之上开发应用,服务最终用户,门槛较低,也是机会最多的。

简而言之,建基础大模型门槛最高,建行业大模型次之,用大模型门槛不高。

大模型没有绝对好坏,适合的才是最好的

侯震宇认为,大模型不能在单一维度上评价好坏,正如我们很难说某一款畅销的手机就一定适合某些人在某些场景下。他说:“尽管在大模型刚刚推出时,很多人经常像考它一样去问一些非常有意思的问题。但事实上,在真正严肃的企业级环境里面,不太会有这样的场景,企业应该针对企业自己的场景去选择自己更适合的大模型。”

具体到实操层面,侯震宇建议企业重点关注三个方面:模型效果、大模型开发平台提供的工具链,以及迭代速度。

在模型效果上,企业应该去测试、评估大模型在实际场景中能发挥出的能力和价值;

在开发平台方面,企业要看提供模型服务的平台是否有完整的开发工具链,这将决定企业是否能很方便地去基于模型去开发上层应用,把大模型的能力“植入”到企业场景中来。

在迭代速度方面,只有选择一个在持续快速进步的大模型,才能更好地支撑企业应用和解决方案的快速迭代,满足当下及未来的需求。

百度集团副总裁 侯震宇

谈到国内大模型在国际上的技术水平时,侯震宇认为中国的大模型技术放在整个全球来看,还是比较领先的。他说:“中国的大模型一定能发展起来也一定会发展起来。”

B端市场不需要那么多基础大模型,找准角色很重要

当记者问到“大模型领域是否出现泡沫,B端市场真的需要那么多大模型吗?”侯震宇说,如果从终局来看,市场上的确不需要那么多的基础大模型,纯粹做基础大模型最后只有少数玩家能留下来,但目前大模型领域还属于起步阶段,任何一个新的技术阶段都难免有一定泡沫,应该予以理解,因为市场需求是真实的。

他表示,大公司会比创业公司更适合做基础大模型,因为基础大模型不仅需要足够多的算力、足够多和质量好的数据,以及大量算法和AI人才的长时间积累,还需要一个易用的平台来管理、调度好各种资源,大公司会有更好的环境和资源去训练大模型,并且支持后续的模型快速迭代。

朱勇补充,尽管市场未必需要那么多基础大模型,但是一定会有很多行业大模型和定制化需求,这些都可以在基础大模型之上,用企业自己的数据去做针对性的定制化开发,这样可以兼顾成本和企业需求。相比如何去建一个大模型,企业应该更多地去思考如何用上大模型,用好大模型。

“现在每一家公司都应该去考虑如何用大模型,就像当年智能手机出来以后,我们每一家公司都应该去拥抱移动时代带来的变化。但是行业里的每一家企业是否都需要自己去做一个大模型?我觉得不一定。”侯震宇说,大模型本身的特点就已经决定了,企业拿自己数据在一个基础大模型上做微调,一样可以获得非常好的AI效果。

他建议,大模型从业者应该量力而行,根据自己能力、场景在大模型的产业链中,找准最合适自己的角色,找到自己最短的落地路径。

推荐内容