(资料图片仅供参考)

“百模大战”来了,业界几乎两天宣布一个大模型,让人不禁想起了当年的“百团大战”,谁能最后笑傲江湖?大厂们都在推大模型,百度文心一言最先,360、阿里、商汤、腾讯、科大讯飞、字节在后面紧追。

对企业来说,有了一个新难题,如何挑选一个合适的大模型?我试用了多家产品,也参考了多个同行的分析,总结了两个标准,供大家参考。

第一个,要有自研的技术。第二,有迭代优化AI的工程化能力。

我个人给大厂们推出的大模型挨个打分。百度文心一言得分最高,芯片、框架、模型、应用都有自研。接下来是商汤、阿里云,360。腾讯、科大讯飞、字节的大模型其实还在路上,只是先放出了风声。例如科大讯飞的大模型最新官宣的时间是5月6号发布。

自研好理解,迭代优化我详细说一下。比如,大模型是很消耗算力的,很多人抱怨说芯片被卡脖子,但通过工程化的方法可以提升算力的效率。

我做过一个测试,对某个应用,从芯片、框架就开始进行调优,同等算力情况下,性能可以提高100%,这就是说算力需求可以降低50%。

我预估,如果IT架构的每一层都是同一家公司的自研产品,适配性更高,性能还能再提升。

推荐内容