探秘文心一言，内测近2月发生了什么|天天新动态

您的位置：首页 > 聚焦 > 正文

来源：经济观察报发布时间2023-05-11 06:26:53

经济观察网记者任晓宁 时至5月，大模型的热度仍在持续。上周科大讯飞刚刚发布大模型产品，这周小红书又传出成立大模型团队的消息。目前已经有数十家公司推出大模型，被外界戏称为“诸神之战”。

一众互联网企业中，百度是国内最早推出大模型产品内测的公司。目前有15万家企业申请接入百度的大模型产品文心一言，合作的外部公司数量也最多。文心一言的演进过程，可以看作国内大模型行业一个缩影。

3月16日，百度文心一言公开邀测，现在已有近2个月时间。这段时间，百度的大模型有哪些改变，做了哪些落地？与其他大模型有哪些不同进展？5月9日，经济观察网记者就此采访了百度集团副总裁侯震宇。

【资料图】

成本大规模下降

提到大模型，很多人第一反应是贵，比如投身大模型赛道的创业者王慧文等人，需要自带5000万美元入局。外部流传的数据是，大模型训练一次需要花3个月时间，需要花近1000万美元。

不过侯震宇告诉记者，大模型真不像很多人想象的那么贵。“做大模型有点贵，用大模型没那么贵，”尤其是使用大模型的企业，做再训练或是微调，所处理的数据、算力规模，与从零开始训练千亿大模型的规模，完全不在一个量级。

当下推出大模型的公司数十家，谁能成为最终胜利者？侯震宇认为，效果和成本，将是决定大模型能不能成的关键因素。

3月16日以来，百度文心一言已内测近两个月，完成了4次技术版本升级。推理成本降到了十分之一，推理性能提升近10倍。

“当别人刚刚思考如何进行训练的时候，我们已经在推理上冲出了很远。”5月4日，李彦宏在百度内部大会上这样说。

侯震宇告诉记者，接下来，文心一言还会有大规模成本下降。包括模型微调、模型再训练、模型使用等，“价格不会成为大家使用或者拥抱大模型的瓶颈。”

当前，国外大模型公司亏损正在增加中。近期国外媒体The Information报道称，大模型鼻祖去年OpenAI亏损额翻倍，达到5.4亿美元。侯震宇提到，百度不会这样，因为百度一开始就非常注重在成本和性能上的优化。“大模型对于百度来说，是一定要做的。而且我们也可以让成本更低。”

对比国外，国内大模型公司的成本会较低。“我们的电更便宜，云服务也更便宜。微软云的毛利大概有60%，国内没有几家云厂商能有这样的利润。”侯震宇认为，OpenAI的亏损，是国外特定场景，也是先驱者的探路成本，国内大模型平台不会一样。

当然，国内大模型产品目前都没有公开测试，这也是成本相对可控的原因之一。

从科幻落地现实

对于百度，文心一言内测前后是一个分水岭。用侯震宇的话说，内测前也有客户找上门，当时他们聊的，就像是科幻片里的题材。

3月份来到百度的客户，主要由各个公司一把手、CEO带队。他们都很兴奋，觉得大模型什么都能做，想法天马行空。但现在看，大模型并不是万能的，它需要几个要素：接收到更多的知识，并且真正在实际场景落地。

3月份文心一言刚内测时，人们流行问它一些刁难古怪的问题，或是让它写一篇小作文，考几道数学题。现在不一样了，侯震宇前几天见了一个机器人公司，他们考虑的是，怎样通过文心一言，让自己的机器人变得更智能。

最近找到文心一言的人，职级比三月份有所降低，不再是公司一把手，而是各个公司业务或技术负责人。但侯震宇很高兴，因为这说明文心一言已经开始真正落地了。

有一个客服公司，接入文心一言后，同样产出文字回复的成本，每万字从100元降低到1元。这家公司成本因为使用大模型而降低，是他们愿意尝试这个新鲜事物的原因。

金山办公近期也在与文心一言联合测试。金山办公助理总裁田然称，百度大模型的迭代速度很快，并在多个方面取得了优势。目前在意图理解、PPT大纲生成、范文书写、待办列表生成、文生图等多模态生成方面，金山办公与文心一言正联合测试。

近两个月内，文心一言在生物医药、汽车、芯片等领域也有落地。和百图生科联合构建了生物超算平台，训练超千亿级的多模态大模型，进行创新药物的研发。和长安汽车构建了人工智能基础设施平台，双方基于文心一言联合研发了一款新的人工智能产品。

侯震宇承认，这项新技术距离大规模落地还有很远的距离，但相比3月份，现在已经变得更实际了。

文心一言诞生后，对于百度还产生另一个好处，就是AI业务变得简单了。此前，百度一直主打AI，想把AI与各行各业结合，但实际做起来很难。

比如之前有个客户，要做AI业务，百度工作人员需要拿着各种各样的数据，去为客户单独训练一个AI模型出来。现在在一个已经训练好的预训练大模型基础上，可以用比较低的门槛做出细分模型。作为AI从业者，侯震宇认为，这是一个很大的福音。

关键词：