中国超300个大模型，仅有4成完成备案

2024-05-19 13:00

文本设置

小号

默认

大号

Plus(0条)

截至今年4月底，国内共计推出了305个大模型。而截至5月16日，只有约140个大模型完成生成式人工智能服务备案，占发布总量的45.9%。这一严峻现实的背后除了有技术层面的难度，还有训练和推理过程中高昂算力成本的制约；即便是跨过这一关，大模型企业如何实现商业化，依然着面临不小的难度。 | 相关阅读（每日经济新闻）

六和璧

现在国产大模型“百家争鸣”的热闹氛围让我想起了团购网站“千团大战”的时候，互联网赢家通吃的现实催促着所有人全力冲刺。

国内很多公司开发的大模型都在拿GPT3.5或者4对标，宣称在某些方面“不落下风”，有的号称在参数更少的情况下性能相当，有的甚至宣称“全面领先”。这些模型是如何实现这些所谓的领先呢？

简而言之，这多半是过拟合现象导致的。所谓过拟合，是机器学习和统计建模中的一个常见问题，简单来说，就是在测试中表现出色，而在实际应用中却不尽如人意。

因此，在评估大模型能力时，我们不应过分关注这些测试集的得分。实际上，过度拟合在生活中的例子比比皆是，如大学排名的刷分、自媒体的刷流量等。真正优秀的模型应当是在公开市场竞争中，人们愿意为其支付额外费用的模型。其他任何补充说明都是多余的。

大浪淘沙，接下来的大模型“淘汰赛”正在进行中，“鹿死谁手”，还得看核心本事。

撰写或查看更多评论

请打开财富Plus APP

前往打开

热读文章

关注我们

中国超300个大模型，仅有4成完成备案

六和璧

撰写或查看更多评论