中国超300个大模型,仅有4成完成备案
2024-05-19 13:00
文本设置
小号
默认
大号
Plus(0条)
截至今年4月底,国内共计推出了305个大模型。而截至5月16日,只有约140个大模型完成生成式人工智能服务备案,占发布总量的45.9%。这一严峻现实的背后除了有技术层面的难度,还有训练和推理过程中高昂算力成本的制约;即便是跨过这一关,大模型企业如何实现商业化,依然着面临不小的难度。 | 相关阅读(每日经济新闻)
51
六和璧
现在国产大模型“百家争鸣”的热闹氛围让我想起了团购网站“千团大战”的时候,互联网赢家通吃的现实催促着所有人全力冲刺。
国内很多公司开发的大模型都在拿GPT3.5或者4对标,宣称在某些方面“不落下风”,有的号称在参数更少的情况下性能相当,有的甚至宣称“全面领先”。这些模型是如何实现这些所谓的领先呢?
简而言之,这多半是过拟合现象导致的。所谓过拟合,是机器学习和统计建模中的一个常见问题,简单来说,就是在测试中表现出色,而在实际应用中却不尽如人意。
因此,在评估大模型能力时,我们不应过分关注这些测试集的得分。实际上,过度拟合在生活中的例子比比皆是,如大学排名的刷分、自媒体的刷流量等。真正优秀的模型应当是在公开市场竞争中,人们愿意为其支付额外费用的模型。其他任何补充说明都是多余的。
大浪淘沙,接下来的大模型“淘汰赛”正在进行中,“鹿死谁手”,还得看核心本事。