首页 500强 活动 榜单 商业 科技 领导力 视频 专题 品牌中心
杂志订阅

Meta推出开源大模型Llama 3

2024-04-19 12:30
文本设置
小号
默认
大号
Plus(0条)
当地时间4月18日,AI领域迎来重磅消息,Meta正式发布了人们等待已久的开源大模型Llama 3。马克·扎克伯格表示,Meta提供的生成式AI能力在免费产品中性能是最强大的。该助理可以回答问题、制作动画和生成图像。 | 相关阅读(每日经济新闻)
57
东木

东木

执大象 天下往

从刚发出的博客来看,Llama 3已帮Meta重夺开源大模型的魁首,并无限接近或者超过GPT、Gemini和Claude等闭源大模型。

这个消息的振奋程度,对于AI圈来说,甚至不亚于所谓的GPT4.5。毕竟,meta 才是真正的那个"OpenAI。有多少大模型的生态,是建立在Llama上的,大家都懂。

这次还是meta的老规矩,虽然写的是特定条件下商业使用,但是基本等于完全免费商用了。而且这次开源了2个模型,8B和70B。我看网上博客里的评测结果显示:8B版本优于Mistral 7B和Gemma 7B,70B版本优于Gemini Pro 1.5和Claude 3 Sonnet。

不过Llama 3也存在两个可提升的点,一个是知识库时间,一个是上下文长度。知识库这块,8B只到2023年3月,70B到了2023年12月。而上下文长度更是只有8K。知识库的时间还好说,但是这个上下文长度,在现在动不动200k的时代里,属实是有点不够了。

不过,瑕不掩瑜,估计接下来学术界做模型训练相关的实验大多会切换到Llama 3的8B版本,而等400B版本出来后如果效果接近甚至超过GPT-4,大家在数据标注和评测等难任务上也会逐渐倒向免费的Llama系列。让子弹再飞一会儿。

评论

撰写或查看更多评论

请打开财富Plus APP

前往打开