Meta推出开源大模型Llama 3
2024-04-19 12:30
文本设置
小号
默认
大号
Plus(0条)
当地时间4月18日,AI领域迎来重磅消息,Meta正式发布了人们等待已久的开源大模型Llama 3。马克·扎克伯格表示,Meta提供的生成式AI能力在免费产品中性能是最强大的。该助理可以回答问题、制作动画和生成图像。 | 相关阅读(每日经济新闻)
57
东木
执大象 天下往
从刚发出的博客来看,Llama 3已帮Meta重夺开源大模型的魁首,并无限接近或者超过GPT、Gemini和Claude等闭源大模型。
这个消息的振奋程度,对于AI圈来说,甚至不亚于所谓的GPT4.5。毕竟,meta 才是真正的那个"OpenAI。有多少大模型的生态,是建立在Llama上的,大家都懂。
这次还是meta的老规矩,虽然写的是特定条件下商业使用,但是基本等于完全免费商用了。而且这次开源了2个模型,8B和70B。我看网上博客里的评测结果显示:8B版本优于Mistral 7B和Gemma 7B,70B版本优于Gemini Pro 1.5和Claude 3 Sonnet。
不过Llama 3也存在两个可提升的点,一个是知识库时间,一个是上下文长度。知识库这块,8B只到2023年3月,70B到了2023年12月。而上下文长度更是只有8K。知识库的时间还好说,但是这个上下文长度,在现在动不动200k的时代里,属实是有点不够了。
不过,瑕不掩瑜,估计接下来学术界做模型训练相关的实验大多会切换到Llama 3的8B版本,而等400B版本出来后如果效果接近甚至超过GPT-4,大家在数据标注和评测等难任务上也会逐渐倒向免费的Llama系列。让子弹再飞一会儿。