“假如我们现在不是用国产平台,而是用已经成型的英伟达的平台,我们今天发布的星火3.0的效果可能还会更好,但这一步我们非走不可。”在联合华为发布“飞星一号”大模型算力平台后,科大讯飞董事长刘庆峰接受《财富》采访时表示。
10月24日,科大讯飞承办的第六届世界声博会暨2023科大讯飞全球1024开发者节在安徽省合肥市举办。科大讯飞发布了讯飞星火认知大模型3.0版本,据称该模型综合能力已经超越国内同行,在文本生成、语言理解、知识回答、逻辑推理、数学能力等七大能力上均持续提升。刘庆峰在会上表示,讯飞星火3.0通用模型将全面对标ChatGPT,中文能力已超越ChatGPT,英文能力与之相当。
“飞星一号”则是科大讯飞基于华为昇腾生态开发的大模型算力平台。虽然科大讯飞方面没有公布更新版大模型的具体参数,但刘庆峰透露,这是首个真正在国产算力平台上训练出来的大模型,讯飞和华为“联合特战队”半年内就将星火大模型训练和推理效率翻番,而“飞星一号”平台的发布意味着讯飞正式启动对标GPT-4更大参数规模的星火大模型训练。
“‘飞星一号’这个平台发布的背后,最大的压力是我们在做这件事情的过程中自己的心态,因为本来用英伟达可能一个月就能干成的事情,但我们与华为携手克服各种不确定性,可能三个月才能干完。所以当时最大的困难就是我们在快速奔跑的过程中,别人用的最豪华的武器,而我们要一边打仗,一边磨练武器,或者说一边要赚钱一边要比别人投入更多,这很考验我们的心态,但这对我们未来长期战略是非常重要的。”他在接受采访时坦言道。
科大讯飞10月19日发布的财报显示,前三季度实现营业收入126亿元,同比小幅下滑0.27%;归属净利润9936万元,同比下滑76%。其中,第三季度净利润仅为2579万元,同比下滑82%。其解释称利润下滑主要原因系公司积极抢抓通用人工智能的历史新机遇,在通用人工智能认知大模型等方面坚定投入。前三季度科大讯飞开发支出逾10亿元,同比增长约44%。
另外,在此前发布的半年报中,科大讯飞净利润出现了73.54%的下滑,其解释原因为公司应对美国极限施压,加大了在核心技术自主可控和产业链可控等方面的投入。
尽管讯飞星火3.0已取得一定突破,但刘庆峰表示,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。唯有实事求是的科学精神,才能真正实现超越。”
他预计对标GPT-4的目标有望于2024年上半年实现,届时星火4.0大模型将会发布。
“我也不希望大家觉得我们老在蹭华为的热点,但华为确实有很多值得我们学习的。讯飞是典型的高校科技成果,可以说是学生创业,我们在核心技术上梦想很多,商业化能力还是很弱的,所以要向他们多学习。无论是盈利能力还是管理能力,我们跟华为的差距都还挺大的。当然我们可能一样都有梦想。”在谈及科大讯飞是否是“微缩版华为”时,刘庆峰表示。(财富中文网)