最近一周,全球AI领域迎来了交锋时刻。
当地时间5月13日,OpenAI通过直播发布了GPT-4系列新模型GPT-4o,以及ChatGPT的桌面版本。未亲临直播现场的OpenAI首席执行官山姆·奥特曼在X上发帖称:“我们的新模型:GPT-4o,是我们目前最好的模型,它智能且快速,还是原生多模态模型。”
OpenAI首席技术官米拉·穆拉蒂介绍道,GPT-4o将面向包括免费用户在内的所有用户,它较上一代产品更快,改进了文本、视频和语音功能,提高50种不同语言ChatGPT的服务质量。GPT-4o还将通过OpenAI的API提供支持,开发者可以使用新模型构建应用程序。
直播时,穆拉蒂与两位技术人员对GPT-4o进行了现场测试。新模型减少了人机对话的迟滞感,在过程中,人们可以随时打断GPT-4o的输出,情绪传达实现进步,再结合视频功能,让机器更像一个能看能听的真实存在的人。
如果说之前的GPT是基于数据,在理性分析层面给人以技术跨越的震撼,那么这次GPT-4o呈现出与人类相似的感性层面的补充,让人感叹科幻电影情节已经发生。
OpenAI在这次迭代中,没有满足外界对GPT-4.5或GPT-5的期待,但“o”相较数字,更直接地表达了一种进化。据OpenAI官网介绍,这里的“o”代表“omni”,意为“全能”,源自拉丁语。而在英语中,它常被用作词根,可以联想到“全知全能”和“无处不在”。
值得注意的是,GPT-4o发布时间点卡在了谷歌I/O开发者大会的前一天。而在往后的一个月中,微软Build年度开发者大会和苹果WWDC也即将先后召开。
当地时间5月14日,谷歌在I/O开发者大会中公布AI新进展,在前一天OpenAI的铺垫下,市场自然会以更高的眼光审视这家老牌巨头的新产品。
OpenAI确实通过这次布景简单且短暂的直播成功向谷歌施压——开发者现场的实时对话展示,让人不禁联想到谷歌大模型Gemini此前发布的展示视频被指剪辑、夸大宣传。该模型在实际应用中,并未达到其宣传中的效果。对此,谷歌承认道,演示视频经过编辑,为简洁起见,延迟已减少,Gemini输出也已缩短。2024年的I/O开发者大会成为谷歌的关键挽尊机会。
其实,谷歌首席执行官桑达尔·皮查伊早在七八年前就在I/O开发者大会上表态,要从“移动优先”转为“AI优先”,但在提前看清方向的条件下,谷歌并没有延续领先优势。在上一代互联网时代习惯处在领先地位的谷歌,经历过去一年围绕AI的挑战后,似乎变成了追赶者。它需要向外界释放有关最新技术的积极信号。
这次I/O开发者大会上,谷歌亮出了能与GPT-4o相抗衡的Project Astra,该项目展示了多模态理解和实时对话能力。通过演示能够看出,Astra的延迟较GPT-4o更长,且情感多样性还有待提高。
同时,谷歌还推出了对标Sora的视频生成模型Veo。今年2月,与Gemini 1.5 Pro被几乎同时推出的Sora抢尽风头。
在搜索引擎方面,谷歌主动实现自我革命,在搜索功能中推出AI概览(AI Overviews),归纳总结搜索结果。谷歌称,搜索将具备多步骤推理能力,并支持视频形式的解决方案搜索。与此同时,谷歌将拥有100万tokens长的上下文窗口的Gemini 1.5 Pro扩展至200万tokens级别,这意味着大模型能够处理更多信息,拥有更全面的理解能力。
由于ChatGPT自2022年末走入大众视野后,就对搜索领域形成了直接威胁,因此市场曾推测,OpenAI会在这次发布会上推出基于ChatGPT的搜索引擎。但该公司目前并未宣布迈出这一步。
OpenAI和谷歌的研发竞赛陷入胶着,这对包括苹果和亚马逊在内的公司形成了威胁。它们需要跟上日益加快的步伐,至少不能落后太多,否则Siri和Alexa都会陷入尴尬。由于苹果的AI研发进度并不明朗,已经有传言称其正在与OpenAI谈判,以求在短期内获得技术许可,将最先进的AI技术应用于苹果产品。
AI竞争已经从基建向应用与生态搭建蔓延。
谷歌在企业应用和消费者应用方面的积累,为其建立AI生态圈提供了天然优势。 或许OpenAI注意到了这一点。今年1月,OpenAI推出个性化AI应用商店GPT Store,用户可以通过其发现和构建GPT。目前GPT Store主要针对付费版本开放。这一功能被认为可能成为下一个Apple Store。从去年年底宣布,到今年年初问世,历时两个月,期间经历了奥特曼被意外罢免再复职的风波。
截至目前,GPT Store还只是一个渠道,距离大众通过OpenAI潜力所构想的生态建立还有很大差距。但随着GPT-4o的技术迭代,对于AI应用的想象得以进一步丰富,不能排除OpenAI正在为生态搭建架构的可能。
在OpenAI此次发布会的最后,穆拉蒂说道:“今天我们专注于免费用户、新模式,和新产品,但我们也非常关心下一个前沿领域。很快,我们将向大家更新下一个大事件的进展。”
这不得不使人猜测,OpenAI对于实际进展有所保留。在激烈竞争之下,保留底牌或许已经成为各大巨头的习惯。OpenAI的“下一个大事件”的官宣时间,或许在后续微软和苹果的发布会之后,或许会找另外一个时间节点。毕竟奥特曼一直擅长在正确的时间释放正确的信息。OpenAI此前的技术曝光节奏都取得了不错的效果。(财富中文网)