首页 500强 活动 榜单 商业 科技 商潮 专题 品牌中心
杂志订阅

谷歌正面对决DeepSeek:推出轻量级开源AI大模型标志性转变

David Meyer
2025-03-17

DeepSeek的出现点燃了业界对轻量级AI大模型的热情,谷歌公司当然也在这个领域找找机会。

文本设置
小号
默认
大号
Plus(0条)

图片来源:Thomas Fuller—SOPA Images/LightRocket/Getty Images

中国的DeepSeek之所以爆火,就是因为它能凭借不高的算力要求,提供不逊于西方主流大模型的性能,而且在手机这种低成本的设备上也能跑得很好。

就在上周三,谷歌推出Gemma大模型的最新版本。Gemma的初代版本是在一年前推出的,这是一款基于开源AI模型的产品,它也标志着谷歌在AI开发上放弃仅使用自身专有技术的老路。

谷歌本次发布的Gemma 3有四个版本,最小的版本有10亿个参数,最大的版本有270亿个参数——但这也算是一个相当“瘦身”的AI大模型了。谷歌公司称,Gemma 3是该公司迄今为止开发的“最先进、最好用而且开发得最负责的一款开源大模型。”

谷歌还宣称,Gemma 3的性能优于DeepSeek-V3、Meta公司Llama-405B以及OpenAI公司的o3-mini模型。它也是在单个AI加速芯片上运行效率最高的模型。

Gemma 3还提供了比前两代大得多的“上下文窗口”,这意味着它一次能够记住更多的信息,也就能够处理更多的信息输入。它的最大处理能力为128000个token,这意味着谷歌的开源模型在性能上也只是赶上了Llama和DeepSeek这样的竞争对手。

谷歌同时还发布了一款基于Gemma 3的图像安全检查工具ShieldGemma 2,开发者可以用它来检测图片中的色情暴力等内容。

除此之外,谷歌还透露它将重新进军机器人领域。谷歌旗下的DeepMind部门现已将Gemini 2.0大模型改造成了两款机器人专用AI。(几年前,谷歌母公司Alphabet叫停了谷歌的“日常机器人”项目。不过去年12月,谷歌又与一家名叫Apptronik人形机器人公司建立了战略合作伙伴关系。 )

其中一款名叫Gemini Robotics的AI模型可以接收自然语言指令,然后依照指令行动,而且它还会考虑到机器人所处环境的变化。据说这款机器人专用AI已经相当智能了,它甚至能够处理折纸和打包垃圾之类的任务。另一款Gemini Robotics-ER模型有着较强的空间推理能力,也就是说它在精细运动上的表现可能会更好一些,比如说它能想到合适的方法端起一个摆在它面前的咖啡杯。

在发布Gemma 3和上述两款机器人专用AI时,谷歌都大谈了一番安全性问题,这当然是有必要的。开源模型有一些天生的安全风险,因为大模型一旦开源,就会变得不受控。谷歌表示,Gemma 3已经经过了全面测试,特别是重点测试了它们是否会有被用来制造有害物质的风险。毕竟这些大模型都具有极强的理工科知识,如果放开了搞,它们在家里给你手搓出一点枪支弹药什么的也不是不可能。另外,机器人也有可能伤害到人类,所以Gemini Robotics-ER模型专门设计了评估动作安全性的功能,以便任何情况下能做出“恰当的反应”。(财富中文网)

译者:朴成奎

中国的DeepSeek之所以爆火,就是因为它能凭借不高的算力要求,提供不逊于西方主流大模型的性能,而且在手机这种低成本的设备上也能跑得很好。

就在上周三,谷歌推出Gemma大模型的最新版本。Gemma的初代版本是在一年前推出的,这是一款基于开源AI模型的产品,它也标志着谷歌在AI开发上放弃仅使用自身专有技术的老路。

谷歌本次发布的Gemma 3有四个版本,最小的版本有10亿个参数,最大的版本有270亿个参数——但这也算是一个相当“瘦身”的AI大模型了。谷歌公司称,Gemma 3是该公司迄今为止开发的“最先进、最好用而且开发得最负责的一款开源大模型。”

谷歌还宣称,Gemma 3的性能优于DeepSeek-V3、Meta公司Llama-405B以及OpenAI公司的o3-mini模型。它也是在单个AI加速芯片上运行效率最高的模型。

Gemma 3还提供了比前两代大得多的“上下文窗口”,这意味着它一次能够记住更多的信息,也就能够处理更多的信息输入。它的最大处理能力为128000个token,这意味着谷歌的开源模型在性能上也只是赶上了Llama和DeepSeek这样的竞争对手。

谷歌同时还发布了一款基于Gemma 3的图像安全检查工具ShieldGemma 2,开发者可以用它来检测图片中的色情暴力等内容。

除此之外,谷歌还透露它将重新进军机器人领域。谷歌旗下的DeepMind部门现已将Gemini 2.0大模型改造成了两款机器人专用AI。(几年前,谷歌母公司Alphabet叫停了谷歌的“日常机器人”项目。不过去年12月,谷歌又与一家名叫Apptronik人形机器人公司建立了战略合作伙伴关系。 )

其中一款名叫Gemini Robotics的AI模型可以接收自然语言指令,然后依照指令行动,而且它还会考虑到机器人所处环境的变化。据说这款机器人专用AI已经相当智能了,它甚至能够处理折纸和打包垃圾之类的任务。另一款Gemini Robotics-ER模型有着较强的空间推理能力,也就是说它在精细运动上的表现可能会更好一些,比如说它能想到合适的方法端起一个摆在它面前的咖啡杯。

在发布Gemma 3和上述两款机器人专用AI时,谷歌都大谈了一番安全性问题,这当然是有必要的。开源模型有一些天生的安全风险,因为大模型一旦开源,就会变得不受控。谷歌表示,Gemma 3已经经过了全面测试,特别是重点测试了它们是否会有被用来制造有害物质的风险。毕竟这些大模型都具有极强的理工科知识,如果放开了搞,它们在家里给你手搓出一点枪支弹药什么的也不是不可能。另外,机器人也有可能伤害到人类,所以Gemini Robotics-ER模型专门设计了评估动作安全性的功能,以便任何情况下能做出“恰当的反应”。(财富中文网)

译者:朴成奎

After China’s DeepSeek set the AI world alight with lightweight models that can provide pretty strong performance on relatively low-cost equipment like phones, Google wants developers to know it’s still in the game.

On Wednesday, the search giant unveiled the latest iteration in its Gemma series of open AI models, which it launched just over a year ago in a noteworthy shift away from a proprietary-only approach.

Gemma 3 comes in four sizes, ranging from a minuscule 1 billion parameters (the internal variables that determine how models function) to a still-svelte 27 billion parameters. According to Google, these are the company’s “most advanced, portable, and responsibly developed open models yet.”

What’s more, Google claims Gemma 3 outperforms DeepSeek -V3, Meta’s Llama -405B, and OpenAI’s o3-mini. This, it says, makes it the best model that can run on a single AI accelerator chip.

Gemma 3 also offers a much larger “context window” than its predecessors, meaning it can remember a lot more information at one time, allowing it to handle larger inputs. But at 128,000 tokens, that just means Google’s open models have caught up with rivals like Llama and DeepSeek.

Google also used the opportunity to release a Gemma 3–based image safety checker called ShieldGemma 2, which developers can use to identify things like sexual or violent content in pictures.

That wasn’t all. Google on Wednesday also revealed more about its push back into the world of robotics. Google’s DeepMind division has now wrangled its flagship Gemini 2.0 model into two new models dedicated to the field. (Parent company Alphabet took a step back a couple years ago when it called time on its Everyday Robots moonshot. In December, it announced a strategic partnership with a humanoid robotics firm called Apptronik.)

One, Gemini Robotics, can take natural-language instructions and turn them into actions, also taking into account changes to the robot’s environment. It is supposedly dexterous enough to handle tasks like folding origami and packing things into Ziploc bags. The other model, Gemini Robotics-ER, focuses on spatial reasoning, meaning it can do things like figure out the appropriate way to grasp and lift a coffee mug that is placed before it.

Both the robotics and Gemma 3 announcements come with liberal lashings of safety talk—and for good reason. Open models come with inherent safety risks, as they are not under the control of the company that releases them. Google said Gemma 3 had been thoroughly tested, with great emphasis on the models’ potential for making harmful substances, as the models supposedly have strong STEM skills. Meanwhile, robots can hurt people, so Gemini Robotics-ER is designed to judge the safety of the actions it enables and “generate appropriate responses.”

财富中文网所刊载内容之知识产权为财富媒体知识产权有限公司及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
0条Plus
精彩评论
评论

撰写或查看更多评论

请打开财富Plus APP

前往打开