谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍_AI资讯_AI_新闻资讯

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

AI资讯

102

2025-03-13

102

2025-03-13

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。

Gemma-3提供了四种不同参数规模的选项，分别为10亿、40亿、120亿和270亿参数。令人惊讶的是，最大参数的270亿模型只需一张 H100显卡即可高效推理，而同类模型往往需要十倍的算力，这使 Gemma-3成为目前算力要求最低的高性能模型之一。

根据最新的测试数据，Gemma-3在各类对话模型的评比中表现不俗，仅次于知名的 DeepSeek 模型，超越了 OpenAI 的 o3-mini 和 Llama3等多个热门模型。此次发布的 Gemma-3的架构延续了前两代的通用解码器 Transformer 设计，但加入了许多创新和优化。为了解决长上下文带来的内存问题，Gemma-3采用了局部与全局自注意力层交错的架构，显著降低了内存占用。

在上下文处理能力方面，Gemma-3支持的上下文长度扩展到了128Ktoken，为处理长文本提供了更好的支持。此外，Gemma-3还具备多模态能力，能够同时处理文本和图像，并集成了基于 VisionTransformer 的视觉编码器，有效减少了图像处理的计算成本。

在训练过程中，Gemma-3使用了更多的 token 预算，特别是在270亿参数模型中使用了14T 的 token 量，并引入了多语言数据，以增强模型的语言处理能力，支持140种语言，其中35种语言可以直接使用。Gemma-3采用了先进的知识蒸馏技术，在训练后期通过强化学习优化模型表现，尤其是在帮助性、推理能力和多语言能力等方面取得了显著提升。

经过评测，Gemma-3在多模态任务上表现优异，长文本处理能力也令人印象深刻，达到了66% 的准确率。此外，在对话能力评估中，Gemma-3的表现也名列前茅，显示了其在各项任务中的综合实力。

划重点:

🔍 Gemma-3是谷歌最新开源的多模态大模型，参数范围从10亿到270亿，且算力需求降低10倍。

💡 模型采用创新的架构设计，有效处理长上下文和多模态数据，支持文本与图像的同时处理。

🌐 Gemma-3支持140种语言的处理能力，经过训练优化后在多项任务中表现优异，展现了强大的综合能力。

0 人点赞

文章来源于网络，如有侵权请联系本站删除

精选二手好课

更多>>

年卡|【转让】知名机构考研VIP班（专业课1对1+全程规划），低价急转！

考研全程班

￥11000

次卡|转让自考本科汉语言文学专业课程

自考本科（汉语言文学）

￥3768

年卡|名师天团五科全套大招课

高三大招课

￥27000

年卡|81之家军队文职技能岗线上课程

军队文职技能岗

￥4100

年卡|低价出还有书

专升本

￥1800

次卡|沧州木/电吉他一对一课程转让线上线下均可

吉他课

￥2600

次卡|Hellokid纯欧美英语外教一对一

欧美英语外教一对一

￥12000

年卡|便宜转让

健身年卡+私教课

￥10000

次卡|低价转让

瑜伽

￥75

年卡|JS舞蹈（珠海井岸店）双项教练班年卡转让

古典舞，JAZZ，K-POP，HIPPOP

￥9000

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

AI资讯

102

2025-03-13

102

2025-03-13

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。

划重点:

🔍 Gemma-3是谷歌最新开源的多模态大模型，参数范围从10亿到270亿，且算力需求降低10倍。

💡 模型采用创新的架构设计，有效处理长上下文和多模态数据，支持文本与图像的同时处理。

🌐 Gemma-3支持140种语言的处理能力，经过训练优化后在多项任务中表现优异，展现了强大的综合能力。

文章来源于网络，如有侵权请联系本站删除

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍