谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

前几天，Google DeepMind 发布了 Gemma 4，这个新一代开源大模型家族。配合他们之前的 Google AI Edge Gallery App，你目前可以在手机上、完全离线地跑一个相当机智的 AI。

**Gemma 4 **是一个能看图、听声音、调工具、做多步推理的大语言模型。

Chris 试了几天，来跟大家分享下。

一、Gemma 4 是什么？

Google 正式发布 Gemma 4，这是其开源模型系列的最新一代，脱胎于 Gemini 3 的同一套研究成果，由 Google DeepMind 及 Google 多个团队联合打造。”Gemma”一名源自拉丁语，意为“宝石”，寓意精炼而有价值。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

这次一共发布了四个版本，我做个简单的对照表：

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

也就是说，E2B 和 E4B 是给手机准备的，26B 和 31B 是给电脑准备的。

对于大多数人，我的提议很明确：直接选 E4B。它在智能程度、速度和资源占用之间取得了最好的平衡，当然 E2B 也不错。

二、在手机上运行

好，说了这么多，直接上手。整个过程分三步，超级简单。

1.下载 Edge Gallery App

设备要求：

Android 12+ 或 iOS 17+
至少 2GB 可用存储空间（用来放模型）

Android 用户：直接在 Google Play 搜索 “Google AI Edge Gallery” 下载。

iOS 用户：Chris 试了下，在国区的 Apple ID 登录后打开 App Store 也可以搜索下载。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

这个 App 是完全开源的，代码在 GitHub 上，你也可以自己编译。

Github 仓库地址：
https://github.com/google-ai-edge/gallery

接下来 Chris 使用 iOS 进行简单演示：

2.下载模型

打开 App 后，你会看到一个模型推荐列表。对于大多数用户，我的提议：

首选 Gemma-4-E4B-it（指令微调版）。约 3.6GB，智能和速度最均衡。
手机较旧或内存紧张，选 Gemma-4-E2B-it，更小更快，但能力稍弱。

点击 “Download” 开始下载。强烈提议在 Wi-Fi 下操作，毕竟文件不小。

下载完成后，模型就永久存在你手机上了，后来完全离线使用，不需要再联网。

Chris 本地已经下载过 Gemma-4-E2B-it 模型，所以不再下载，大家可以按需选择。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

3.开始使用

模型下载好之后，Edge Gallery 提供了好几个功能入口：

三、核心能力

1.AI Chat（AI 聊天）

这是最基础的用法，你可以跟 Gemma 4 自由对话，问它任何问题。跟你使用豆包、DeepSeek 一样，并且手机在离线断网情况也可以使用：

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

特别推荐试试 Thinking Mode，在对话窗口右上角点击设置，打开设置弹框开启后，模型会展示它的逐步推理过程。这个功能对学习很有协助，你可以看到 AI 是怎么一步步拆解复杂问题的。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

2.Ask Image（图像问答）

拍张照片或从相册选一张，直接向 AI 提问。列如：

“这张照片里的植物是什么品种？”
“帮我总结一下这张表格的数据”
“这道数学题怎么做？”

由于是原生多模态，不需要先做 OCR 再理解文字，模型直接看图就能理解。实测识别准确率相当不错。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

3.Audio Scribe（语音转写）

实时的离线语音转文字，还可以翻译。开会、采访、记笔记都很好用。并且可以完全离线，你的语音数据不会离开手机。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

4.Agent Skills（智能体技能）

这是进阶玩法。Gemma 4 可以调用外部工具来完成复杂任务。列如：

查询维基百科进行实际核查
把数据生成可视化图表
结合图片和音乐模型，给照片配上氛围感音乐

你甚至可以自己创建 Skills，通过对话的方式让 AI 执行自定义的多步工作流。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

5.Prompt Lab（提示词实验室）

这个是给进阶玩家准备的。你可以调整温度（temperature）、top-k 等生成参数，对比不同提示词写法带来的输出差异，做提示词工程实验。

三、使用感受

说了这么多功能，大家最关心 Chris 的使用感受。接下来说说我这几天的感受。

速度方面

在我的手机上响应很快，基本是秒回。 Thinking Mode 下推理过程会慢一些，但思考到它要在本地跑完一整套逻辑链，这个速度可以接受。离线状态下和在 Wi-Fi 下体验一致，没有任何区别，为它本来就是纯本地运行的。

能力方面

日常对话、知识问答、文案润色这些任务，这两个模型完全够用。多步推理和 Agent 功能是它的亮点，比起我之前试过的其他端侧模型，的确有明显差距拉开。

隐私方面

这是我最满意的一点。所有数据都在手机本地处理，不上传任何内容。你让它处理公司文件、个人照片、私密对话，完全不用担心数据泄露。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

当然也有局限。跟 GPT-4o、Gemini Pro 这种顶级云端模型比，这两模型在超复杂任务上还是有差距。超长文本处理也受限于手机的内存。但话说回来，它是跑在你手机上的、完全离线的、免费的模型，能做到这个程度，已经相当厉害了。

另外，也可以在自己需要对隐私要求比较高的场景使用，并且 Google AI Edge Gallery APP 不会保存历史对话记录，需要及时做好保存。

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

一、Gemma 4 是什么？

二、在手机上运行

1.下载 Edge Gallery App

2.下载模型

3.开始使用

三、核心能力

1.AI Chat（AI 聊天）

2.Ask Image（图像问答）

3.Audio Scribe（语音转写）

4.Agent Skills（智能体技能）

5.Prompt Lab（提示词实验室）

三、使用感受

相关链接

Gemma 4小参数追平GPT-5：20亿参数背后的架构奇迹是什么

Gemma 4端侧：1.5GB内存适合哪三类离线用户？

相关文章

润滑剂在金属加工行业的应用

用n8n做AI工作流驱动网站出海赚美金3：搭建「SEO策略优化」AI Agent

京东发动新一轮战役

WPS如何启用宏功能？WPS运行VBA代码

暂无评论

热门网站

小苹果网页助手

3699小游戏

Shopee

美女视频收藏馆

马蜂窝

Indeed

热门文章

昆廷夫夫日常合集：昆廷夫妇全集免费直通车1080P超速播-未删减百度云秒拉缓存-高清画质自由看-可影视全网极速播放昆廷夫夫日常合集-昆廷夫妇全集在线点播免VIP高清未删减版-可影视秒播

易懂案例：用班费记账来理解区块链Paxos算法、Basic Paxos算法、Cheap Paxos算法、Egalitarian Paxos算法、Fast Paxos算法、Multi-Paxos算法、B

必看！2025年7月AI工具推荐榜

Qt——常用控件

从60%到94%！11个进阶RAG策略，彻底解决生产环境准确率难题

Python functools 模块详解

谷歌发布 Gemma 4 全能模型，2 步教你在手机完美运行，离线且免费！

一、Gemma 4 是什么？

二、在手机上运行

1.下载 Edge Gallery App

2.下载模型

3.开始使用

三、核心能力

1.AI Chat（AI 聊天）

2.Ask Image（图像问答）

3.Audio Scribe（语音转写）

4.Agent Skills（智能体技能）

5.Prompt Lab（提示词实验室）

三、使用感受

相关链接

Gemma 4小参数追平GPT-5：20亿参数背后的架构奇迹是什么

Gemma 4端侧：1.5GB内存适合哪三类离线用户？

相关文章

热门网站

小苹果网页助手

3699小游戏

Shopee

美女视频收藏馆

马蜂窝

Indeed

热门文章

标签云