前几天,Google DeepMind 发布了 Gemma 4,这个新一代开源大模型家族。配合他们之前的 Google AI Edge Gallery App,你目前可以在手机上、完全离线地跑一个相当机智的 AI。
**Gemma 4 **是一个能看图、听声音、调工具、做多步推理的大语言模型。
Chris 试了几天,来跟大家分享下。
一、Gemma 4 是什么?
Google 正式发布 Gemma 4,这是其开源模型系列的最新一代,脱胎于 Gemini 3 的同一套研究成果,由 Google DeepMind 及 Google 多个团队联合打造。”Gemma”一名源自拉丁语,意为“宝石”,寓意精炼而有价值。

这次一共发布了四个版本,我做个简单的对照表:

也就是说,E2B 和 E4B 是给手机准备的,26B 和 31B 是给电脑准备的。
对于大多数人,我的提议很明确:直接选 E4B。它在智能程度、速度和资源占用之间取得了最好的平衡,当然 E2B 也不错。
二、在手机上运行
好,说了这么多,直接上手。整个过程分三步,超级简单。
1.下载 Edge Gallery App
设备要求:
- Android 12+ 或 iOS 17+
- 至少 2GB 可用存储空间(用来放模型)
Android 用户:直接在 Google Play 搜索 “Google AI Edge Gallery” 下载。
iOS 用户:Chris 试了下,在国区的 Apple ID 登录后打开 App Store 也可以搜索下载。

这个 App 是完全开源的,代码在 GitHub 上,你也可以自己编译。
Github 仓库地址:
https://github.com/google-ai-edge/gallery
接下来 Chris 使用 iOS 进行简单演示:
2.下载模型
打开 App 后,你会看到一个模型推荐列表。对于大多数用户,我的提议:
- 首选 Gemma-4-E4B-it(指令微调版)。约 3.6GB,智能和速度最均衡。
- 手机较旧或内存紧张,选 Gemma-4-E2B-it,更小更快,但能力稍弱。
点击 “Download” 开始下载。强烈提议在 Wi-Fi 下操作,毕竟文件不小。
下载完成后,模型就永久存在你手机上了,后来完全离线使用,不需要再联网。
Chris 本地已经下载过 Gemma-4-E2B-it 模型,所以不再下载,大家可以按需选择。

3.开始使用
模型下载好之后,Edge Gallery 提供了好几个功能入口:
三、核心能力
1.AI Chat(AI 聊天)
这是最基础的用法,你可以跟 Gemma 4 自由对话,问它任何问题。跟你使用豆包、DeepSeek 一样,并且手机在离线断网情况也可以使用:

特别推荐试试 Thinking Mode,在对话窗口右上角点击设置,打开设置弹框开启后,模型会展示它的逐步推理过程。这个功能对学习很有协助,你可以看到 AI 是怎么一步步拆解复杂问题的。

2.Ask Image(图像问答)
拍张照片或从相册选一张,直接向 AI 提问。列如:
- “这张照片里的植物是什么品种?”
- “帮我总结一下这张表格的数据”
- “这道数学题怎么做?”
由于是原生多模态,不需要先做 OCR 再理解文字,模型直接看图就能理解。实测识别准确率相当不错。

3.Audio Scribe(语音转写)
实时的离线语音转文字,还可以翻译。开会、采访、记笔记都很好用。并且可以完全离线,你的语音数据不会离开手机。

4.Agent Skills(智能体技能)
这是进阶玩法。Gemma 4 可以调用外部工具来完成复杂任务。列如:
- 查询维基百科进行实际核查
- 把数据生成可视化图表
- 结合图片和音乐模型,给照片配上氛围感音乐
你甚至可以自己创建 Skills,通过对话的方式让 AI 执行自定义的多步工作流。

5.Prompt Lab(提示词实验室)
这个是给进阶玩家准备的。你可以调整温度(temperature)、top-k 等生成参数,对比不同提示词写法带来的输出差异,做提示词工程实验。
三、使用感受
说了这么多功能,大家最关心 Chris 的使用感受。接下来说说我这几天的感受。
- 速度方面
在我的手机上响应很快,基本是秒回。 Thinking Mode 下推理过程会慢一些,但思考到它要在本地跑完一整套逻辑链,这个速度可以接受。离线状态下和在 Wi-Fi 下体验一致,没有任何区别,为它本来就是纯本地运行的。
- 能力方面
日常对话、知识问答、文案润色这些任务,这两个模型完全够用。多步推理和 Agent 功能是它的亮点,比起我之前试过的其他端侧模型,的确 有明显差距拉开。
- 隐私方面
这是我最满意的一点。所有数据都在手机本地处理,不上传任何内容。你让它处理公司文件、个人照片、私密对话,完全不用担心数据泄露。

当然也有局限。跟 GPT-4o、Gemini Pro 这种顶级云端模型比,这两模型在超复杂任务上还是有差距。超长文本处理也受限于手机的内存。但话说回来,它是跑在你手机上的、完全离线的、免费的模型,能做到这个程度,已经相当厉害了。
另外,也可以在自己需要对隐私要求比较高的场景使用,并且 Google AI Edge Gallery APP 不会保存历史对话记录,需要及时做好保存。
相关链接
- Gemma 4 官方博客:https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
- Gemma 4 模型文档:https://ai.google.dev/gemma/docs/core
- Gemma 4 模型卡片:https://ai.google.dev/gemma/docs/core/model_card_4?hl=zh-cn



