谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

内容分享2小时前发布
0 0 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

前几天,Google DeepMind 发布了 Gemma 4,这个新一代开源大模型家族。配合他们之前的 Google AI Edge Gallery App,你目前可以在手机上、完全离线地跑一个相当机智的 AI。

**Gemma 4 **是一个能看图、听声音、调工具、做多步推理的大语言模型。

Chris 试了几天,来跟大家分享下。

一、Gemma 4 是什么?

Google 正式发布 Gemma 4,这是其开源模型系列的最新一代,脱胎于 Gemini 3 的同一套研究成果,由 Google DeepMind 及 Google 多个团队联合打造。”Gemma”一名源自拉丁语,意为“宝石”,寓意精炼而有价值。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

这次一共发布了四个版本,我做个简单的对照表:

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

也就是说,E2B 和 E4B 是给手机准备的,26B 和 31B 是给电脑准备的。

对于大多数人,我的提议很明确:直接选 E4B。它在智能程度、速度和资源占用之间取得了最好的平衡,当然 E2B 也不错

二、在手机上运行

好,说了这么多,直接上手。整个过程分三步,超级简单。

1.下载 Edge Gallery App

设备要求:

  • Android 12+ 或 iOS 17+
  • 至少 2GB 可用存储空间(用来放模型)

Android 用户:直接在 Google Play 搜索 “Google AI Edge Gallery” 下载。

iOS 用户:Chris 试了下,在国区的 Apple ID 登录后打开 App Store 也可以搜索下载。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

这个 App 是完全开源的,代码在 GitHub 上,你也可以自己编译。

Github 仓库地址:
https://github.com/google-ai-edge/gallery

接下来 Chris 使用 iOS 进行简单演示:

2.下载模型

打开 App 后,你会看到一个模型推荐列表。对于大多数用户,我的提议:

  • 首选 Gemma-4-E4B-it(指令微调版)。约 3.6GB,智能和速度最均衡。
  • 手机较旧或内存紧张,选 Gemma-4-E2B-it,更小更快,但能力稍弱。

点击 “Download” 开始下载。强烈提议在 Wi-Fi 下操作,毕竟文件不小。

下载完成后,模型就永久存在你手机上了,后来完全离线使用,不需要再联网。

Chris 本地已经下载过 Gemma-4-E2B-it 模型,所以不再下载,大家可以按需选择。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

3.开始使用

模型下载好之后,Edge Gallery 提供了好几个功能入口:

三、核心能力

1.AI Chat(AI 聊天)

这是最基础的用法,你可以跟 Gemma 4 自由对话,问它任何问题。跟你使用豆包、DeepSeek 一样,并且手机在离线断网情况也可以使用

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

特别推荐试试 Thinking Mode,在对话窗口右上角点击设置,打开设置弹框开启后,模型会展示它的逐步推理过程。这个功能对学习很有协助,你可以看到 AI 是怎么一步步拆解复杂问题的。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

2.Ask Image(图像问答)

拍张照片或从相册选一张,直接向 AI 提问。列如:

  • “这张照片里的植物是什么品种?”
  • “帮我总结一下这张表格的数据”
  • “这道数学题怎么做?”

由于是原生多模态,不需要先做 OCR 再理解文字,模型直接看图就能理解。实测识别准确率相当不错。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

3.Audio Scribe(语音转写)

实时的离线语音转文字,还可以翻译。开会、采访、记笔记都很好用。并且可以完全离线,你的语音数据不会离开手机。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

4.Agent Skills(智能体技能)

这是进阶玩法。Gemma 4 可以调用外部工具来完成复杂任务。列如:

  • 查询维基百科进行实际核查
  • 把数据生成可视化图表
  • 结合图片和音乐模型,给照片配上氛围感音乐

你甚至可以自己创建 Skills,通过对话的方式让 AI 执行自定义的多步工作流。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

5.Prompt Lab(提示词实验室)

这个是给进阶玩家准备的。你可以调整温度(temperature)、top-k 等生成参数,对比不同提示词写法带来的输出差异,做提示词工程实验。

三、使用感受

说了这么多功能,大家最关心 Chris 的使用感受。接下来说说我这几天的感受。

  • 速度方面

在我的手机上响应很快,基本是秒回。 Thinking Mode 下推理过程会慢一些,但思考到它要在本地跑完一整套逻辑链,这个速度可以接受。离线状态下和在 Wi-Fi 下体验一致,没有任何区别,为它本来就是纯本地运行的

  • 能力方面

日常对话、知识问答、文案润色这些任务,这两个模型完全够用。多步推理和 Agent 功能是它的亮点,比起我之前试过的其他端侧模型,的确 有明显差距拉开。

  • 隐私方面

这是我最满意的一点。所有数据都在手机本地处理,不上传任何内容。你让它处理公司文件、个人照片、私密对话,完全不用担心数据泄露。

谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!

当然也有局限。跟 GPT-4o、Gemini Pro 这种顶级云端模型比,这两模型在超复杂任务上还是有差距。超长文本处理也受限于手机的内存。但话说回来,它是跑在你手机上的、完全离线的、免费的模型,能做到这个程度,已经相当厉害了。

另外,也可以在自己需要对隐私要求比较高的场景使用,并且 Google AI Edge Gallery APP 不会保存历史对话记录,需要及时做好保存。


相关链接

  • Gemma 4 官方博客:https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
  • Gemma 4 模型文档:https://ai.google.dev/gemma/docs/core
  • Gemma 4 模型卡片:https://ai.google.dev/gemma/docs/core/model_card_4?hl=zh-cn
© 版权声明

相关文章

暂无评论

none
暂无评论...