截图翻译工具:读论文时,公式和截图终于不用来回复制了

内容分享2天前发布
0 0 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

AI Screenshot Translator 是一个 Windows 上的截图翻译/归档工具。它不是把整篇文档丢进翻译器,而是让你框选屏幕上的一小块内容,交给 AI 翻译,再把 Markdown、代码高亮和 LaTeX 结果留在本地历史里。

我又来补一个很适合论文阅读场景的小工具。

项目叫 AI Screenshot Translator,中文名就是 AI 截图翻译工具。

README 给它的定义很直接:

一个基于 Qt 6 + WebView2 的截图翻译/归档工具。

它的流程也很明确:

截图 → AI 翻译 → 富文本结果(Markdown/代码高亮/LaTeX)

截至 2026-05-08 21:09 CST,我查到 GitHub API 里的数据是:194 stars、25 forks、1 open issue,主语言是 C,许可证是 GPL-3.0。仓库创建于 2025-06-01,最近 push 是 2026-04-02。

最新 release 是 v1.0.4,发布于 2026-03-25。这一版新增了多张图片翻译功能:在截图模式下可以按 D 切换单张和批量模式,截图预览可以用 x/z 左右切换。

截图翻译工具:读论文时,公式和截图终于不用来回复制了

AI Screenshot Translator 头条封面

它盯的不是整篇翻译

许多翻译工具默认思路是:把整篇文档丢进去,等它处理完。

这对普通文章还行,但读论文、技术文档、扫描 PDF 的时候,常常不是这么用。

更真实的场景是:你卡在一段公式说明、一张图表注释、一个截图里的错误信息,或者 PDF 里复制出来就乱掉的 LaTeX。你不想启动一套“文档翻译流程”,只想把眼前这块内容看懂。

AI Screenshot Translator 处理的就是这个缝隙。

它让你用全局快捷键框选区域,先生成截图预览,再把内容交给 AI 翻译。结果窗口可以置顶、翻页、编辑 Markdown、查看原图、打标签。后面如果还想找回来,可以进归档窗口按日期和标签筛选。

截图翻译工具:读论文时,公式和截图终于不用来回复制了

AI Screenshot Translator 工作流

对读论文的人比较友善

这个项目的 README 里把痛点说得很具体。

第一,不想用整篇文档翻译那种笨重工作流。

第二,PDF 复制文本后,公式和 LaTeX 常常乱。

第三,扫描版 PDF 没法复制文本。

第四,许多划词翻译或截图翻译工具,识别和渲染公式的效果不好。

所以它的卖点不是“我也能翻译一句话”。

真正有价值的是后半段:翻译结果能以富文本方式展示,支持 Markdown、代码高亮和 LaTeX。对看论文、看技术文档、看代码注释的人来说,这比只吐一段纯文本更有用。

支持的不只是 OpenAI

AI Provider 这块,README 写的是 OpenAI / Gemini / Claude,并且说可以扩展。

设置页里可以配置 API Key,也可以设置 Base URL、Endpoint 和 Proxy。它还提供测试按钮,用来检查代理和 API 端点是否可连。

这个设计比较现实。

目前许多人不会只用一个模型入口。有的人走 OpenAI,有的人走 Gemini,有的人走 Claude,也有人用兼容 OpenAI 接口的第三方服务。把 Base URL 和 Endpoint 拆开,至少给了用户替换入口的空间。

不过这里也要提醒一句:README 特别说,如果 Base URL 里已经带了版本路径,列如 …/v1,Endpoint 就不要再写 /v1/…,不然会出现重复路径。

这类细节看起来小,但真实使用时很容易踩坑。

归档功能是它和普通截图翻译的分界线

只做一次截图翻译,实则许多工具都能做。

AI Screenshot Translator 多做了一层归档。

它把本地历史放在:

storage/history.json

storage/images/*

配置文件则放在:

%AppData%/AI-Screenshot-Translator-Cpp/profiles/*.json

归档窗口支持日期/标签筛选、批量选择删除、加减标签,还能用键盘在查看、编辑和截图预览之间切换。

这个点对论文阅读很重大。

你今天翻译的一段公式说明,可能下周写笔记时还要回头看。只弹出一次结果,然后消失,就很像一次性工具;能按标签和日期找回来,才更接近一个阅读工作台。

快捷键设计也偏重度用户

README 里列了默认快捷键:

截图:ctrl+alt+s

打开归档:alt+s

结果窗口:上一页 z / 下一页 x;标签 t

归档窗口:编辑 e、查看切换 r、截图预览 s

编辑辅助:加粗/下划线/高亮:ctrl+b / ctrl+u / ctrl+h

这些键位说明它不是单纯的“点按钮工具”。

作者明显是按高频使用来设计的:截图、翻页、打标签、编辑、查看原图,尽量都能靠键盘完成。

如果你每天只偶尔翻译一句话,这些快捷键意义不大。但如果你连续看论文、看英文技术资料,它会省掉不少来回点鼠标的动作。

但它不是所有平台都能用

限制也要说清楚。

README 明确写着:目前仅支持 Windows,未来计划跨平台。

构建环境也偏 Windows 桌面开发:Windows + MSVC,推荐 VS 2022 工具链;还需要 CMake 3.16 以上、Qt 6,以及 WebView2 Runtime。Windows 11 一般自带 WebView2 Runtime,Windows 10 可能要单独安装。

如果要从源码构建,README 给的是这套命令:

cmake -S . -B build -G “Visual Studio 17 2022” -A x64

cmake –build build –config Release

.uildReleaseAI-Screenshot-Translator-Cpp.exe

所以它更适合 Windows 用户和愿意折腾本地工具的人。

如果你是 macOS 用户,或者只想要一个浏览器插件式的轻量入口,目前就不用硬试了。

梦飞的判断

AI Screenshot Translator 有意思的地方,是它没有把自己包装成又一个万能翻译平台。

它选了一个很窄、但很真实的入口:截图。

读论文时,最烦人的往往不是整篇翻译,而是某一段公式解释、某个图注、某张扫描页、某个没法复制的局部内容。你只想框一下、翻一下、留个记录,继续往下读。

这个项目把这条路补完整了:截图、预览、AI 翻译、富文本展示、标签、归档。

它目前的边界也很清楚:Windows-only,需要 API Key,需要配置模型入口,也离不开 WebView2/Qt 这些桌面依赖。不要把它想成无门槛商业成品。

但如果你常常在 Windows 上读英文论文、PDF、技术文档,尤其常常遇到公式和截图内容,它值得放进工具箱里试试。

它解决的不是“翻译一句话”,而是“眼前这一块内容,我能不能马上看懂,并且后来还能找回来”。

热点来晚了,但瓜更熟。梦飞帮你补错过的全网热事。

原文链接

https://github.com/Diraw/AI-Screenshot-Translator

话题标签

#AI翻译# #截图翻译# #开源工具# #论文阅读# #Windows工具#

© 版权声明

相关文章

暂无评论

none
暂无评论...