3.2 MacWhisper(Mac 用户)

MacWhisper 是 Mac 平台上最优雅的本地语音转写工具,基于 OpenAI Whisper 模型。如果你是 Mac 用户,这几乎是必装的。

快速概览

项目	信息
官方网址	https://goodsnooze.gumroad.com/l/macwhisper
App Store	搜索 "Whisper Transcription"
支持平台	macOS 13+ (Apple Silicon 性能最佳)
价格	免费版 / Pro €19 / Pro+ €59(永久买断)
支持语言	99+ 语言(Whisper 模型)
延迟	1-3 秒(取决于硬件)
隐私	⭐⭐⭐⭐⭐ 完全本地
难度	⭐⭐(易上手)

为什么选 MacWhisper

优势

1. 完全本地运行

数据不上传任何服务器
完全离线可用
适合涉密会议
没有"数据出境"风险

2. Whisper Large v3 业界顶级

OpenAI 训练的开源模型
重口音英语处理强
多语言支持
持续更新

3. Mac 原生体验

完美适配 Apple Silicon
与 macOS 深度集成
可监听任意 App 的音频
集成 Nvidia Parakeet 等其他模型

4. 永久买断

免费版功能基础
Pro 版 €19,买断
Pro+ 版 €59,买断
不订阅,一次性付费

5. 隐私至上

所有处理在本机
没有数据收集
没有云端依赖
可以完全断网使用

局限

1. 需要 Mac

仅支持 macOS
Windows 用户用 Buzz

2. 硬件要求

跑大模型需要 16GB+ 内存
M1/M2/M3/M4 芯片表现最佳
Intel Mac 可能慢

3. 中文翻译需配合

Whisper 原生只能"翻译成英文"
要中文翻译需配合其他工具
Pro 版本提供翻译功能

4. 模型文件大

Large v3: 约 3 GB
需要下载时间
占用本地存储

下载与安装

选项 1: 从官方网站下载(推荐)

步骤 1: 访问官网

https://goodsnooze.gumroad.com/l/macwhisper

步骤 2: 选择版本

页面上有三个版本:

Free: 免费版,基础功能
Pro: €19,完整功能
Pro+: €59,所有高级功能

新手建议先试免费版,满意再升级。

步骤 3: 下载安装

点击"Download Free"或购买后下载
下载 .zip 或 .dmg 文件
解压后双击 .app 文件
拖到"应用程序"文件夹

步骤 4: 首次打开

在"应用程序"中找到 MacWhisper
第一次打开:
- 可能提示"无法验证开发者"
- 系统设置 → 隐私与安全性 → 仍要打开
应用启动后,会引导你选择语音模型

选项 2: 从 App Store 下载

步骤 1: 打开 App Store

步骤 2: 搜索 "Whisper Transcription"

⚠️ 注意:App Store 版本和 Gumroad 版本是同一个软件,但 App Store 价格略高,且不能跨平台。

步骤 3: 购买并下载

免费版可直接下载
Pro 版需要内购解锁

首次配置

步骤 1: 选择语音模型

第一次打开 MacWhisper,会提示下载语音模型。

Mac 型号	推荐模型	文件大小	精度	速度
M1/M2 8GB	Small / Medium	0.5-1.5 GB	中	快
M1/M2 16GB	Large v3 Turbo	1.5 GB	高	较快
M1 Pro/Max	Large v3	3 GB	极高	中
M2/M3 Pro	Large v3	3 GB	极高	快
M3/M4 Max	Large v3 + Parakeet	多个	极高	极快
Intel Mac	Small	0.5 GB	中	慢

下载模型

选择对应模型
点击"Download"
等待下载完成(几分钟到几十分钟,取决于网速)
下载完成后会自动激活

步骤 2: 选择默认语言

进入设置:

General → Default Language: 设为"English"或"Auto-detect"
English: 永远当英文识别,适合纯英文场景
Auto-detect: 自动检测,适合多语言场景

步骤 3: 配置音频源

MacWhisper 可以监听多种音频源:

实时录制源

打开 MacWhisper
点击 "Live Transcription"(实时转写)
在音频输入下拉菜单选择:
- System Audio: 整个 Mac 的系统音频(需要 Pro 版)
- BlackHole 2ch: 通过虚拟声卡的输出
- External Microphone: 外接麦克风
- Built-in Microphone: 内置麦克风

推荐: System Audio(Pro 版)或 BlackHole 2ch(免费版)

步骤 4: 显示样式设置

进入 Settings → Display:

Font Size: 推荐 18-24 pt
Window Position: 屏幕底部或副屏
Always on Top: 开启(始终置顶)
Background Opacity: 70%(半透明)
Color Theme: 深色主题(护眼)

实时转写使用

基础流程

步骤 1: 启动 Live Transcription

主界面点击 "Live Transcription" 按钮
选择音频源
选择语言(English / Chinese / 等)

步骤 2: 开始录制

点击红色录制按钮
在另一个 App 播放视频或讲话
字幕会实时出现在 MacWhisper 窗口

步骤 3: 调整窗口

拖动到合适位置
调整大小
改变透明度
设置始终置顶

步骤 4: 结束录制

点击停止按钮
系统会自动保存转写文本
可以导出为 TXT/SRT/VTT 等格式

自动会议捕获(Pro 版)

Pro 版有一个杀手锏功能: 自动捕获会议音频。

设置步骤

进入 Settings → Auto-Recording
启用 "Auto-record meetings"
选择支持的会议软件:
- Zoom
- Microsoft Teams
- Webex
- Google Meet
授权 MacWhisper 访问音频
当你加入会议时,自动开始录制

优势: 无需手动操作,会议结束就有完整记录。

翻译功能(Pro 版)

Pro 版支持实时翻译。

配置翻译

进入 Settings → Translation
启用 "Live Translation"
选择翻译方向:
- Source: 源语言(自动检测)
- Target: 目标语言(中文)
翻译引擎选择:
- Whisper(Translate to English): 仅支持转英文
- External API: 配合 OpenAI/Claude(需自己配 Key)

实战配置

最佳配置是:

ASR: Whisper Large v3(本地)
翻译: Claude API 或 GPT-4 API(质量最高)

这样既保证识别精度,又有高质量翻译。

高级功能

1. 自定义术语词典

类似讯飞的热词,但更灵活。

设置步骤

Settings → Vocabulary
点击 "+" 添加术语
输入术语和正确写法
Whisper 会优先使用这些术语

示例

Sam Altman → Sam Altman(避免识别为 Sam Oldman)
GPT-4 → GPT-4(避免拆分)
LLM → LLM(保持缩写)

2. 说话人识别(Pro+ 版)

Pro+ 版支持区分不同说话人。

适用场景

多人会议
访谈节目
圆桌讨论
课堂对话

使用步骤

启用 "Speaker Diarization"

转写完成后,会自动标注:

Speaker 1: Hello everyone, today we'll discuss...
Speaker 2: Thanks for having me, I'd like to...

可以手动重命名说话人

3. 批量处理音视频文件

MacWhisper 不仅能实时转写,还能批量处理已有文件。

使用步骤

主界面 → "Transcribe Files"
拖入多个音视频文件(MP3/MP4/WAV/MOV 等)
选择模型和语言
点击 "Start"
批量转写完成后,可批量导出

适用场景

已有讲座录音的字幕生成
批量视频字幕制作
会议录像处理

4. 字幕导出

支持多种字幕格式:

SRT: 通用字幕格式,几乎所有播放器都支持
VTT: Web 视频字幕格式
TXT: 纯文本
JSON: 包含时间戳的 JSON
CSV: 用于 Excel 编辑

5. 集成到工作流

MacWhisper 可以与 macOS 深度集成。

Shortcuts 集成

可以创建 macOS Shortcuts:

"选中文件 → MacWhisper 转写"
"录制屏幕 → 自动转写"
"iPhone 录音 → AirDrop → 自动转写"

Services 集成

在右键菜单中添加:

"Transcribe with MacWhisper"
任何音视频文件可以右键转写

模型详解

Whisper 模型对比

MacWhisper 支持多个 Whisper 模型,选择很重要:

Tiny(75 MB)

速度: 极快(实时)
精度: 低
适合: 快速预览,低端 Mac

Base(150 MB)

速度: 快
精度: 中低
适合: Intel Mac,简单转写

Small(500 MB)

速度: 较快
精度: 中
适合: 8GB Mac,日常使用

Medium(1.5 GB)

速度: 中
精度: 中高
适合: 16GB Mac

Large v3(3 GB)

速度: 较慢(M1+ 流畅)
精度: 极高
适合: 16GB+ Mac,正式场合

Large v3 Turbo(1.5 GB)

速度: 快(优化版)
精度: 接近 Large v3
适合: 大多数用户的首选

Nvidia Parakeet(Pro+ 版)

Pro+ 版支持 Nvidia 的 Parakeet 模型:

仅英文
速度极快
适合英文专项使用

模型选择建议

个人日常使用

首选: Large v3 Turbo
理由: 平衡精度和速度

重要正式场合

首选: Large v3
理由: 最高精度

老款 Mac(8GB 内存)

首选: Small
理由: 不卡顿

实战技巧

技巧 1: 模型预加载

第一次使用模型会比较慢(需要加载到内存)。

优化:

启动 MacWhisper 时选择"自动加载默认模型"
模型会在后台预加载
实际使用时即点即用

技巧 2: 避免 Auto-detect

虽然"Auto-detect"听起来方便,但实际上:

容易把某些口音识别为其他语言
某些模型语言切换较慢

最佳实践: 确定语言后手动锁定。

技巧 3: 配合 BlackHole 使用

完整流程:

系统输出 → BlackHole 2ch(或多输出设备)
MacWhisper 输入源 → BlackHole 2ch
播放视频/会议 → 自动捕获

技巧 4: 多模型并行

Pro+ 版可以同时运行多个模型:

Whisper Large v3(精度优先)
Parakeet(速度优先)

对比两个的输出,选最准的。

技巧 5: VAD 阈值调整

VAD = Voice Activity Detection(语音活动检测)

如果出现:

字幕重复
静音时段误识别

调整 VAD 阈值:

Settings → Advanced → VAD Threshold
默认 0.5,可以调到 0.6-0.7
数值越高,越严格(误识别少)

技巧 6: 与 Claude 配合做翻译

Whisper 原生不支持中文翻译,但可以:

MacWhisper 实时转写英文
转写结果发给 Claude(通过 API)
Claude 返回中文翻译
显示在副屏

实现方法

用 Pro 版的 API 集成功能
或用 Hammerspoon 等自动化工具
或用 Apple Shortcuts

具体配置可联系作者咨询。

与讯飞同传对比

很多用户都问: MacWhisper vs 讯飞同传,该用哪个?

优劣对比

维度	MacWhisper	讯飞同传
中文识别	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
英文识别	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
重口音	⭐⭐⭐⭐⭐	⭐⭐⭐
中英翻译	⭐⭐⭐(需配合)	⭐⭐⭐⭐⭐
隐私	⭐⭐⭐⭐⭐	⭐⭐⭐
网络要求	⭐⭐⭐⭐⭐(无)	⭐⭐(必须)
价格	€59 一次性	持续订阅
易用性	⭐⭐⭐⭐	⭐⭐⭐⭐⭐

我的建议

中英互译为主 → 讯飞同传(主)+ MacWhisper(备)
英文为主 → MacWhisper(主)+ 讯飞同传(备)
保密场合 → 只用 MacWhisper
网络不稳 → MacWhisper(本地)
预算紧 → MacWhisper(一次性)

常见问题

问题 1: 模型下载失败

原因: 网络问题

解决:

切换网络(尝试 5G 热点)
使用代理
从 Hugging Face 手动下载,放到 MacWhisper 模型目录

模型目录: ~/Library/Application Support/MacWhisper/models/

问题 2: 转写速度慢

原因: 模型太大或硬件性能不够

解决:

切换到更小的模型(Large v3 → Small)
关闭其他高 CPU 程序
升级 Mac(M 系列芯片表现更好)

问题 3: 转写结果重复

原因: VAD 阈值设置问题

解决: 调整 VAD 阈值到 0.6-0.7

问题 4: System Audio 选项不可用

原因: 免费版限制

解决: 升级到 Pro 版,或使用 BlackHole 2ch

问题 5: 转写英文中夹杂中文

原因: 未锁定语言

解决: Settings → Default Language → 选择 English

问题 6: Pro 版无法激活

原因: 网络问题或购买记录问题

解决:

检查 Gumroad 邮件
重新输入 license key
联系 MacWhisper 客服

客服与社区

官方支持: support@goodsnooze.com
Twitter: @MacWhisper
Discord: 官网有链接
更新频率: 每月 1-2 次

我的使用心得

作为 MacWhisper 多年用户:

最大优点

隐私真的好: 涉密会议放心用
永久买断: 不像订阅一直交钱
持续更新: 模型越来越强

最大痛点

中文翻译弱: 必须配合其他工具
首次加载慢: 大模型加载需时间
没有手机版: 仅 Mac

最佳实践

我自己的工作流:

1. 启动 MacWhisper(Pro+ 版)
2. Auto-record Zoom 会议
3. 实时转写到副屏
4. Claude API 自动翻译成中文
5. 会议结束自动保存记录

这套配置一次设置,长期受益。

本节小结

✅ MacWhisper 是 Mac 平台最优雅的本地转写工具
✅ 推荐 Pro+ 版(€59 永久买断)
✅ 模型首选 Large v3 Turbo(平衡精度速度)
✅ 配合 Claude/GPT API 实现中文翻译
✅ 完全本地,适合涉密场合
⚠️ 需要 16GB+ 内存才能流畅运行大模型

下一步

已完成 Mac 配置,跳到 3.4 沉浸式翻译
Windows 用户阅读 3.3 Buzz

💬 MacWhisper 高级用法:加微信 15600871059,加入【专业译员工具社群】,享每月软硬件评测、AI 同传企业培训、AI 工具选型咨询、共享术语表与配置文件、会员互测口音识别效果等福利。可分享我的工作流和自动化脚本。

2026 实时翻译 AI 工具全攻略: 软件和智能硬件