3.2 MacWhisper(Mac 用户)
MacWhisper 是 Mac 平台上最优雅的本地语音转写工具,基于 OpenAI Whisper 模型。如果你是 Mac 用户,这几乎是必装的。
快速概览
| 项目 | 信息 |
|---|---|
| 官方网址 | https://goodsnooze.gumroad.com/l/macwhisper |
| App Store | 搜索 "Whisper Transcription" |
| 支持平台 | macOS 13+ (Apple Silicon 性能最佳) |
| 价格 | 免费版 / Pro €19 / Pro+ €59(永久买断) |
| 支持语言 | 99+ 语言(Whisper 模型) |
| 延迟 | 1-3 秒(取决于硬件) |
| 隐私 | ⭐⭐⭐⭐⭐ 完全本地 |
| 难度 | ⭐⭐(易上手) |
为什么选 MacWhisper
优势
1. 完全本地运行
- 数据不上传任何服务器
- 完全离线可用
- 适合涉密会议
- 没有"数据出境"风险
2. Whisper Large v3 业界顶级
- OpenAI 训练的开源模型
- 重口音英语处理强
- 多语言支持
- 持续更新
3. Mac 原生体验
- 完美适配 Apple Silicon
- 与 macOS 深度集成
- 可监听任意 App 的音频
- 集成 Nvidia Parakeet 等其他模型
4. 永久买断
- 免费版功能基础
- Pro 版 €19,买断
- Pro+ 版 €59,买断
- 不订阅,一次性付费
5. 隐私至上
- 所有处理在本机
- 没有数据收集
- 没有云端依赖
- 可以完全断网使用
局限
1. 需要 Mac
- 仅支持 macOS
- Windows 用户用 Buzz
2. 硬件要求
- 跑大模型需要 16GB+ 内存
- M1/M2/M3/M4 芯片表现最佳
- Intel Mac 可能慢
3. 中文翻译需配合
- Whisper 原生只能"翻译成英文"
- 要中文翻译需配合其他工具
- Pro 版本提供翻译功能
4. 模型文件大
- Large v3: 约 3 GB
- 需要下载时间
- 占用本地存储
下载与安装
选项 1: 从官方网站下载(推荐)
步骤 1: 访问官网
https://goodsnooze.gumroad.com/l/macwhisper
步骤 2: 选择版本
页面上有三个版本:
- Free: 免费版,基础功能
- Pro: €19,完整功能
- Pro+: €59,所有高级功能
新手建议先试免费版,满意再升级。
步骤 3: 下载安装
- 点击"Download Free"或购买后下载
- 下载
.zip或.dmg文件 - 解压后双击
.app文件 - 拖到"应用程序"文件夹
步骤 4: 首次打开
- 在"应用程序"中找到 MacWhisper
- 第一次打开:
- 可能提示"无法验证开发者"
- 系统设置 → 隐私与安全性 → 仍要打开
- 应用启动后,会引导你选择语音模型
选项 2: 从 App Store 下载
步骤 1: 打开 App Store
步骤 2: 搜索 "Whisper Transcription"
⚠️ 注意:App Store 版本和 Gumroad 版本是同一个软件,但 App Store 价格略高,且不能跨平台。
步骤 3: 购买并下载
- 免费版可直接下载
- Pro 版需要内购解锁
首次配置
步骤 1: 选择语音模型
第一次打开 MacWhisper,会提示下载语音模型。
推荐模型
根据你的 Mac 配置选择:
| Mac 型号 | 推荐模型 | 文件大小 | 精度 | 速度 |
|---|---|---|---|---|
| M1/M2 8GB | Small / Medium | 0.5-1.5 GB | 中 | 快 |
| M1/M2 16GB | Large v3 Turbo | 1.5 GB | 高 | 较快 |
| M1 Pro/Max | Large v3 | 3 GB | 极高 | 中 |
| M2/M3 Pro | Large v3 | 3 GB | 极高 | 快 |
| M3/M4 Max | Large v3 + Parakeet | 多个 | 极高 | 极快 |
| Intel Mac | Small | 0.5 GB | 中 | 慢 |
下载模型
- 选择对应模型
- 点击"Download"
- 等待下载完成(几分钟到几十分钟,取决于网速)
- 下载完成后会自动激活
步骤 2: 选择默认语言
进入设置:
- General → Default Language: 设为"English"或"Auto-detect"
- English: 永远当英文识别,适合纯英文场景
- Auto-detect: 自动检测,适合多语言场景
步骤 3: 配置音频源
MacWhisper 可以监听多种音频源:
实时录制源
- 打开 MacWhisper
- 点击 "Live Transcription"(实时转写)
- 在音频输入下拉菜单选择:
- System Audio: 整个 Mac 的系统音频(需要 Pro 版)
- BlackHole 2ch: 通过虚拟声卡的输出
- External Microphone: 外接麦克风
- Built-in Microphone: 内置麦克风
推荐: System Audio(Pro 版)或 BlackHole 2ch(免费版)
步骤 4: 显示样式设置
进入 Settings → Display:
- Font Size: 推荐 18-24 pt
- Window Position: 屏幕底部或副屏
- Always on Top: 开启(始终置顶)
- Background Opacity: 70%(半透明)
- Color Theme: 深色主题(护眼)
实时转写使用
基础流程
步骤 1: 启动 Live Transcription
- 主界面点击 "Live Transcription" 按钮
- 选择音频源
- 选择语言(English / Chinese / 等)
步骤 2: 开始录制
- 点击红色录制按钮
- 在另一个 App 播放视频或讲话
- 字幕会实时出现在 MacWhisper 窗口
步骤 3: 调整窗口
- 拖动到合适位置
- 调整大小
- 改变透明度
- 设置始终置顶
步骤 4: 结束录制
- 点击停止按钮
- 系统会自动保存转写文本
- 可以导出为 TXT/SRT/VTT 等格式
自动会议捕获(Pro 版)
Pro 版有一个杀手锏功能: 自动捕获会议音频。
设置步骤
- 进入 Settings → Auto-Recording
- 启用 "Auto-record meetings"
- 选择支持的会议软件:
- Zoom
- Microsoft Teams
- Webex
- Google Meet
- 授权 MacWhisper 访问音频
- 当你加入会议时,自动开始录制
优势: 无需手动操作,会议结束就有完整记录。
翻译功能(Pro 版)
Pro 版支持实时翻译。
配置翻译
- 进入 Settings → Translation
- 启用 "Live Translation"
- 选择翻译方向:
- Source: 源语言(自动检测)
- Target: 目标语言(中文)
- 翻译引擎选择:
- Whisper(Translate to English): 仅支持转英文
- External API: 配合 OpenAI/Claude(需自己配 Key)
实战配置
最佳配置是:
- ASR: Whisper Large v3(本地)
- 翻译: Claude API 或 GPT-4 API(质量最高)
这样既保证识别精度,又有高质量翻译。
高级功能
1. 自定义术语词典
类似讯飞的热词,但更灵活。
设置步骤
- Settings → Vocabulary
- 点击 "+" 添加术语
- 输入术语和正确写法
- Whisper 会优先使用这些术语
示例
Sam Altman → Sam Altman(避免识别为 Sam Oldman)
GPT-4 → GPT-4(避免拆分)
LLM → LLM(保持缩写)
2. 说话人识别(Pro+ 版)
Pro+ 版支持区分不同说话人。
适用场景
- 多人会议
- 访谈节目
- 圆桌讨论
- 课堂对话
使用步骤
- 启用 "Speaker Diarization"
- 转写完成后,会自动标注:
Speaker 1: Hello everyone, today we'll discuss... Speaker 2: Thanks for having me, I'd like to... - 可以手动重命名说话人
3. 批量处理音视频文件
MacWhisper 不仅能实时转写,还能批量处理已有文件。
使用步骤
- 主界面 → "Transcribe Files"
- 拖入多个音视频文件(MP3/MP4/WAV/MOV 等)
- 选择模型和语言
- 点击 "Start"
- 批量转写完成后,可批量导出
适用场景
- 已有讲座录音的字幕生成
- 批量视频字幕制作
- 会议录像处理
4. 字幕导出
支持多种字幕格式:
- SRT: 通用字幕格式,几乎所有播放器都支持
- VTT: Web 视频字幕格式
- TXT: 纯文本
- JSON: 包含时间戳的 JSON
- CSV: 用于 Excel 编辑
5. 集成到工作流
MacWhisper 可以与 macOS 深度集成。
Shortcuts 集成
可以创建 macOS Shortcuts:
- "选中文件 → MacWhisper 转写"
- "录制屏幕 → 自动转写"
- "iPhone 录音 → AirDrop → 自动转写"
Services 集成
在右键菜单中添加:
- "Transcribe with MacWhisper"
- 任何音视频文件可以右键转写
模型详解
Whisper 模型对比
MacWhisper 支持多个 Whisper 模型,选择很重要:
Tiny(75 MB)
- 速度: 极快(实时)
- 精度: 低
- 适合: 快速预览,低端 Mac
Base(150 MB)
- 速度: 快
- 精度: 中低
- 适合: Intel Mac,简单转写
Small(500 MB)
- 速度: 较快
- 精度: 中
- 适合: 8GB Mac,日常使用
Medium(1.5 GB)
- 速度: 中
- 精度: 中高
- 适合: 16GB Mac
Large v3(3 GB)
- 速度: 较慢(M1+ 流畅)
- 精度: 极高
- 适合: 16GB+ Mac,正式场合
Large v3 Turbo(1.5 GB)
- 速度: 快(优化版)
- 精度: 接近 Large v3
- 适合: 大多数用户的首选
Nvidia Parakeet(Pro+ 版)
Pro+ 版支持 Nvidia 的 Parakeet 模型:
- 仅英文
- 速度极快
- 适合英文专项使用
模型选择建议
个人日常使用
- 首选: Large v3 Turbo
- 理由: 平衡精度和速度
重要正式场合
- 首选: Large v3
- 理由: 最高精度
老款 Mac(8GB 内存)
- 首选: Small
- 理由: 不卡顿
实战技巧
技巧 1: 模型预加载
第一次使用模型会比较慢(需要加载到内存)。
优化:
- 启动 MacWhisper 时选择"自动加载默认模型"
- 模型会在后台预加载
- 实际使用时即点即用
技巧 2: 避免 Auto-detect
虽然"Auto-detect"听起来方便,但实际上:
- 容易把某些口音识别为其他语言
- 某些模型语言切换较慢
最佳实践: 确定语言后手动锁定。
技巧 3: 配合 BlackHole 使用
完整流程:
- 系统输出 → BlackHole 2ch(或多输出设备)
- MacWhisper 输入源 → BlackHole 2ch
- 播放视频/会议 → 自动捕获
技巧 4: 多模型并行
Pro+ 版可以同时运行多个模型:
- Whisper Large v3(精度优先)
- Parakeet(速度优先)
对比两个的输出,选最准的。
技巧 5: VAD 阈值调整
VAD = Voice Activity Detection(语音活动检测)
如果出现:
- 字幕重复
- 静音时段误识别
调整 VAD 阈值:
- Settings → Advanced → VAD Threshold
- 默认 0.5,可以调到 0.6-0.7
- 数值越高,越严格(误识别少)
技巧 6: 与 Claude 配合做翻译
Whisper 原生不支持中文翻译,但可以:
- MacWhisper 实时转写英文
- 转写结果发给 Claude(通过 API)
- Claude 返回中文翻译
- 显示在副屏
实现方法
- 用 Pro 版的 API 集成功能
- 或用 Hammerspoon 等自动化工具
- 或用 Apple Shortcuts
具体配置可联系作者咨询。
与讯飞同传对比
很多用户都问: MacWhisper vs 讯飞同传,该用哪个?
优劣对比
| 维度 | MacWhisper | 讯飞同传 |
|---|---|---|
| 中文识别 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 英文识别 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 重口音 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ |
| 中英翻译 | ⭐⭐⭐(需配合) | ⭐⭐⭐⭐⭐ |
| 隐私 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ |
| 网络要求 | ⭐⭐⭐⭐⭐(无) | ⭐⭐(必须) |
| 价格 | €59 一次性 | 持续订阅 |
| 易用性 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
我的建议
- 中英互译为主 → 讯飞同传(主)+ MacWhisper(备)
- 英文为主 → MacWhisper(主)+ 讯飞同传(备)
- 保密场合 → 只用 MacWhisper
- 网络不稳 → MacWhisper(本地)
- 预算紧 → MacWhisper(一次性)
常见问题
问题 1: 模型下载失败
原因: 网络问题
解决:
- 切换网络(尝试 5G 热点)
- 使用代理
- 从 Hugging Face 手动下载,放到 MacWhisper 模型目录
模型目录: ~/Library/Application Support/MacWhisper/models/
问题 2: 转写速度慢
原因: 模型太大或硬件性能不够
解决:
- 切换到更小的模型(Large v3 → Small)
- 关闭其他高 CPU 程序
- 升级 Mac(M 系列芯片表现更好)
问题 3: 转写结果重复
原因: VAD 阈值设置问题
解决: 调整 VAD 阈值到 0.6-0.7
问题 4: System Audio 选项不可用
原因: 免费版限制
解决: 升级到 Pro 版,或使用 BlackHole 2ch
问题 5: 转写英文中夹杂中文
原因: 未锁定语言
解决: Settings → Default Language → 选择 English
问题 6: Pro 版无法激活
原因: 网络问题或购买记录问题
解决:
- 检查 Gumroad 邮件
- 重新输入 license key
- 联系 MacWhisper 客服
客服与社区
- 官方支持: support@goodsnooze.com
- Twitter: @MacWhisper
- Discord: 官网有链接
- 更新频率: 每月 1-2 次
我的使用心得
作为 MacWhisper 多年用户:
最大优点
- 隐私真的好: 涉密会议放心用
- 永久买断: 不像订阅一直交钱
- 持续更新: 模型越来越强
最大痛点
- 中文翻译弱: 必须配合其他工具
- 首次加载慢: 大模型加载需时间
- 没有手机版: 仅 Mac
最佳实践
我自己的工作流:
1. 启动 MacWhisper(Pro+ 版)
2. Auto-record Zoom 会议
3. 实时转写到副屏
4. Claude API 自动翻译成中文
5. 会议结束自动保存记录
这套配置一次设置,长期受益。
本节小结
- ✅ MacWhisper 是 Mac 平台最优雅的本地转写工具
- ✅ 推荐 Pro+ 版(€59 永久买断)
- ✅ 模型首选 Large v3 Turbo(平衡精度速度)
- ✅ 配合 Claude/GPT API 实现中文翻译
- ✅ 完全本地,适合涉密场合
- ⚠️ 需要 16GB+ 内存才能流畅运行大模型
下一步
💬 MacWhisper 高级用法:加微信 15600871059,加入【专业译员工具社群】,享每月软硬件评测、AI 同传企业培训、AI 工具选型咨询、共享术语表与配置文件、会员互测口音识别效果等福利。可分享我的工作流和自动化脚本。