3.2 MacWhisper(Mac 用户)

MacWhisper 是 Mac 平台上最优雅的本地语音转写工具,基于 OpenAI Whisper 模型。如果你是 Mac 用户,这几乎是必装的。

快速概览

项目信息
官方网址https://goodsnooze.gumroad.com/l/macwhisper
App Store搜索 "Whisper Transcription"
支持平台macOS 13+ (Apple Silicon 性能最佳)
价格免费版 / Pro €19 / Pro+ €59(永久买断)
支持语言99+ 语言(Whisper 模型)
延迟1-3 秒(取决于硬件)
隐私⭐⭐⭐⭐⭐ 完全本地
难度⭐⭐(易上手)

为什么选 MacWhisper

优势

1. 完全本地运行

  • 数据不上传任何服务器
  • 完全离线可用
  • 适合涉密会议
  • 没有"数据出境"风险

2. Whisper Large v3 业界顶级

  • OpenAI 训练的开源模型
  • 重口音英语处理强
  • 多语言支持
  • 持续更新

3. Mac 原生体验

  • 完美适配 Apple Silicon
  • 与 macOS 深度集成
  • 可监听任意 App 的音频
  • 集成 Nvidia Parakeet 等其他模型

4. 永久买断

  • 免费版功能基础
  • Pro 版 €19,买断
  • Pro+ 版 €59,买断
  • 不订阅,一次性付费

5. 隐私至上

  • 所有处理在本机
  • 没有数据收集
  • 没有云端依赖
  • 可以完全断网使用

局限

1. 需要 Mac

  • 仅支持 macOS
  • Windows 用户用 Buzz

2. 硬件要求

  • 跑大模型需要 16GB+ 内存
  • M1/M2/M3/M4 芯片表现最佳
  • Intel Mac 可能慢

3. 中文翻译需配合

  • Whisper 原生只能"翻译成英文"
  • 要中文翻译需配合其他工具
  • Pro 版本提供翻译功能

4. 模型文件大

  • Large v3: 约 3 GB
  • 需要下载时间
  • 占用本地存储

下载与安装

选项 1: 从官方网站下载(推荐)

步骤 1: 访问官网

https://goodsnooze.gumroad.com/l/macwhisper

步骤 2: 选择版本

页面上有三个版本:

  • Free: 免费版,基础功能
  • Pro: €19,完整功能
  • Pro+: €59,所有高级功能

新手建议先试免费版,满意再升级。

步骤 3: 下载安装

  1. 点击"Download Free"或购买后下载
  2. 下载 .zip.dmg 文件
  3. 解压后双击 .app 文件
  4. 拖到"应用程序"文件夹

步骤 4: 首次打开

  1. 在"应用程序"中找到 MacWhisper
  2. 第一次打开:
    • 可能提示"无法验证开发者"
    • 系统设置 → 隐私与安全性 → 仍要打开
  3. 应用启动后,会引导你选择语音模型

选项 2: 从 App Store 下载

步骤 1: 打开 App Store

步骤 2: 搜索 "Whisper Transcription"

⚠️ 注意:App Store 版本和 Gumroad 版本是同一个软件,但 App Store 价格略高,且不能跨平台。

步骤 3: 购买并下载

  • 免费版可直接下载
  • Pro 版需要内购解锁

首次配置

步骤 1: 选择语音模型

第一次打开 MacWhisper,会提示下载语音模型。

推荐模型

根据你的 Mac 配置选择:

Mac 型号推荐模型文件大小精度速度
M1/M2 8GBSmall / Medium0.5-1.5 GB
M1/M2 16GBLarge v3 Turbo1.5 GB较快
M1 Pro/MaxLarge v33 GB极高
M2/M3 ProLarge v33 GB极高
M3/M4 MaxLarge v3 + Parakeet多个极高极快
Intel MacSmall0.5 GB

下载模型

  1. 选择对应模型
  2. 点击"Download"
  3. 等待下载完成(几分钟到几十分钟,取决于网速)
  4. 下载完成后会自动激活

步骤 2: 选择默认语言

进入设置:

  • GeneralDefault Language: 设为"English"或"Auto-detect"
  • English: 永远当英文识别,适合纯英文场景
  • Auto-detect: 自动检测,适合多语言场景

步骤 3: 配置音频源

MacWhisper 可以监听多种音频源:

实时录制源

  1. 打开 MacWhisper
  2. 点击 "Live Transcription"(实时转写)
  3. 在音频输入下拉菜单选择:
    • System Audio: 整个 Mac 的系统音频(需要 Pro 版)
    • BlackHole 2ch: 通过虚拟声卡的输出
    • External Microphone: 外接麦克风
    • Built-in Microphone: 内置麦克风

推荐: System Audio(Pro 版)或 BlackHole 2ch(免费版)

步骤 4: 显示样式设置

进入 Settings → Display:

  • Font Size: 推荐 18-24 pt
  • Window Position: 屏幕底部或副屏
  • Always on Top: 开启(始终置顶)
  • Background Opacity: 70%(半透明)
  • Color Theme: 深色主题(护眼)

实时转写使用

基础流程

步骤 1: 启动 Live Transcription

  1. 主界面点击 "Live Transcription" 按钮
  2. 选择音频源
  3. 选择语言(English / Chinese / 等)

步骤 2: 开始录制

  1. 点击红色录制按钮
  2. 在另一个 App 播放视频或讲话
  3. 字幕会实时出现在 MacWhisper 窗口

步骤 3: 调整窗口

  • 拖动到合适位置
  • 调整大小
  • 改变透明度
  • 设置始终置顶

步骤 4: 结束录制

  1. 点击停止按钮
  2. 系统会自动保存转写文本
  3. 可以导出为 TXT/SRT/VTT 等格式

自动会议捕获(Pro 版)

Pro 版有一个杀手锏功能: 自动捕获会议音频

设置步骤

  1. 进入 Settings → Auto-Recording
  2. 启用 "Auto-record meetings"
  3. 选择支持的会议软件:
    • Zoom
    • Microsoft Teams
    • Webex
    • Google Meet
  4. 授权 MacWhisper 访问音频
  5. 当你加入会议时,自动开始录制

优势: 无需手动操作,会议结束就有完整记录。

翻译功能(Pro 版)

Pro 版支持实时翻译。

配置翻译

  1. 进入 Settings → Translation
  2. 启用 "Live Translation"
  3. 选择翻译方向:
    • Source: 源语言(自动检测)
    • Target: 目标语言(中文)
  4. 翻译引擎选择:
    • Whisper(Translate to English): 仅支持转英文
    • External API: 配合 OpenAI/Claude(需自己配 Key)

实战配置

最佳配置是:

  • ASR: Whisper Large v3(本地)
  • 翻译: Claude API 或 GPT-4 API(质量最高)

这样既保证识别精度,又有高质量翻译。

高级功能

1. 自定义术语词典

类似讯飞的热词,但更灵活。

设置步骤

  1. Settings → Vocabulary
  2. 点击 "+" 添加术语
  3. 输入术语和正确写法
  4. Whisper 会优先使用这些术语

示例

Sam Altman → Sam Altman(避免识别为 Sam Oldman)
GPT-4 → GPT-4(避免拆分)
LLM → LLM(保持缩写)

2. 说话人识别(Pro+ 版)

Pro+ 版支持区分不同说话人。

适用场景

  • 多人会议
  • 访谈节目
  • 圆桌讨论
  • 课堂对话

使用步骤

  1. 启用 "Speaker Diarization"
  2. 转写完成后,会自动标注:
    Speaker 1: Hello everyone, today we'll discuss...
    Speaker 2: Thanks for having me, I'd like to...
    
  3. 可以手动重命名说话人

3. 批量处理音视频文件

MacWhisper 不仅能实时转写,还能批量处理已有文件。

使用步骤

  1. 主界面 → "Transcribe Files"
  2. 拖入多个音视频文件(MP3/MP4/WAV/MOV 等)
  3. 选择模型和语言
  4. 点击 "Start"
  5. 批量转写完成后,可批量导出

适用场景

  • 已有讲座录音的字幕生成
  • 批量视频字幕制作
  • 会议录像处理

4. 字幕导出

支持多种字幕格式:

  • SRT: 通用字幕格式,几乎所有播放器都支持
  • VTT: Web 视频字幕格式
  • TXT: 纯文本
  • JSON: 包含时间戳的 JSON
  • CSV: 用于 Excel 编辑

5. 集成到工作流

MacWhisper 可以与 macOS 深度集成。

Shortcuts 集成

可以创建 macOS Shortcuts:

  • "选中文件 → MacWhisper 转写"
  • "录制屏幕 → 自动转写"
  • "iPhone 录音 → AirDrop → 自动转写"

Services 集成

在右键菜单中添加:

  • "Transcribe with MacWhisper"
  • 任何音视频文件可以右键转写

模型详解

Whisper 模型对比

MacWhisper 支持多个 Whisper 模型,选择很重要:

Tiny(75 MB)

  • 速度: 极快(实时)
  • 精度: 低
  • 适合: 快速预览,低端 Mac

Base(150 MB)

  • 速度: 快
  • 精度: 中低
  • 适合: Intel Mac,简单转写

Small(500 MB)

  • 速度: 较快
  • 精度: 中
  • 适合: 8GB Mac,日常使用

Medium(1.5 GB)

  • 速度: 中
  • 精度: 中高
  • 适合: 16GB Mac

Large v3(3 GB)

  • 速度: 较慢(M1+ 流畅)
  • 精度: 极高
  • 适合: 16GB+ Mac,正式场合

Large v3 Turbo(1.5 GB)

  • 速度: 快(优化版)
  • 精度: 接近 Large v3
  • 适合: 大多数用户的首选

Nvidia Parakeet(Pro+ 版)

Pro+ 版支持 Nvidia 的 Parakeet 模型:

  • 仅英文
  • 速度极快
  • 适合英文专项使用

模型选择建议

个人日常使用

  • 首选: Large v3 Turbo
  • 理由: 平衡精度和速度

重要正式场合

  • 首选: Large v3
  • 理由: 最高精度

老款 Mac(8GB 内存)

  • 首选: Small
  • 理由: 不卡顿

实战技巧

技巧 1: 模型预加载

第一次使用模型会比较慢(需要加载到内存)。

优化:

  1. 启动 MacWhisper 时选择"自动加载默认模型"
  2. 模型会在后台预加载
  3. 实际使用时即点即用

技巧 2: 避免 Auto-detect

虽然"Auto-detect"听起来方便,但实际上:

  • 容易把某些口音识别为其他语言
  • 某些模型语言切换较慢

最佳实践: 确定语言后手动锁定

技巧 3: 配合 BlackHole 使用

完整流程:

  1. 系统输出 → BlackHole 2ch(或多输出设备)
  2. MacWhisper 输入源 → BlackHole 2ch
  3. 播放视频/会议 → 自动捕获

技巧 4: 多模型并行

Pro+ 版可以同时运行多个模型:

  • Whisper Large v3(精度优先)
  • Parakeet(速度优先)

对比两个的输出,选最准的。

技巧 5: VAD 阈值调整

VAD = Voice Activity Detection(语音活动检测)

如果出现:

  • 字幕重复
  • 静音时段误识别

调整 VAD 阈值:

  • Settings → Advanced → VAD Threshold
  • 默认 0.5,可以调到 0.6-0.7
  • 数值越高,越严格(误识别少)

技巧 6: 与 Claude 配合做翻译

Whisper 原生不支持中文翻译,但可以:

  1. MacWhisper 实时转写英文
  2. 转写结果发给 Claude(通过 API)
  3. Claude 返回中文翻译
  4. 显示在副屏

实现方法

  • 用 Pro 版的 API 集成功能
  • 或用 Hammerspoon 等自动化工具
  • 或用 Apple Shortcuts

具体配置可联系作者咨询。

与讯飞同传对比

很多用户都问: MacWhisper vs 讯飞同传,该用哪个?

优劣对比

维度MacWhisper讯飞同传
中文识别⭐⭐⭐⭐⭐⭐⭐⭐⭐
英文识别⭐⭐⭐⭐⭐⭐⭐⭐⭐
重口音⭐⭐⭐⭐⭐⭐⭐⭐
中英翻译⭐⭐⭐(需配合)⭐⭐⭐⭐⭐
隐私⭐⭐⭐⭐⭐⭐⭐⭐
网络要求⭐⭐⭐⭐⭐(无)⭐⭐(必须)
价格€59 一次性持续订阅
易用性⭐⭐⭐⭐⭐⭐⭐⭐⭐

我的建议

  • 中英互译为主 → 讯飞同传(主)+ MacWhisper(备)
  • 英文为主 → MacWhisper(主)+ 讯飞同传(备)
  • 保密场合 → 只用 MacWhisper
  • 网络不稳 → MacWhisper(本地)
  • 预算紧 → MacWhisper(一次性)

常见问题

问题 1: 模型下载失败

原因: 网络问题

解决:

  1. 切换网络(尝试 5G 热点)
  2. 使用代理
  3. 从 Hugging Face 手动下载,放到 MacWhisper 模型目录

模型目录: ~/Library/Application Support/MacWhisper/models/

问题 2: 转写速度慢

原因: 模型太大或硬件性能不够

解决:

  1. 切换到更小的模型(Large v3 → Small)
  2. 关闭其他高 CPU 程序
  3. 升级 Mac(M 系列芯片表现更好)

问题 3: 转写结果重复

原因: VAD 阈值设置问题

解决: 调整 VAD 阈值到 0.6-0.7

问题 4: System Audio 选项不可用

原因: 免费版限制

解决: 升级到 Pro 版,或使用 BlackHole 2ch

问题 5: 转写英文中夹杂中文

原因: 未锁定语言

解决: Settings → Default Language → 选择 English

问题 6: Pro 版无法激活

原因: 网络问题或购买记录问题

解决:

  1. 检查 Gumroad 邮件
  2. 重新输入 license key
  3. 联系 MacWhisper 客服

客服与社区

  • 官方支持: support@goodsnooze.com
  • Twitter: @MacWhisper
  • Discord: 官网有链接
  • 更新频率: 每月 1-2 次

我的使用心得

作为 MacWhisper 多年用户:

最大优点

  • 隐私真的好: 涉密会议放心用
  • 永久买断: 不像订阅一直交钱
  • 持续更新: 模型越来越强

最大痛点

  • 中文翻译弱: 必须配合其他工具
  • 首次加载慢: 大模型加载需时间
  • 没有手机版: 仅 Mac

最佳实践

我自己的工作流:

1. 启动 MacWhisper(Pro+ 版)
2. Auto-record Zoom 会议
3. 实时转写到副屏
4. Claude API 自动翻译成中文
5. 会议结束自动保存记录

这套配置一次设置,长期受益。

本节小结

  • ✅ MacWhisper 是 Mac 平台最优雅的本地转写工具
  • ✅ 推荐 Pro+ 版(€59 永久买断)
  • ✅ 模型首选 Large v3 Turbo(平衡精度速度)
  • ✅ 配合 Claude/GPT API 实现中文翻译
  • ✅ 完全本地,适合涉密场合
  • ⚠️ 需要 16GB+ 内存才能流畅运行大模型

下一步


💬 MacWhisper 高级用法:加微信 15600871059,加入【专业译员工具社群】,享每月软硬件评测、AI 同传企业培训、AI 工具选型咨询、共享术语表与配置文件、会员互测口音识别效果等福利。可分享我的工作流和自动化脚本。