功能介绍
AutoMinutes 将本地语音识别与大语言模型结合,为会议记录提供端到端的本机工作流。
核心流程
实时录音
- 直接使用 Mac 麦克风录制
- 实时流水线:音频 → Whisper 转写 → 大模型纪要
- 通过顶部工具栏停止;进度与每条会议记录关联
导入音频
- 上传已有录音文件,无需现场录制
- 适用于访谈、通话录音或历史会议素材
会议模式
开启 会议模式 后,语言模型会按会议纪要习惯组织内容(议题、结论、待办等)。关闭后输出风格更自由。
语音转文字(Whisper)
| 模型 | 说明 |
|---|---|
| Whisper large-v3-turbo | 精度更高,体积较大 |
| Whisper turbo(量化版) | 体积更小、速度更快,适合配置较低的 Mac |
- 语言:自动识别、英文或中文
- 通过 Candle 等方案 完全在设备端 推理
- 转写无需 API Key,无需联网
纪要生成(本地大模型)
| 模型 | 适用场景 |
|---|---|
| Qwen2.5 7B | 中英文会议 |
| Llama 3 8B | 性能与速度均衡 |
| Gemma 7B | 通用摘要 |
| Yi 6B | 中英文 |
可通过以下参数调节生成效果:
- Temperature — 随机性与稳定性
- Top P / Top K — 核采样与 Top-K 采样
- 最大长度 — 每轮生成的 token 上限
导出与输出
在首页与 历史记录 中支持:
| 导出项 | 格式 |
|---|---|
| 会议录音 | 原始音频文件 |
| 语音转写 | 纯文本转写 |
| 纪要文本 | 结构化纪要 |
纪要还可导出为带应用标识的 HTML,便于分享或归档。
补充与修订
首轮纪要生成后:
- 在补充框输入修改意见或补充说明
- 导入参考文件:
.txt、.md、.html、.docx - 模型将新内容合并进现有纪要
TIP
请等待当前一轮纪要生成结束后再提交下一次补充。
历史记录
- 支持搜索与时间筛选(全部、近一周、近一月、近一季)
- 状态标识:仅音频 → 已有转写 → 纪要已完成
- 删除会议时会同时清理本地录音文件
设置
| 模块 | 能力 |
|---|---|
| 模型 | 下载、删除、查看本地模型包 |
| 外观 | 浅色 / 深色 / 跟随系统 |
| 通用 | 界面语言等区域设置 |
| 反馈 | 联系开发者 |
隐私设计
- 无需账号,无云端同步
- SQLite 与文件均保存在应用沙盒内
- 模型一次下载,可长期离线使用
完整法律文本见 隐私政策。
规划中的能力
部分产品设计中的能力仍在开发中:
- 从界面直接导出 PDF、Word
- 在线语音转写 / 大模型 API
- 全局录音状态栏
当前 Mac App Store 版本以 稳定离线 的录音 → 转写 → 纪要 → 导出 为核心体验。