主要内容
Wispr Flow是一款AI驱动的转录工具,主打“语音写作”,宣称通过语音输入可实现“以思考速度写作,比键盘打字快4倍”,尤其适合打字速度较慢的用户。其核心功能是“两步处理”:先由AI转录工具将语音转为文字,再通过大语言模型(LLM)去除填充词并格式化为完整段落,支持电脑或手机的任意文本框使用。
该工具设计简洁,设置过程有动画引导,但价格较高:年费144美元(按年付费)或月费15美元(仅提供极短免费试用)。其核心技术——AI转录和LLM后处理——其实广泛可获取:语音转文字环节,Nvidia Canary、OpenAI Whisper等开源工具可免费本地运行;后处理部分,用户可能已通过OpenAI、Claude或Google Gemini等付费服务实现,或直接使用Ollama、Apple Intelligence等免费工具。
鉴于此,作者探索了免费替代方案。Spokenly(支持macOS/Windows)是不错的选择:免费下载且无需注册,可选用本地模型或添加API密钥,支持离线运行,还能自定义转录后处理的提示词。此外,Mac用户可尝试开源免费的MacParakeet,实现类似功能。