主要内容
Mistral AI今日发布新语音转文字模型家族,宣称将扫清跨语言无缝对话障碍。巴黎AI实验室推出两款模型:Voxtral Mini Transcribe V2(批量音频转录)和Voxtral Realtime(近实时,200 毫秒内),均支持13 种语言互译。40 亿参数规模使其首次实现本地运行(手机/笔记本),无需上云,且成本更低、错误率更少。Voxtral Realtime 采用开源许可,免费可用。
Voxtral Mini Transcribe V2 适用于大规模音频文件批量处理,Voxtral Realtime 针对低延迟需求,转录速度达200 毫秒内,两者均支持13 种语言互译。Mistral 强调,本地运行能力是该领域首次突破,确保私人对话无需云端处理。
Mistral 由Meta 和谷歌DeepMind 前员工2023 年创立,是少数能与美AI 巨头(OpenAI 等)性能比肩的欧洲企业。因资源有限,该公司专注通过模型设计创新与训练数据优化提升性能,而非盲目堆砌计算资源。
该公司称技术正为2026 年无缝翻译铺路(谷歌最新模型延迟2 秒)。科学运营副总裁Pierre Stock 表示:“我们构建的系统将实现无缝翻译,基础工作已完成,目标2026 年解决问题。”
Mistral 定位欧洲本土开源替代方案,填补美国巨头忽略的细分市场。Surrey 大学Gawer 评价其模型“虽非顶级但高效,如经济实用车”。PAC 分析师指出,欧洲对美AI 依赖的担忧,使Mistral 成为安全选择。