什么是Conformer?
AssemblyAI 推出了最新的语音识别模型 Conformer-2,基于 110 万小时的英语音频数据训练,专为提升专有名词、字母数字识别和抗噪能力而设计。无论是语音转文字还是生成式 AI 应用,Conformer-2 都能提供更准确、更快速的结果。
Conformer的核心功能有哪些?
- 字母数字识别提升 31.7%:更准确地处理信用卡号、验证码等关键信息。
- 专有名词错误率降低 6.8%:更精准地识别人名、地址等重要信息。
- 抗噪能力提升 12.0%:在嘈杂环境中依然保持高识别准确率。
- 处理速度提升 55%:转录一小时音频仅需 1.85 分钟,比 Conformer-1 更快。
Conformer的使用案例有哪些?
- 客服中心:准确转录客户对话,提升服务质量。
- 播客和广播:快速生成文字稿,方便内容编辑和搜索。
- 在线会议:实时转录会议内容,便于后续整理和回顾。
- 教育领域:将讲座内容转为文字,帮助学生更好地复习。
如何使用Conformer?
- 访问 AssemblyAI 的 Playground,上传音频文件或输入 YouTube 链接即可体验 Conformer-2。
- 注册获取免费 API 令牌,通过 API 直接集成到您的产品中。
- 使用
speech_threshold参数,设置音频中语音的最低比例,避免转录不需要的内容。














