banner
NEWS LETTER

口音转译系统

Scroll down

起止时间:02/2025 ~ 05/2025

技术栈:[Speechmatics, Aruze, WebSocket, FastAPI, VAD, ASR, TTS]

设计端到端实时语音转译系统,从本地麦克风采集语音流。实现音频帧处理、回声抑制、采样率与字节格式转换。接入 Speechmatics 完成鲁棒语音识别,结合 Aruze 实现标准化语音重建。特殊口音识别准确率 90%+。

bilibili效果展示
video-cover
其他文章
cover
REALITY
  • 25/11/20
  • 14:18
请输入关键词进行搜索