本页面用于武汉方言(武汉话)的语音转文字效果展示,支持音频文件上传识别和实时录音识别。 内置功能包括批量识别,流式结果展示,历史记录导出,接口配置等。
通过可视化交互页面,验证武汉话语音识别模型在真实语音输入下的表现与可用性,并提供接口配置功能,便于模型迭代。
支持一次选择多个音频文件,加入待识别队列后统一流式识别。
可连续录制多条语音,逐条加入队列后一次性提交,结果将按完成顺序流式返回。
本项目训练数据来自武汉话语料库 ASR-SCWuhDiaDuSC,主要覆盖日常使用场景语句, 与本课题“武汉话语音识别”目标高度匹配。
本课题聚焦武汉方言语音识别系统的工程化实现与展示,前端承担输入交互、识别反馈、结果留档和演示说明, 后端负责音频处理与 ASR 推理。通过“上传识别 + 实时录音识别 + 历史导出”的完整流程,展示课题的实用性与可扩展性。