语音识别包括实时录音文件识别、一句话识别、实时语音识别三类服务。录音文件支持对提交的录音文件进行转写,输出文字。
敬请期待
敬请期待
在 AI SHELL 公开数据集上,字错率 < 1%
毫秒级别延时,可支持实时语音识别
语音识别支持普通话和常用英文单词,语音合成支持多语种、多音色、支持配置语速、音量、音高等
高达 99.9% 可用性
通过语音识别、语音合成、自然语言理解技术,帮助实现智能客服机器人场景下的自动识别人声,自动回复等功能。
通过实时语音识别技术,在直播场景下将语音转写为文字,减少人工处理成本,提升用户体验。
通过语音识别、自然语言理解、声纹识别等技术,将语音转化为文本,同时根据质检规则进行分析,提升客服中心的服务质量。