近日,灵伴AI能力开放平台上线了ASR功能模块,继TTS赋予机器开口说话的能力之后,本次ASR功能的开放将使用户的产品具备听觉感知能力、使其能够轻松听懂人类的话语,与TTS构成语音交互的核心环节,使更多产品及用户能够在零技术门槛下完成整体交互方案。
近年来,语音交互被看作连接各种智能服务的入口,虽然已经落地多个行业应用场景,但仍然有很多不尽如人意的地方。具体到ASR技术方面,业内普遍宣称的97%识别准确率,多数是指局限于安静室内的近场识别,而在真实使用场景中,使用者的口音复杂多变、距离麦克风的远近、周围环境的噪音等都会严重影响到语音识别的准确率,从而使交互的体验感大打折扣。
灵伴AI开放平台ASR功能界面展示
灵伴的ASR技术作为整体交互服务方案中的重要环节,已经经历了来自市场的严苛检验,并在实践中不断迭代和完善,能够以高标准胜任实际业务场景的需求。
国际领先的识别技术
灵伴ASR算法模型具有较强的鲁棒性,具备复杂环境识别能力,基于自研抗噪和远场处理技术,有效分离噪音、混响,极大提高户外、室内、车内等复杂环境下语音识别准确率,使得用户无论在何种嘈杂环境下,都能够最大程度被识别;独创说话人识别和语音识别同步处理技术,实现实时的说话人区分及语音内容识别;先进的深度学习算法模型,保证系统具有较高的准确率、识别效率及较低的计算成本;
20+领域识别引擎
得益于长久以来专注于语音交互领域的优势,灵伴智能服务方案在银行、保险、教育、医疗等20余个行业落地并积累了海量业务数据及经验。经过实际业务场景的应用反馈进而对算法模型的迭代优化,使得灵伴ASR作为单项技术能力也有着高于业界平均水平的识别准确率;
卓越的产品性能
灵伴ASR不仅支持中文普通话识别、中英文混说识别,也支持带有方言口音的普通话识别,这一能力在实际落地过程中不断完善。因为多数企业面向全国用户提供服务,而带方言口音是影响ASR在实际应用中准确率的主要因素之一。灵伴ASR立足先进的算法模型、多年业务积累及庞大的数据库支撑,在识别不同方言口音普通话方面具有较高的精准度;
支持个性化定制
灵伴ASR技术还支持个人或企业用户的个性化需求定制,提供基于细分领域的行业模型定制、方言、语种等多种需求定制。
作为智能语音交互领域的先行者,灵伴是业内为数不多拥有语音交互全栈技术的企业之一,在AI商业化落地过程中可根据实际业务情况进行快速调整及应对,而不用依赖他人,这也是灵伴AI技术产品能够深入业务场景的重要因素之一。本次ASR功能的开放,意味着灵伴AI能力开放平台对全行业更为全面、深度的赋能,也表达了灵伴愿意与更多企业一起构建未来智能生态的美好愿景。
本文来自投稿,不代表微盟圈立场,如若转载,请注明出处:https://www.vm7.com/a/zixun/762.html