近日,云从科技在语音识别技术上获得重大突破,一举刷新了全球最大的开源语音识别数据集Librispeech的世界纪录,错词率(Worderrorrate,WER)降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先记录。
此次突破标志着云从科技在今年4月刷新跨镜追踪技术(ReID)三项世界纪录后在新领域再次取得重大成果,正全力夯实核心技术闭环。
根据介绍,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,而此次语音识别突破属于智能感知中的一环。智能感知即视觉、听觉、触觉等感知能力,能够让计算机通过各种智能感知能力与外界进行交互。
据了解,Librispeech是当前衡量语音识别技术的最权威主流的开源数据集,错词率(Worderrorrate,WER)是衡量语音识别技术水平的核心指标。云从科技在Librispeech数据集上刷新了业内最好的水平,将错词率(Worderrorrate,WER)降到了惊人的2.97%,较之前提升了25%,已超越人类专业速记员水平。