核心技术 - AuthenMetric中科奥森

语音技术

应用中科奥森AI技术，具备高识别准确率、高识别速度、领域模型可定制、支持多种处理模式等功能，同时具有SDK开发简单、开发包资源占用小等优势。能够实时、准确地对输入的语音进行识别与文本转写。并通过不断收集到的语料，进行模型的优化训练，不断的提高模型的覆盖率和识别的准确性。

技术功能

语音识别

将语音识别成文字，让机器轻松听懂人类的语言，识别正确率96%支持实时识别。

语音合成

将文本转化成语音，让机器像人类一样能说会道，20种语言完美合成专业音库定制服务多种动听音色。

语义理解

将人类语言进行分析，让机器真正理解人类意图，成为人类伙伴用户自定义词典。

机器翻译

多国语言自由转换，跨国界交流畅通无阻，精准快速清晰便捷。

声纹识别

提取说话人的语音身份特征，提供声纹鉴别和声纹确认，国际较先进声纹引擎完善的声纹安全方案。

技术优势

高识别准确率

传统电话8K采样率训练后，对与标准普通话识别准确率可达到90%以上，16K采样率的标准普通话语音识别准确率可达到。

多方言、语种

具备粤语、四川话、上海话、闽南话等多种方言及蒙古语、藏语、维语等少数民族语言的识别能力，能覆盖大多数带方言的普通话识别场景。

文本顺滑、中英混读

利用超大规模的语言模型加上说话者声学特征，对识别结果语句提供智能断句和标点符号预测，方便人工查阅。

定制化服务

自主核心技术。针对行业、企业特点，提供模型训练功能。可根据客户应用场景进行模型的定制训练，迅速提高领域内识别率。

应用场景

移动互联网

替代传统的线性交互产品，用户通过语音可一句话直达，缩减繁琐的页面跳转等操作。

智能交通

以语音命令的方式进行设备操控，使车载导航更具人性化，使驾驶者出行更安全、便捷。

智能家居

在家居场景下，智能语音能够在人机语音交互的同时，进行说话人身份的辨认，用户无需其他操作，即可以获得更合心意的家居服务。

客服质检

通过快速转写客服语音服务记录，进行客服质量检查和考核，确保服务质量。

典型案例

中国银行智慧语音服务

为中银金融建设250坐席支撑能力，通过语音识别、文本分析、语义理解，实现对坐席的通过过程的实时监控。做到问题的及时发现、及时提醒、服务结果的跟踪分析。实现先前的话后质检过渡话中监测，由话后评价转向话前主动预防。提高银行卡客服服务的整体服务质量、有效降低客户投诉。

核心实力

行业内优秀的视觉底层识别技术，赋予行业智能识别能力

传承创新
为未来集聚AI智慧

建有2个校企合作实验室，"人脸识别教父"领衔团队，在CVPR、ICCV、ICML等人工智能尖端会议上发表数百篇高质量论文，拥有100余项发明专利和软件著作权。

成熟产品方案
核心算法定制

为多个示范项目和重大商业项目提供整体解决方案，不断探索开拓新的计算机视觉应用场景，可根据客户需求提供产品及AI算法定制化服务。

前沿行业引领者
行业标准制定者

已发布的人脸识别标准的主要起草者，唯一的人脸识别国际标准制定委员会中的亚洲代表，参与1项国际标准，7项国家标准，9项行业标准制定。