语音技术
应用中科奥森AI技术,具备高识别准确率、高识别速度、领域模型可定制、支持多种处理模式等功能,同时具有SDK开发简单、开发包资源占用小等优势。能够实时、准确地对输入的语音进行识别与文本转写。并通过不断收集到的语料,进行模型的优化训练,不断的提高模型的覆盖率和识别的准确性。
技术功能
人脸检测
语音识别
将语音识别成文字,让机器轻松听懂人类的语言,识别正确率96%支持实时识别。
人脸搜索
语音合成
将文本转化成语音,让机器像人类一样能说会道,20种语言完美合成专业音库定制服务多种动听音色。
人脸比对
语义理解
将人类语言进行分析,让机器真正理解人类意图,成为人类伙伴用户自定义词典。
活体判断
机器翻译
多国语言自由转换,跨国界交流畅通无阻,精准快速清晰便捷。
人脸关键点
声纹识别
提取说话人的语音身份特征,提供声纹鉴别和声纹确认,国际较先进声纹引擎完善的声纹安全方案。
技术优势
识别率高
高识别准确率
传统电话8K采样率训练后,对与标准普通话识别准确率可达到90%以上,16K采样率的标准普通话语音识别准确率可达到。
适应性强
多方言、语种
具备粤语、四川话、上海话、闽南话等多种方言及蒙古语、藏语、维语等少数民族语言的识别能力,能覆盖大多数带方言的普通话识别场景。
技术优势
用途广泛
文本顺滑、中英混读
利用超大规模的语言模型加上说话者声学特征,对识别结果语句提供智能断句和标点符号预测,方便人工查阅。
稳定可靠
定制化服务
自主核心技术。针对行业、企业特点,提供模型训练功能。可根据客户应用场景进行模型的定制训练,迅速提高领域内识别率。
应用场景
实名认证
移动互联网
替代传统的线性交互产品,用户通过语音可一句话直达,缩减繁琐的页面跳转等操作。
智慧门店
智能交通
以语音命令的方式进行设备操控,使车载导航更具人性化,使驾驶者出行更安全、便捷。
智慧办公
智能家居
在家居场景下,智能语音能够在人机语音交互的同时,进行说话人身份的辨认,用户无需其他操作,即可以获得更合心意的家居服务。
安防监控
客服质检
通过快速转写客服语音服务记录,进行客服质量检查和考核,确保服务质量。
典型案例
中国银行智慧语音服务
为中银金融建设250坐席支撑能力,通过语音识别、文本分析、语义理解,实现对坐席的通过过程的实时监控。做到问题的及时发现、及时提醒、服务结果的跟踪分析。实现先前的话后质检过渡话中监测,由话后评价转向话前主动预防。提高银行卡客服服务的整体服务质量、有效降低客户投诉。
中国银行
天津市政府
核心实力
行业内优秀的视觉底层识别技术,赋予行业智能识别能力
核心实力
传承创新
为未来集聚AI智慧
建有2个校企合作实验室,"人脸识别教父"领衔团队,在CVPR、ICCV、ICML等人工智能尖端会议上发表数百篇高质量论文,拥有100余项发明专利和软件著作权。
核心实力
成熟产品方案
核心算法定制
为多个示范项目和重大商业项目提供整体解决方案,不断探索开拓新的计算机视觉应用场景,可根据客户需求提供产品及AI算法定制化服务。
核心实力
前沿行业引领者
行业标准制定者
已发布的人脸识别标准的主要起草者,唯一的人脸识别国际标准制定委员会中的亚洲代表,参与1项国际标准,7项国家标准,9项行业标准制定。