新闻中心 > 专访

人工智能赋能事业创新

作者:科大讯飞股份有限公司智慧业务线 张海剑

来源:中国报

2019-11-13 星期三

    人工智能技术如何赋能事业?基于工作的安全保密要求,科大讯飞股份有限公司早前便构建了超脑平台,拥有头像识别、语音识别、声纹识别等功能,以及认知智能层面的语义推理、知识挖掘等自学习能力。目前,超脑平台已经更新到了2.0版本。超脑平台2.0版本内置了专业的语料库、专业的规范,进一步提升了检查的准确率,形成的数据也能被完全本地化保存,实现了与互联网的完全隔离,保证了数据的安全可靠。

    超脑平台2.0版本有3个亮点。一是语音识别引擎的升级,以前的中文引擎和英文识别是隔开的,平台升级以后完全解决了中英文混杂的问题,在重大活动建档、人事访谈,尤其是应对越来越多国际型会议场景下,中英文无缝识别已经成为现实,准确率和速度也进一步提升。二是图文的精准识别,该系统拥有自学习能力,现在只要通过简单的一两页样本标注,几乎可以达到100%的精准识别率。三是新增了声纹的识别引擎,能够有效识别并区分讲话人。

    目前,科大讯飞的语音识别技术已经在这些方面取得了突破性进展。一是口述征集的效率。一方面,目前可以成功利用智能语音识别和实时转写技术实现口述征集,实现智能语音著录;另一方面,在录音的时候,如果有摄像需求,科大讯飞已经可以确保在不耽误摄像和录音的情况下,同步实现文稿的实时输出。文稿输出过程中,系统采用“人工智能+人工校对”的方式,工作人员可以人工校验修正,几乎可以达到100%的准确率,随后可以再利用平台的声纹识别技术,自动区分讲话人,实现了讲话人的角色分离,进一步提高了口述文稿的整理效率,给文稿的后期利用带来极大方便。二是音视频的开发和利用。将音视频文本化是盘活音视频的一个有效途径。如果完全通过人工来转化,大概是1:10的效率比。如果通过技术手段来解决,可以实现文本的自动提取。如在重大活动中,科大讯飞语音识别技术不仅仅可以将录音转成文字,还能同步采录图像等,再进行自动化提取,然后将这些重要信息完整保存下来,实现快速建档。

    科大讯飞在音视频数据化中已经实现3点突破。一是智能打点和智能编目。如在新闻联播中,可以自动做到对新闻事件进行打点拆分,形成一个个独立的小新闻并且对每个小新闻进行自动编目。二是通过人脸识别,能够实现对视频中重要人物进行人脸图像的智能聚合。三是实现对音视频信息的快速提取和利用。如要搜集一个重要人物的个人信息时,可以快速对音视频进行检索,快速提取其相关信息。

    科大讯飞的OCR图文识别技术目前也被运用到相关领域,通过图像识别与分析、语义理解、篇章分析等技术,可以对不同类型文件进行识别,并进行智能分类。用OCR技术识别文书类也取得突破性进展,识别率达85%以上,同时可以对识别结果进行实时修改。

    原载于《中国报》2019年11月11日 总第3448期 第二、三版

 
 
责任编辑:张雪
 
版权所有,未经许可,不得转载。