新闻中心 > 专访

人工智能赋能事业创新

作者：科大讯飞股份有限公司智慧业务线张海剑

来源：中国报

2019-11-13 星期三

    人工智能技术如何赋能事业？基于工作的安全保密要求，科大讯飞股份有限公司早前便构建了超脑平台，拥有头像识别、语音识别、声纹识别等功能，以及认知智能层面的语义推理、知识挖掘等自学习能力。目前，超脑平台已经更新到了2.0版本。超脑平台2.0版本内置了专业的语料库、专业的规范，进一步提升了检查的准确率，形成的数据也能被完全本地化保存，实现了与互联网的完全隔离，保证了数据的安全可靠。

    超脑平台2.0版本有3个亮点。一是语音识别引擎的升级，以前的中文引擎和英文识别是隔开的，平台升级以后完全解决了中英文混杂的问题，在重大活动建档、人事访谈，尤其是应对越来越多国际型会议场景下，中英文无缝识别已经成为现实，准确率和速度也进一步提升。二是图文的精准识别，该系统拥有自学习能力，现在只要通过简单的一两页样本标注，几乎可以达到100%的精准识别率。三是新增了声纹的识别引擎，能够有效识别并区分讲话人。

    目前，科大讯飞的语音识别技术已经在这些方面取得了突破性进展。一是口述征集的效率。一方面，目前可以成功利用智能语音识别和实时转写技术实现口述征集，实现智能语音著录；另一方面，在录音的时候，如果有摄像需求，科大讯飞已经可以确保在不耽误摄像和录音的情况下，同步实现文稿的实时输出。文稿输出过程中，系统采用“人工智能+人工校对”的方式，工作人员可以人工校验修正，几乎可以达到100%的准确率，随后可以再利用平台的声纹识别技术，自动区分讲话人，实现了讲话人的角色分离，进一步提高了口述文稿的整理效率，给文稿的后期利用带来极大方便。二是音视频的开发和利用。将音视频文本化是盘活音视频的一个有效途径。如果完全通过人工来转化，大概是1:10的效率比。如果通过技术手段来解决，可以实现文本的自动提取。如在重大活动中，科大讯飞语音识别技术不仅仅可以将录音转成文字，还能同步采录图像等，再进行自动化提取，然后将这些重要信息完整保存下来，实现快速建档。

    科大讯飞在音视频数据化中已经实现3点突破。一是智能打点和智能编目。如在新闻联播中，可以自动做到对新闻事件进行打点拆分，形成一个个独立的小新闻并且对每个小新闻进行自动编目。二是通过人脸识别，能够实现对视频中重要人物进行人脸图像的智能聚合。三是实现对音视频信息的快速提取和利用。如要搜集一个重要人物的个人信息时，可以快速对音视频进行检索，快速提取其相关信息。

    科大讯飞的OCR图文识别技术目前也被运用到相关领域，通过图像识别与分析、语义理解、篇章分析等技术，可以对不同类型文件进行识别，并进行智能分类。用OCR技术识别文书类也取得突破性进展，识别率达85%以上，同时可以对识别结果进行实时修改。

    原载于《中国报》2019年11月11日总第3448期第二、三版

责任编辑：张雪

版权所有，未经许可，不得转载。