点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
关于案例背景
中国在OCR(光学字符识别)技术方面的研究工作起步较晚,随着“863”高新科技研究计划的提出,对于汉字识别的研究进入一个实质性的阶段。依托业界领先的深度学习技术,OCR技术得到极大发展,针对印刷体字符的光学识别及文本转换的正确率不断提高。本方案面向教育行业推出OCR解决方案,助力学校和教育机构能力升级,从人工智能角度提升学生的学习效率、提高教师的机械式作业批改工作,同时也能够帮助家长在辅导孩子学习的过程中遇到不会讲、不会解的难题。主要有以下几个关键方面:速算批改、英语手写作文批改、拍照搜题、智能阅卷。
关于技术方案的具体措施
面向具体的教育应用场景,从技术的角度实现对人工智能通用技术的封装与定制。其主要功能包括:一是OCR识别技术,指利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受理解的格式;二是深度学习,指一种以深度神经网络为架构,对数据进行表征学习的算法,其好处是用有监督式、非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征;三是自然语言理解技术,指研究能实现人与计算机之间用自然语言进行有效通信的理论和方法,包括机器翻译、机器理解、问答系统等具体领域技术。
速算批改。基于深度学习的算式检测与识别算法,数学速算批改实现原理大致分为算式检测、算式识别和算式批改这三大部分,如下图1所示。速算批改应用方式如下图2所示,通过简单拍照就可以对速算题目进行自动识别和判分,降低人工阅卷的出错率。与此同时,借助中文文本识别能力与数学公式识别能力,识别试题/作业文本内容,为后续的搜题功能建设提供鲁棒输入。
图1 数学速算批改原理图
图2 数学速算批改效果图
英语手写作文批改。基于英文和手写的识别技术,英文手写作文批改实现原理大致分为角度预处理、多角度文本检测、文本识别、排版这四大部分,如下图3所示。老师可根据置信度信息提示错误单词,分析语法错误,判断作文写作水平的好坏,帮助快速进行阅卷如下图4所示。
图3 英文手写作文批改原理图
图4 英文手写作文批改效果图
拍照搜题。基于深度学习方法,针对学生遇到不会的题目或含糊不清的知识点,通过拍照搜题,即可得到解答和学习辅导。支持对数学公式进行检测和识别,数学公式识别基于算式规范的左上到右下书写规则,如下图5所示。数学公式识别支持返回LaTex(拉泰赫排版系统)格式公式内容及位置信息,如下图6所示。拍照搜题很好的缓解了家长无力辅导的困境,解决了学生可以不用受困于老师不在身边难题。
图5 数学公式识别原理图
图6 数学公式识别效果图
智能阅卷。结合公式识别和通用文字识别技术,针对学生日常作业及考试试卷中的题目、公式及答题区手写内容进行检测和识别,并返回题目框位置与内容。并将试卷中的题目进行自动化切分和结构化打标,并进行对应题目、题干、选项、答案等内容的结构化输出。智能阅卷不仅辅助了教师的教务工作、提升了教师工作效率及质量,也促进了教学管理的数字化和智能化。
关于应用效果
本方案从2018年3月正式上线以来,已服务于超过60家学校和在线教育机构。借助图像文字识别技术的精度高达97%,处于业界领先水平。借助文字图像识别技术,可以大幅提高教师工作效率。通过先进的AI技术为教育行业提供更优质的教学产品和服务,以实际行动助推教育行业迈向智能化、个性化、公平化的新台阶。(案例报送单位来自腾讯优图实验室,上文为部分节选,如需全文请联系项目组。)