2019年度计算机视觉顶级会议召开,科大讯飞连夺多项冠军

2019年度计算机视觉顶级会议召开,科大讯飞连夺多项冠军

有实力不畏惧。科大讯飞作为国内人工智能和智能语音行业的佼佼者,多次参加国际行业大赛,并获得了优异成绩,引发广泛关注。在近日举办的2019计算机视觉顶级会议上,科大讯飞再次获得多项冠军,充分说明了其在文字识别技术上的领先优势。

据悉,6月期间,由科大讯飞A.I.研究院与中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队)组成的联合团队,先是在物体检测挑战赛DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三双重佳绩。随后又在手写数学公式识别挑战赛CROHME全部两项任务以及场景文本视觉问答挑战赛ST-VQA挑战赛上全部三项任务摘取冠军之席,此外还取得了街景招牌中文文本识别挑战赛ReCTS单字识别任务冠军。上述成绩可谓展现了科大讯飞在计算机视觉领域的技术水平与优势。

对于计算机视觉领域不是很熟悉的人,可能对DIW 2019挑战赛略感陌生。实际上该项活动作为一项行业内的专业级赛事,不仅吸引了腾讯、百度、字节跳动等300多支团队参赛,在赛题内容上来看,其所采用的Objects365数据集包含63万张图像,高达1000万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集,科大讯飞能够在300多支强队中拔得头筹,足可见其在图像识别领域的不俗实力。

而在由美国罗切斯特理工学院(Rochester Institute of Technology)承办的手写数学公式识别挑战赛CROHME中,科大讯飞与MyScript、三星、WIRIS(MathType)、中科院自动化所、中山大学等多家在手写数学公式识别领域著名的国内外研究机构同台比拼,凭借着自身在数学公式的字符和位置关系的端到端识别,以及多尺度空间注意力机制解决字符尺寸差异较大带来的识别字符丢失等问题上的技术突破,连夺在线手写数学公式识别和离线手写数学公式识别两项主要任务冠军。

最后,在CVC(Computer Vision Center)举办的视觉问答挑战赛ST-VQA上,面对算法图像检测、分割等前端技术,以及算法具备多模态数据融合、理解和推理能力的考验,科大讯飞出色地完成了对图像定候选词表、对数据集定候选词表,没有额外词表直接预测答案三项任务,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三项冠军。

同台竞技脱颖而出,科大讯飞在以上这些国际大赛中一举斩获多项冠军再次彰显了其不俗实力。未来,科大讯飞还将发挥核心技术优势,积极尝试技术赋能行业,为教育、医疗、政法等领域提供可进一步释放效能的人工智能解决方案。