最新国际文本检测权威榜单发布:中国包揽前五,云从科技夺冠

国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,专注于文本领域的识别与应用。为了提高自然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于2003年设立了鲁棒文本阅读竞赛("Robust Reading Competitions")。至今已有来自89个国家的3500多支队伍参与。Google、Microsoft、Amazon、Facebook、北京大学、中国科学技术大学、腾讯、搜狗等均曾参与其中。

鲁棒文本阅读竞赛的测试数据集一直在网上公开,可以随时提交结果,是自然场景文本检测行业中检验算法的测试数据集。ICDAR2015和ICDAR2017 MLT就是其中两个测试子集。

澎湃新闻采访了目前位于ICDAR2015榜单第一名的云从科技。云从科技研究院自身算法工程师李源介绍,CDAR2015和ICDAR2017 MLT是自然场景文本检测领域的权威数据集,"基本上所有文章都会在上面检测"。

他为记者解读了这份榜单,精度(Precision)代表检测结果中正确文本的比例;检出率(recall)则反映被检出文本与图片文本总数的比例,能够体现是否漏检了文本。为了检测算法的效果,需要综合考虑精度和检出率,而F值正好代表精度和检出率的调和平均数,也是排名的根据。

需要注意的是,这里提到的自然场景文本检测并不等同于文本识别,前者不具备识别文字的功能,而是指在图片中检测出文本。

李源表示,2018年11月20日,云从科技在预印本网站arXiv上发表了最新论文成果,该论文提出了用于自然场景文本检测的Pixel-Anchor框架。论文发表之前,他们在国际文档分析与识别大会发布的ICDAR2015和ICDAR2017 MLT数据集上检测了Pixel-Anchor算法,并刷新了ICDAR2015的最佳成绩。

评论

  • 相关推荐
  • 新闻
  • 娱乐
  • 体育
  • 财经
  • 汽车
  • 科技
  • 房产
  • 军事