本篇文章1219字,读完约3分钟
新闻网又获得了国际比赛的冠军。 最近,新闻网数帆在国际赛事icdar 2021上,以明显领先第二的成绩获得了三个任务项目的冠军,在多语言ocr行业(文案识别行业)得到了国际权威的认同。
icdar是由国际模式识别协会组织的,是文件分解和识别行业公认的顶级国际学术会议,被誉为ocr界的奥斯卡。 siw语言识别大赛旨在促进少数语言的快速发展和继承,是icdar今年举办的10大竞赛之一,也是业界首个大规模的语言识别大赛。
据悉,韩国最大的互联网企业naver、华南理工dlvc lab等世界一流科技企业、大学参加了此次siw语言识别大赛。
比赛分为手写识别、印刷体识别、手写印刷混合识别三个课程,参赛队伍需要识别5000张样本图像的复印件属于哪种语言。 最终,在新闻网站提交的识别结果中,手写识别精度为99.69%,领先于第二位的0.55%。 活字的识别精度为99.99%,领先第二位的0.19%; 在最难的手写印刷体混合识别课程中,新闻网的精度为99.84%,领先于第二位的1.07%。
( icdar 2021 siw比赛的3个任务结果、新闻网均排在第1位) )。
据新闻网数帆ai技术团队介绍,这三个课程任务主要有两个难点。 首先,泰米尔语和马拉雅拉姆语等不同语言的相似度非常高,对识别模型的细粒度分类性能要求非常高。 样本拷贝都以句子的形式出现,存在连笔。 再加上手写的笔迹很潦草,即使是同样的复印件,根据笔迹的不同也会很难识别。
(也需要正确识别相似度非常高的泰米尔语和马拉雅拉姆语)
新闻网开发了语言细粒度识别模型,创新性地以单一模型处理了三项任务。 与传统的副本分类问题相比,将语言分类问题转换为语义分割问题,给各像素点提供监控新闻,使模型观察样本的各局部细粒度特征。 另外,优化了目前业界最流行的转换器结构以提高细节特征的特征表达能力,进一步提高了手写体的识别精度。 另外,大规模的预训练技术和半监督技术也大大提高了模型的泛化能力和识别的准确性。
据了解,新闻网站在国际权威技术竞赛中获得认可已不是第一次了。 迄今为止,新闻网站伏羲已经在世界顶级大赛中获得了许多奖项。 例如,获得世界ai文创大赛( gaac ),或获得ase 2019最佳论文奖。
此外,新闻网络也突破了技术边界,将技术开发与业务价值联系在一起。 当业务面临新的痛点、新的问题、新的场景时,新闻网络将不断升级迭代式ai能力,促进业务应用的创新。
目前,新闻网站数帆通过ai技术的研发和专业处理方案,使ocr技术在泛娱乐、音乐广播、电子商务等场景中成功落地。 例如新闻网站云音乐的mv歌词字幕识别、新闻网站游戏的认证、新闻网站严选的商品详情页分析、新闻网站上易于测量的icon自动化检测定位等都有ocr技术的身影。
新闻网站伏羲的沉浸式活动系统、虚拟人技术等也已经在动漫、教育、文旅、会议等诸多场景中得到了运用。 新闻网络越来越多的技术创新成果逐渐落地。
标题:“语种识别率超99%,网易包揽国际顶级比赛ICDAR SIW 3项冠军”
地址:http://www.bjzghzbx.com.cn/bftt/11297.html