大赛名称 | 2022中国华录杯数据湖算法大赛—OCR识别赛道 |
---|---|
详情链接 | https://dev.ehualu.com/dev/home/competition/competitionDetail?competitionId=195018023 |
大赛简介 | 档案馆保存着大量记载不同时代社会发展轨迹的档案资料,对研究社会发展具有十分重要的价值。近年来,随着OCR识别技术的发展,很多传统纸质档案得以数字化,并可通过全文检索技术提供利用,极大地提高了档案查考利用水平。然而,还有很多早期的历史档案,多为手写竖版繁体字且无断句,OCR识别准确率低,影响历史档案内容的挖掘利用。 赛题采用某档案馆十九世纪二十年代的历史档案,选手需要通过OCR识别技术,利用人工智能算法识别档案数字化图片中的版面、文字并做断句处理。赛题采用某档案馆十九世纪二十年代的历史档案,选手需要通过OCR识别技术,利用人工智能算法识别档案数字化图片中的版面、文字并做断句处理。 |
举办方 | 天津市委网信办、天津市工业和信息化局、津南区人民政府、中国华录集团 |
参赛方式 | 报名步骤1.新用户需注册账户,注册完成后即可进行赛事报名 |
注:信息来源于赛事平台,侵删 |