2022中国华录杯数据湖算法大赛—OCR识别赛道
大赛名称 2022中国华录杯数据湖算法大赛—OCR识别赛道
详情链接 https://dev.ehualu.com/dev/home/competition/competitionDetail?competitionId=195018023
大赛简介 档案馆保存着大量记载不同时代社会发展轨迹的档案资料,对研究社会发展具有十分重要的价值。近年来,随着OCR识别技术的发展,很多传统纸质档案得以数字化,并可通过全文检索技术提供利用,极大地提高了档案查考利用水平。然而,还有很多早期的历史档案,多为手写竖版繁体字且无断句,OCR识别准确率低,影响历史档案内容的挖掘利用。
赛题采用某档案馆十九世纪二十年代的历史档案,选手需要通过OCR识别技术,利用人工智能算法识别档案数字化图片中的版面、文字并做断句处理。赛题采用某档案馆十九世纪二十年代的历史档案,选手需要通过OCR识别技术,利用人工智能算法识别档案数字化图片中的版面、文字并做断句处理。
举办方 天津市委网信办、天津市工业和信息化局、津南区人民政府、中国华录集团
参赛方式

报名步骤

1.新用户需注册账户,注册完成后即可进行赛事报名
2.注册完成的用户,在比赛主页上点击【报名】按钮,完成比赛报名
团队操作说明
1.大赛以团队为单位进行提交、晋级和获奖,个人用户也可以作为一个独立团队进行参赛;
2.选择所参加的赛题完成报名后,自动成为团队队长,进入【我的团队】,进行团队信息编辑,点击团队名称右上角编辑符号,进行团队名称、团队介绍编辑;点击【邀请成员】进行组队,所邀请成员必须完成开发者认证及赛事报名,方可进入团队;
3.点击【我的团队】方可查看团队成员情况。
以下情况不可进行队伍操作:
(1)比赛开始后,当日有过提交的团队无法进行任何队伍操作
(2)组队截止后,团队自动锁定,请大家在组队截止日期前选择合适的队友
(3)团队人数上限不可超过 6人
(4)团队提交作品后不可对团队名称进行修改


注:信息来源于赛事平台,侵删