文本智能校对大赛
大赛名称 文本智能校对大赛
详情链接 https://aistudio.baidu.com/aistudio/competition/detail/404/0/introduction
大赛简介

文本智能校对是自然语言处理的重要应用领域之一。该任务主要是针对文本中出现的错误进行检测和纠正,属于综合性的自然语言处理研究方向,能够比较全面体现自然语言处理的技术水平。国际上,针对英文智能校对的相关研究在上世纪六十年代就已开展,而中文智能校对研究相较英文起步较晚,任务复杂性与技术挑战性也更为明显。其巨大挑战来自于中文文本与英文文本的显著差异,首先中文是表意文字,英文是表音文字;其次中文与英文的文本结构不同,英文的词与词之间有空格,而中文的词与词不以空格作为分隔;第三中英文字符集规模的差异较大,英文的字符集仅包含26个字母及标点符号,而中文的字符集则远远大于英文,这导致了中文智能校对系统在构建时比英文智能校对系统更为复杂。

往年文本校对相关评测比赛常使用外国语言学习者撰写的中文文本,这些文本的错误大多数都不是中文母语写作者会犯的错误。而对于中文语言环境下的学校、机关、新闻出版、广播影视、网络信息、公共服务等系统来说,一款针对以中文为母语的用户所使用的智能校对系统将会提供更大的帮助。因此,本次比赛主要选择中文母语写作者撰写的文本经人工标注后作为校对评测数据,从拼写错误、语法错误、语病错误等多个方面考察机器的认知智能能力。

举办方 蜜度、百度、上海仪电人工智能创新院有限公司
参赛方式

参赛对象

本次大赛是面向涉及自然语言处理、数据挖掘、知识图谱等人工智能技术的全国高校、科研机构和企业的赛事,欢迎各单位或个人积极组织队伍申报参赛。

组队形式

选手可在网上自行组队报名,组队上限 5 人,选手的地区、年龄、职业不限,每队至少有一名中国国籍选手。

如果参赛队伍以公司为单位参赛,需已注册成立企业;高校以团队为单位参赛,则建议有一个对应的指导老师(报名时导师选填)。参赛个人及单位要求无不良记录;参赛项目的产品、技术及相关专利专属于参赛团队及个人,与其他任何单位或个人无产权纠纷,如在参赛期间发现有侵犯外单位知识产权或盗用成果等纠纷,一经核实,立即终止该参赛队参赛资格,取消其已获得的奖项。

奖项设置

本赛事最终选出冠军1队、亚军2队、季军3队,对应奖励如下:

奖项名称奖项介绍
冠军(1队)5万(人民币)/队
亚军(2队)3万(人民币)/队
季军(3队)1万(人民币)/队

飞桨福利

【1. 飞桨提交奖(名额不限,机会多多)】

使用飞桨基线参赛并成功登榜的队伍,每位成员均可 免费申领100小时 A100 GPU 算力(每周五发放,申请链接报名后可见)
,还可获得由百度飞桨比赛组委会颁发的 官方荣誉证书(纸质版,有盖章,免费邮寄)

飞桨基线一键fork,轻松登榜:https://aistudio.baidu.com/aistudio/projectdetail/4337707

【2. 飞桨特别奖(冠亚季军队伍,额外奖励)】

使用飞桨基线参赛并获得冠亚季军的队伍,每位成员均可获得由百度飞桨比赛组委会提供的 飞桨大礼包+A100 GPU算力(价值千元)


注:信息来源于赛事平台,侵删