千言数据集:面向事实一致性的文本生成
大赛名称 千言数据集:面向事实一致性的文本生成
详情链接 https://aistudio.baidu.com/aistudio/competition/detail/265/0/introduction
大赛简介

自然语言生成旨在让机器能够像人一样使用自然语言进行表达和交互,它是人工智能领域重要的前沿课题,近年来受到学术界和工业界广泛关注。

随着神经网络生成模型特别是预训练语言模型的迅速发展,机器生成文本的可读性和流畅性不断提升。然而,自动生成的文本中依然经常出现不符合原文或背景的错误事实描述,这种生成的事实一致性问题是自然语言生成进行落地应用的主要障碍之一,并逐渐受到研究学者的关注。鉴于当前国内外关于事实一致性的生成评测比赛十分匮乏,为了促进自然语言生成的技术发展和实际应用,我们组织了面向事实一致性的生成评测比赛。

在此比赛中,我们将提供三个对事实一致性有较高要求的生成任务,包括文案生成、摘要生成和问题生成。同时,在系统评价中,我们将结合文本流畅性和事实一致性两项指标综合评估参赛生成系统的水平。通过这样的任务设定和评价方式,此评测将有助于研究者和开发者更多关注自然语言生成的事实一致性难题,并为大家提供学术交流平台,从而进一步提升自然语言生成的研究水平,推动相关技术的应用发展。

举办方 千言
参赛方式

公平竞技: 参赛者禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现将取消比赛成绩并严肃处理;
组织声明: 组委会保留对比赛规则、赛事安排进行调整和修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团队奖项的权利;
基线模型: 基线模型供参赛选手参考,可以选择在其基础上改进。参赛选手不能直接提交基线模型的预测结构;如果提交结构与基线模型预测结果高度相似,则将取消比赛成绩;
作品产权: 参赛者同意授予举办方在全球范围内、无限期、不受限制的免费使用前款成果的权利,包括但不限于用于服务提供、进一步开发服务、用于商业用途及分许可他人使用。为免歧义,基于上述成果使用所产生的新成果,举办方享有完整的知识产权,参赛者同意对新成果不主张任何权益,包括但不限于所有权、以及基于对上述成果享有的所有权而阻碍新成果的实施等。

注:信息来源于赛事平台,侵删