大赛名称 | 千言数据集:问题匹配鲁棒性 | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
详情链接 | https://aistudio.baidu.com/aistudio/competition/detail/130/0/introduction | ||||||||||||||||||||
大赛简介 | 问题匹配(Question Matching)任务旨在判断两个自然问句之间的语义是否等价,是自然语言处理领域一个重要研究方向。问题匹配同时也具有很高的商业价值,在信息检索、智能客服等领域发挥重要作用。
当前大多数问题匹配任务在与训练集同分布的测试集上进行测试,夸大了模型能力,缺乏对模型细粒度优势和劣势的评测。因此,本次评测关注问题匹配模型在真实应用场景中的鲁棒性,从词汇、句法、语用等多个维度检测模型的能力, 发现模型的不足之处,推动语义匹配技术的发展。本次评测集中的样本均来自于搜索问答和对话型问答两个场景,难度大,考察点丰富,覆盖了真实应用中诸多难以解决的问题。 本次竞赛主要基于千言数据集,采用的数据集包括了哈尔滨工业大学(深圳)的LCQMC和BQ数据集、OPPO的小布对话短文本数据集、谷歌PAWS数据集,以及百度的DuQM数据集。本次评测,训练集由LCQMC、BQ、小布对话短文本、PAWS数据集组成,测试集由DuQM、小布对话短文本数据集组成,从词汇、句法、语用3大维度评估模型,期望从多个维度、多个领域的角度评价模型的鲁棒性,进一步提升问题匹配技术的研究水平。 |
||||||||||||||||||||
举办方 | 中国计算机学会、百度 | ||||||||||||||||||||
参赛方式 |
|
||||||||||||||||||||
注:信息来源于赛事平台,侵删 |