蘑菇中富含多种呈味氨基酸、核苷酸和糖类,这些物质造就了极其鲜美的味道,使得被端上餐桌上的它们深受人们喜爱。特别是在野生菌种类繁多的云南,夏天的几场雨便能开启人们的吃菌盛宴。蘑菇虽然味美,但也不能随便食用,我国存在的有毒蘑菇就近 200 种,食用后轻则恶心呕吐、致晕致幻、看到七彩的开花藤蔓和会飞的小人绕圈跳舞,重则生命垂危、一顿送走。
本次竞赛使用的数据集由北欧真菌学家协会(Mycologist's Society of Northern Europe)提供的 9 种常见北欧蘑菇属的图像组成,FlyAI 平台旨在就相关趣味话题举办图像分类的练习赛事,让大家能够在多种场景下提升算法能力,而不对数据集中所包含蘑菇分类的生物学正确性及可食用性做出任何保证。请勿食用种类不明的蘑菇,严禁使用该竞赛数据集训练得到的模型鉴别食用蘑菇。
本评测任务为基于标题的大规模商品实体检索。即对于给定的一个商品标题,参赛系统需要匹配到该标题在给定商品库中的对应商品实体。
基于标题的大规模商品实体检索存在的挑战如下:
(1)输入文本中可能无法识别出实体指代词;
(2)商品标题中存在很多变异指代,没有给定的指代映射表;
(3)商品标题一般较短,上下文语境不丰富,须对上下文语境进行精准理解。
输入:
输入文件包括若干行商品标题。
输出:
输出文本每一行包括此标题对应的商品实体,即给定知识库中商品 ID,只返回最相关的 1 个结果。
本任务为中文病历医疗实体识别任务,即对于给定的一组电子病历纯文本文档,识别并抽取出与医学临床相关的实体提及(entity mention),并将它们归类到预定义类别(pre-defined categories),比如疾病、治疗、检查检验等。
相比2019命名实体识别任务我们做了如下调整:
a. 标注了新数据对训练数据进行扩充
b. 提供实体词表及大量非标注数据供参赛者使用
抑郁症是一种常见的精神疾病,其特征是持续的情绪低落,快感不足,悲伤和认知障碍,严重影响人们的生活质量。 全球抑郁症的患病率约为2-4%,而中国则为1.7-2%。 根据世界卫生组织(WHO)的统计,全世界有超过3.5亿人患有不同程度的抑郁症。 一项对118项研究中的50371例患者进行荟萃分析的相关研究发现,抑郁症的识别率仅为47.3%。 因此,由于抑郁症的高发和低识别率,探索简单,客观,准确的抑郁症检测评估方法或生物标记物是一项重大的公共卫生挑战。该比赛致力于推进基于生理信号的抑郁障碍评估研究。
比赛数据集为用于精神障碍分析的抑郁障碍全导静息态脑电数据集。数据采集设备使用了128通道HCGSN(HydroCel Geodesic Sensor Net)脑电采集系统,采集软件为Net Station 4.5.4版本。下图显示了128个电极放置的位置(E1至E128),采样频率为250Hz。所有原始电极信号均参考Cz。实验范式为记录五分钟闭眼静息状态的EEG。
目前,数据集主要包括来自临床抑郁症患者和匹配的正常对照的数据。我们所有的患者均由医院的专业精神科医生诊断和选择。我们将向参赛者提供部分数据的下载作为训练集,要求参赛者运用其中的数据,通过人工智能算法完成对抑郁症患者同正常人的特征分类,并能对给定的测试集数据完成自动分类。
知乎是世界上最大的中文知识社交平台。知乎自 2011 年创办至今,已经成为一个拥有 2000 万日活用户,每天有数以十万计的高质量的 UGC 内容产生的网站。如何对这些内容进行深层次的理解和高效的分发,是知乎建立的内容生产-内容分发的闭环中的一个重要课题。
目前,知乎机器学习团队已经搭建了一套基础生态体系,通过算法实现了用户画像、内容分析、内容个性化推送等,其效率比过去的人工运营方式提高了数十倍。知乎认为,算法更高价值的地方,就在于算法有机会了解人的潜在需求,打破信息获取障碍,提升学习效率。因此,知乎机器学习团队不仅想通过算法满足用户的阅读兴趣,还希望进一步满足关乎用户自我提升的优质信息获取需求,让高质量信息高效地、自动地、智能地到达用户手中。
目前,知乎上的内容分发的一个重要途径是通过关注关系生成的 Feed 流。关注关系可能是基于人,也可能是基于「话题」标签;从用户关注的话题标签为用户推荐内容,会更加契合用户对不同领域、不同类型的知识的需求。因此,对知乎上的内容进行精准的自动化话题标注,对提升知乎的用户体验和提高内容分发效率有非常重要的支撑作用。同时,对文本的语义进行理解和自动标注,尤其是在标签数量巨大、标签之间具有一定的相互关联关系的场景下的 tagging,也是目前自然语言处理的一个前沿研究方向。因此,知乎算法团队联合中国人工智能学会、 IEEE计算机协会和IEEE中国代表处,举办「知乎看山杯机器学习挑战赛」,期望能够激发更多的优秀人才对于自然语言处理领域的兴趣,并且促进语义分析的应用,从而最终革新甚至改变人的信息获取方式。
本次比赛同时为中国人工智能大赛的赛题。