神经网络(NN)模型已经成功地应用于很多NLP任务并取得了不错的成绩。但由于NN模型的黑盒性质,降低使用者对其结果的信任度,阻碍了NN模型更大规模地落地应用,尤其是对模型可靠性和安全性要求较高的领域,如医疗、法律等。因此,NN模型的可解释性、鲁棒性等问题受到广泛关注。为进一步推动模型可解释性研究的发展,评测数据和对应的评估指标是必需的。
Neural Network (NN) models have greatly improved various NLP tasks in terms of accuracy. However, as NN models are black-box systems, their inner decision processes are opaque to users. This lack of transparency makes them untrustworthy and hard to be applied in the decision-making applications, such as health and law, where users often hope to understand the inner decision process for the output. Consequently, the interpretability of NN models has attracted extensive attention. In order to further facilitate the research of interpretability, evaluation datasets with human-annotated rationales and the corresponding evaluation metrics are required.
本次比赛提供阅读理解任务的可解释评测数据集和相应的评估指标,评估模型的可解释性以及解释方法的精准性。本次比赛旨在为研究者提供学术交流平台,推动模型可解释的发展,以协助构建更加可信赖的深度学习模型和系统。
The challenge provides an evaluation dataset for Chinese machine reading comprehension task with human-annotated rationales and the corresponding evaluation metrics, so as to evaluate the interpretability of models and the accuracy of rationale extraction methods. The challenge provides a platform for research and academic exchanges on model interpretability, and facilitates the research progress in building trustworthy systems.
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第三场 —— 零基础入门NLP之新闻文本分类挑战赛。
赛题以自然语言处理为背景,要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。
为更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。通过对本方案的完整学习,可以帮助掌握数据竞赛基本技能。同时我们也将提供专属的视频直播学习通道。
本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控-贷款违约预测。
赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。
为了更好的引导大家入门,赛题方同时为本赛题定制了学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。通过对本方案的完整学习,可以帮助掌握数据竞赛基本技能。同时平台也将提供专属的视频直播学习通道,敬请关注平台通告。
为贯彻落实国家平安强国战略,强化立体防控能力,通过对视频、图像中人员持刀、持棍识别,有效提升社会对预警、防范突发安全事件的能力,提升广大人民群众的安全感、幸福感;同时,为促进产学研融合发展,引领AI研究人员对社会安全领域的科技创新,推动开放场景中持械识别技术的持续提升和深入发展,由山东省大数据局(英文简称:Shandong-BDB)与中国电信(英文简称:CTC)共同主办了“Shandong-BDB AI Challenge 2022 持刀持棍识别竞赛”。本竞赛内容为非约束场景中人员持械(刀、棍棒)识别,采用的是真实开放场景、严格标注筛选的多样化测试集,分为线上比赛和线下答辩两个阶段。
本次竞赛的主旨是:打造公正、开放、深入的人工智能,以真实场景、专业测评推动持械识别技术的创新及应用。通过竞赛打造交流、学习、沟通的平台,为深化研究开拓新思路,为企业和科技人才赋能,以竞赛带动创新应用,以竞赛促进产业升级。
本次竞赛的意义不仅在于为广大AI研究企业和科研人员提供一个公平展示的平台,同时充分发挥主办单位的影响力,将持械识别这一关乎人民群众生产、生活安全的研究、应用领域向AI研究社区做更多的展示和推广,吸引更多的研究人员从事这一重要领域的研究。
神经网络(NN)模型已经成功地应用于很多NLP任务并取得了不错的成绩。但由于NN模型的黑盒性质,降低使用者对其结果的信任度,阻碍了NN模型更大规模地落地应用,尤其是对模型可靠性和安全性要求较高的领域,如医疗、法律等。因此,NN模型的可解释性、鲁棒性等问题受到广泛关注。为进一步推动模型可解释性研究的发展,评测数据和对应的评估指标是必需的。
Neural Network (NN) models have greatly improved various NLP tasks in terms of accuracy. However, as NN models are black-box systems, their inner decision processes are opaque to users. This lack of transparency makes them untrustworthy and hard to be applied in the decision-making applications, such as health and law, where users often hope to understand the inner decision process for the output. Consequently, the interpretability of NN models has attracted extensive attention. In order to further facilitate the research of interpretability, evaluation datasets with human-annotated rationales and the corresponding evaluation metrics are required.
本次比赛提供阅读理解任务的可解释评测数据集和相应的评估指标,评估模型的可解释性以及解释方法的精准性。本次比赛旨在为研究者提供学术交流平台,推动模型可解释的发展,以协助构建更加可信赖的深度学习模型和系统。
The challenge provides an evaluation dataset for Chinese machine reading comprehension task with human-annotated rationales and the corresponding evaluation metrics, so as to evaluate the interpretability of models and the accuracy of rationale extraction methods. The challenge provides a platform for research and academic exchanges on model interpretability, and facilitates the research progress in building trustworthy systems.
作为全球顶级的开源大数据处理引擎,Apache Flink一方面在实时计算领域保持着技术领先优势,另一方面随着流批一体、流式数仓等理念的提出也在向更多应用场景辐射。
本次实时计算 Flink挑战赛以 Hackathon 形式,为创新、创意大赛,采用开放式命题形式,旨在探索 Flink在应用实践中的更多可能性。参赛选手可以充分发挥想象力、创造力,以 Flink为工具解决一个实际问题。小到日常学习、工作、生活中的点滴琐事,大到城市管理、金融交易、疫情防控等国计民生,都可以成为你的选题。大赛尤其鼓励能够结合所选题目的特点,对 Flink本身做出创新和改进的参赛作品。
选手需要使用(但不仅限于使用)Flink及其生态里的各种工具,包括各类 Connector、Table Store、机器学习、复杂事件处理、Stateful Functions 等来完成自己的参赛作品。
江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛,已累计吸引到全球超过3800名选手参与其中,同时在医疗、能源、车联网、城市治理等前沿热门领域,均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集,充分展现了无锡市数据开放、数据共享工作的成效。
为进一步汇聚核心产业高价值种子数据集,促进公共数据共享开放,吸引数字化产业人才落户以及助推数字经济高质量发展,拟举办2022第三届江苏大数据开发与应用大赛,沿用“SEED”大赛标志(以下简称“大赛”)。