本次图像处理挑战赛以线上比赛的形式进行,参赛选手在规定时间内提交基于评测数据集产出的结果文件,榜单排名靠前并通过代码复查的队伍可获得高额奖金。百度网盘开放平台致力于为全球AI开发者和爱好者提供专业、高效的AI学习和开发环境,挖掘培养AI人才,助力技术产业生态发展。
赛题介绍
赛题名称:文档图片去遮挡
人们在使用手机等移动设备扫描证件或者扫描文档、拍摄展示资料的场景中,经常会拍摄到一些手指或者人头等其他因素,对扫描成品的美观和易用性产生了影响。现在需要各位参赛选手通过技术对给定文档图像进行处理,帮助人们去除文档图像中的手指、人头等因素,还原真实的文档资料,提升使用效率。
为深入实施创新驱动和人才优先发展战略,吸引更多人才创新资源和高端产业项目落地昆山,圆梦阳澄湖畔,不断发挥人才对经济发展的促进作用,加快昆山阳澄湖两岸科创中心建设。人才引领产业,创新驱动发展。
未来,昆山阳澄湖科技园将紧紧围绕高新区建设创新驱动发展示范区、高质量发展先行区和实现“争先进位”目标,借助创新创业大赛这个舞台,全力搭建科技创新、人才创业的交流平台,以赛引才、以赛聚才,努力为昆山高新区引进、培育、壮大一批具有国际竞争力的高端产业新项目,为昆山“打造社会主义现代化建设县域示范”和高新区加快建设产业创新引领区作出更大贡献,以实际行动迎接党的二十大胜利召开.
为深入实施创新驱动和人才优先发展战略,吸引更多人才创新资源和高端产业项目落地昆山,圆梦阳澄湖畔,不断发挥人才对经济发展的促进作用,加快昆山阳澄湖两岸科创中心建设。人才引领产业,创新驱动发展。
未来,昆山阳澄湖科技园将紧紧围绕高新区建设创新驱动发展示范区、高质量发展先行区和实现“争先进位”目标,借助创新创业大赛这个舞台,全力搭建科技创新、人才创业的交流平台,以赛引才、以赛聚才,努力为昆山高新区引进、培育、壮大一批具有国际竞争力的高端产业新项目,为昆山“打造社会主义现代化建设县域示范”和高新区加快建设产业创新引领区作出更大贡献,以实际行动迎接党的二十大胜利召开。
赛题背景:
某业务平台平均每月捕获到Web攻击数量超过2亿,涉及常见注入攻击,代码执行等类型。传统威胁检测手段通过分析已知攻击特征进行规则匹配,无法检测未知漏洞或攻击手法。如何快速准确地识别未知威胁攻击并且将不同攻击正确分类,对提升Web攻击检测能力至关重要。利用机器学习和深度学习技术对攻击报文进行识别和分类已经成为解决该问题的创新思路,有利于推动AI技术在威胁检测分析场景的研究与应用。
赛题任务:
参赛团队需要对前期提供的训练集进行分析,通过特征工程、机器学习和深度学习等方法构建AI模型,实现对每一条样本正确且快速分类,不断提高模型精确率和召回率。待模型优化稳定后,通过无标签测试集评估各参赛团队模型分类效果,以正确率评估各参赛团队模型质量。
大数据平台由于管理复杂、安全机制不健全导致平台上的大数据面临相当大的安全风险。近年来SQL注入攻击、差分攻击、重标识攻击、数据删除、数据泄露、加密勒索攻击等多种安全威胁,导致的数据泄露、滥用或不可用等数据安全事件不断涌现。
针对数据安全问题,日志审计分析是一种非常有效的风险应对手段,基于大数据平台日志、安全设备日志和平台网络流量等多源异构数据进行分析,可有效实现攻击行为的发现或预测,并进行溯源,保护企业或组织内部数据安全。
赛题任务:
根据赛题提供的无标签大数据平台日志数据,参赛队利用机器学习、深度学习,UEBA等人工智能方法,构建系统用户使用大数据平台的行为基线和数据安全事件识别及分类模型。
(1)本赛题初赛任务中,参赛团队将设计算法对大数据平台日志正常行为和数据安全事件进行分类。
(2)本赛题复赛任务中,参赛团队将进一步设计算法对大数据平台日志正常行为和六类安全事件(SQL注入攻击、差分攻击、重标识攻击、数据删除、数据泄露、加密勒索攻击)进行分类。
CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,迄今已成功举办九届,累计吸引全球1500余所高校、1800家企事业单位及80余所科研机构的15万余人参与,已成为中国大数据与人工智能领域最具影响力的活动之一,是中国大数据综合赛事第一品牌。
数字化时代,网络安全、数据安全体现在个人工作生活、企业运营周转、社会常态运行等方方面面中,“大安全”问题日益凸显。数字安全的虚拟性、多变性和复杂性为守护时代安全带来了更大的挑战和风险。为应对安全领域中的真实风险与问题,发挥数据、智能、网络三大基本要素的价值作用,群策群力,革故鼎新,中国计算机学会大数据与计算智能大赛(CCF BDCI)组委会、大数据协同安全技术国家工程研究中心再度联手开设大安全领域的专题赛道——“CCF大数据与计算智能大赛·第二届数字安全公开赛”。赛道依旧以“悬赏未来安全最优解”为主题,提出软件安全、工业互联网安全、数据安全和网络安全等数字化场景中的新型风险问题,设置更丰富的数据算法赛题,促进安全数据开源共享,广邀各路英雄揭榜挂帅,探索应对“大安全”风险的最优解!
大赛所产生的公开数据集、优秀解题思路、相关学术成果将同步沉淀在安全大脑国家新一代人工智能开放创新平台上。
“CCF BDCI大数据与计算智能大赛·【首届】数字安全公开赛”回顾: 历时103天,集结1604支战队,覆盖全国31个省级行政地区200+高校,见证3759次算法模型提交,沉淀数据9w+,15支战队入围决赛,方案反哺业务一线,呈现出典型的学科融合与产业融合特点。
本赛题的数据集将给出多组相同函数代码在不同平台环境下对应的二进制指令数据。参赛选手的目标是在给定的数据集合里,尽可能多地找出与指定函数相似的其他平台下的函数。数据集分为训练集和测试集两部分,参赛选手先根据训练集中的样本数据自主设计算法模型,然后再对测试集中的函数进行相似匹配识别。
CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。
大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。
本届大数据竞赛在中国工程院、教育部高等学校大学计算机课程教学指导委员会及丝绸之路大学联盟的指导下由联合国教科文组织国际工程科技知识中心(IKCEST)、中国工程科技知识中心(CKCEST)、百度公司及西安交通大学共同主办,旨在放眼“一带一路”倡议沿线国家,通过竞赛方式挖掘全球大数据人工智能尖端人才,实现政府—产业—高校合力推动大数据产业研究、应用、发展的目标,进一步夯实赛事的理论基础与实践基础,加快拔尖AI创新人才培养。
The big data competition has been jointly organized by the International Knowledge Centre for Engineering Sciences and Technology under the auspices of UNESCO (IKCEST), the China Knowledge Centre for Engineering Sciences and Technology (CKCEST), Baidu, and Xi’an Jiaotong University. The Chinese Academy of Engineering, the Ministry of Education, and the Universities Alliance of the Silk Road are also involved. The aim is to identify top talent in the global big data and artificial intelligence sector, particularly talented individuals from Belt and Road countries, in an effort to help the government, industry, and higher education institutions jointly drive the research, application, and development of the big data industry, and cultivate innovative AI talent.
人工智能大规模预训练模型可类比于人工智能领域的算法基础设施,具备直接解决语言理解、语言生成等多类任务问题能力。当前我国AI大模型技术发展处在从研发建设迈向产业化应用的关键过渡阶段,各界正积极推动相关技术加速与符合大模型特性的高价值场景进行更大范围融合,努力实现更深层次的落地应用。
近年来,AI+工业瑕疵检测已成为工业智能领域的重要应用场景,能够进一步提升工业检测效率和精度、降低人力成本。本赛题选取齿轮配件异常检测作为AI+工业瑕疵检测比赛场景,鼓励选手通过机器视觉技术提升齿轮异常检测速度和准确率。
齿轮配件异常检测是工业瑕疵检测的痛点场景。齿轮传动装置是机械装备的重要基础件,与带链、摩擦、液压等传动方式相比,具有功率范围大、传动效率高、运动平稳、传动比准确、使用寿命长、结构紧凑等特点,同时安全、可靠、性价比优越的优点,决定了它在通用机械装备领域中的不可替代性。齿轮作为一种典型的动力传递器件,其质量的好坏直接影响着机械产品性能。
目前机器视觉行业依然由少数国际龙头垄断。美国康耐视(cognex)及日本基恩士(Keyence)几乎垄断全球 50%以上的视觉检测市场,两者均基于核心零部件和技术(操作系统、传感器等)提供相应解决方案。国内机器视觉检测方案虽已有长足发展,但与世界巨头相比仍存较大差距。因此,齿轮异常检测任务对于提升我国工业质检效率,保障产品质量具有重要意义。