• 2022年“移动云杯”算力网络应用创新大赛(高校赛道) 广东赛区

    本赛题为高校赛道-智能字幕优化专题。本赛题旨在提升中英翻译准确率,给更广大观众带来更好的直播字幕观看体验,持续了解特殊群体需求,解决实际难题。同时通过更高的算力性能和更低的终端成本,推动终端应用模式的的创新,能够为用户提供“更智能、更沉浸”的服务内容。(本赛区为广东赛区)
  • 2022年“移动云杯”算力网络应用创新大赛(移动赛道) 算网应用创新

    随着数字经济的高速发展,国家提出“新基建”部署要求、“东数西算”发展战略,为了积极响应国家号召,中国移动提出算力网络战略,以东数西算为抓手,落实双碳要求,构建“连接+算力+能力”新基建战略,为各行各业数字经济发展注入新动能。

    移动云举办首届“移动云杯”算力网络应用创新开发大赛,以“算网融合,云创未来”为主题,旨在吸引企业、高校学生、集团内、创业团队和自由技术开发者通过大赛探索算力网络应用场景及多样化需求,赋能各行各业数字经济发展。
    本次大赛特设移动云赛道,旨在挖掘集团内移动云优秀创新案例,大赛诚挚邀集团内各公司移动云开发者,一起开掘新知,探索未知。

  • 2022年“移动云杯”算力网络应用创新大赛(行业赛道) 双碳节能应用-暨“数智辽宁”双碳节能专题赛

    移动运营商基站供电电源,主要是由不同放电时长的2V电池组成,所以对不同类型的2V电池的放电电压研究分析成为基站储能、节能减排的重点。针对部分电池的历史数据进行数据分析,通过AI技术进行其他电池的放电电压的预测则成为移动运营商电池储能方面研究重要的措施之一。
  • 2022年“移动云杯”算力网络应用创新大赛(行业赛道) 工业边缘云应用-工业旋转机械设备健康状态检测专题

    本赛道初赛共两道算法题,叉车周界行人检测专题和工业旋转机械设备健康状态检测专题,参赛选手可任选一道作答。本赛道为工业边缘云应用-工业旋转机械设备健康状态检测专题。

    1)工业旋转机械设备健康状态检测

    机械设备的健康状态不仅直接影响企业的经济效益,更与生产安全紧密相关,实现设备健康状态的准确识别与及时预警,具有重大意义。

  • 2022年“移动云杯”算力网络应用创新大赛(行业赛道) 工业边缘云应用-叉车周界行人检测专题

    本赛道初赛共两道算法题,叉车周界行人检测专题和工业旋转机械设备健康状态检测专题,参赛选手可任选一道作答。本赛道为工业边缘云应用-叉车周界行人检测专题。

    1)叉车周界行人检测

    为了给有叉车作业的环境提供更高的安全保障,开发出一套行人靠近叉车检测预警系统尤为重要。

  • 创意视角下的数字广告CTR预估挑战赛

    讯飞AI营销云基于深耕多年的人工智能和大数据技术,赋予营销智慧创新的大脑,以健全的产品矩阵和全方位的服务,帮助广告主用AI+大数据实现营销效能的全面提升,打造数字营销新生态。

    广告的CTR预估(点击率预估)是AI营销领域的一个重要的场景,基于移动互联网的流量历史投放数据精准的预估用户、流量、广告创意的点击率,以最合适的出价去进行竞价,成为提供平台收入和广告主ROI的重要手段之一。

  • 系统访问风险识别

    • 赛题背景

    随着国家、企业对安全和效率越来越重视,作为安全基础设施之一——统一身份管理(IAM,Identity and Access Management)系统也得到越来越多的关注。 在IAM领域中,其主要安全防护手段是身份鉴别,身份鉴别主要包括账密验证、扫码验证、短信验证、人脸识别及指纹验证等方式。这些身份鉴别方式一般可分为三类,即用户所知(如口令)、所有(如身份证)、特征(如人脸识别及指纹验证)。这些鉴别方式都有其各自的缺点——比如口令,强度高了不容易记住,强度低了又容易丢;又比如人脸识别,做活体验证用户体验不好,静默检测又容易被照片、视频、人脸模型绕过。也因此,在等保2.0中对于三级以上系统要求必须使用两种及以上的鉴别方式对用户进行身份鉴别,以提高身份鉴别的可信度,这种鉴别方式也被称为双因素认证。
    对用户来说,双因素认证在一定程度上提高了安全性,但也极大地降低了用户体验。也因此,IAM厂商开始参考用户实体行为分析(UEBA,User and Entity Behavior Analytics)、用户画像等行为分析技术,来探索一种既能确保用户体验,又能提高身份鉴别可信度的方法。而在当前IAM的探索过程中,目前最容易落地的方法是基于规则的行为分析技术,因为它可理解性较高,且容易与其它身份鉴别方式进行联动。
    但基于规则的行为分析技术局限性也很明显,首先这种技术是基于经验的,有“宁错杀一千,不放过一个”的特点,其次它也缺少从数据层面来证明是否有人正在尝试窃取或验证非法获取的身份信息,又或者正在使用窃取的身份信息。鉴于此,我们举办这次竞赛,希望各个参赛团队利用竞赛数据和行业知识,建立机器学习、人工智能或数据挖掘模型,来弥补传统方法的缺点,从而解决这一行业难题。

    • 赛题任务

    本赛题中,参赛团队将基于用户历史的系统访问日志及是否存在风险标记等数据,结合行业知识,构建必要的特征工程,建立机器学习、人工智能或数据挖掘模型,并用该模型预测将来的系统访问是否存在风险。

  • 基于昇思MindSpore AI框架的肾脏肿瘤分割

    • 赛题背景

    全球每年肾癌新发病例超过400000例,且发病率正在逐年增加,处于局部状态的肾肿瘤可通过手术进行治疗。肾肿瘤在计算机断层扫描(CT)成像中可被显著观察到,这使得放射科医生和外科医生能够研究肿瘤大小、形状和外观及其治疗前景之间的关系并进行科学的手术规划。然而,肿瘤形态信息的人工分割是一项费力的工作,同时非常依赖医师的诊断经验,肾肿瘤和周围解剖结构的自动分割是消除这些局限性的有力工具。
    传统的肿瘤分割方法,如阈值分割法、区域增长法和活动轮廓模型方法,主要基于边缘和灰度分布的差异。然而,由于不同个体其肿瘤CT图像在形态、纹理和灰度分布上存在较大差异,可能出现多个肿瘤及其模糊边界,这些传统方法难以实现高效准确的肿瘤分割。
    近年来深度学习方法在图像分割领域引起了广泛关注,特别是UNet等网络在肿瘤分割中取得了显著的效果,但这些网络在结构设计、训练模式等方面仍存在进一步提升空间。本次比赛面向全国对深度学习和医学影像有兴趣的研究者,吸引大家设计基于高性能深度学习模型的肾肿瘤分割算法,实现肿瘤的快速精准分割。

    • 赛题任务

    这一挑战的目标是开发快速可靠的肾脏和肾脏肿瘤语义分割方法,形态上的异质性以及模糊的组织边界可能是需要解决的难题。比赛提供接受部分或根治性肾切除术的210例肾癌患者的动脉期腹部CT扫描数据,并标记了真实的语义分割结果。
    本赛题中,参赛团队将需要利用所提供数据,分析数据特点,在华为昇思MindSpore AI框架上设计、开发可用于肾脏和肾脏肿瘤语义分割的算法模型,在测试集中得到最好的肾脏和肾脏肿瘤语义分割结果的模型为获胜者。

  • 基于openLooKeng SQL语句内存使用量预测系统

    本赛题旨在建立一个SQL语句内存使用量预测系统。通过预测系统,可以准确的预估SQL语句的内存使用量。在查询引擎中嵌入预测系统后,如果当前SQL的内存使用量大于剩余内存,当前SQL将被放入等待队列,等待资源的释放。本赛题只涉及SQL语句内存使用量预测系统,重点在于根据SQL涉及的算子、表格数据量和参与计算的列等信息,建立一个内存使用量预测系统。
  • 基于文心CV大模型的智慧城市视觉多任务识别

    • 赛题背景

    近年来预训练大模型一次次刷新记录,展现出惊人的效果,但对于产业界而言,势必要面对如何应用落地的问题。当前预训练模型的落地流程可被归纳为:针对只有少量标注数据的特定任务,使用任务数据 fine-tune 预训练模型并部署上线。然而,当预训练模型参数量不断增大后,该流程面临两个严峻的挑战。首先,随着模型参数量的急剧增加,大模型 fine-tuning 所需要的计算资源将变得非常巨大,普通开发者通常无法负担。其次,随着 AIoT 的发展,越来越多 AI 应用从云端往边缘设备、端设备迁移,而大模型却无法直接部署在这些存储和算力都极其有限的硬件上。

    针对预训练大模型落地所面临的问题,百度提出统一特征表示优化技术(UFO:Unified Feature Optimization),在充分利用大数据和大模型的同时,兼顾大模型落地成本及部署效率。
     

    • 赛题任务

    在背景介绍中我们知道,受算力和存储的限制,大模型无法直接部署在边缘设备上。一个针对云端设备开发的模型要部署到边缘设备或端设备时往往要进行模型压缩,或完全重新设计,而预训练大模型的压缩本身需要耗费大量的资源。

    另外,不同任务对模型的功能和性能要求也不同,例如人脸识别门禁系统只需具备人脸识别功能即可,智慧社区的管控系统则需要同时具备人脸识别和人体分析的能力,部分场景还需要同时具备车型识别及车牌识别能力。即便是同样的人脸识别任务,门禁系统和金融支付系统对模型的精度和性能要求也不同。目前针对这些任务往往需要定制化开发多个单任务模型,加之需要适配不同的硬件平台,AI模型开发的工作量显著增长。

    针对大模型的开发和部署问题,VIMER-UFO 给出了 One for All 的解决方案,通过引入超网络的概念,超网络由众多稀疏的子网络构成,每个子网络是超网络中的一条路径,将不同参数量、不同任务功能和不同精度的模型训练过程变为训练一个超网络模型。训练完成的 VIMER-UFO One for All 超网络大模型即可针对不同的任务和设备低成本生成相应的可即插即用的小模型,实现 One for All Tasks 和 One for All Chips 的能力。
    我们从垂类应用出发,选择了人脸、人体、车辆、商品四个任务来训练视觉模型大一统模型。

  • 基于文心NLP大模型的阅读理解可解释评测

    • 赛题背景

    深度学习模型常被当作一个黑盒使用,其内部决策机制是不透明的。这种不透明性导致使用者对其结果的不信任,增加了落地难度,尤其是在医疗、法律等特殊领域。近年来,深度学习模型的可解释性受到广泛关注,涌现出很多致力于分析和增强模型可解释性的工作,如模型预测依赖证据提取、基于证据的可信增强等。为了进一步推动该方向研究发展,我们构建了可解释评测数据集和评估指标,用来评测模型的可解释性,及证据抽取方法的准确性。本次比赛提供了阅读理解任务的评测数据,本数据集是基于DuReader_chechlist的测试集构建的,针对每一条评测数据都人工标注了证据。同时,针对每一条数据,我们从抗干扰性、敏感性、泛化性等维度标注了扰动数据。旨在从合理性、忠诚性角度评估模型的可解释性。希望通过本次比赛,推动模型可解释性研究进一步发展。

    神经网络(NN)模型已经成功地应用于很多NLP任务并取得了不错的成绩。但由于NN模型的黑盒性质,降低使用者对其结果的信任度,阻碍了NN模型更大规模地落地应用,尤其是对模型可靠性和安全性要求较高的领域,如医疗、法律等。因此,NN模型的可解释性、鲁棒性等问题受到广泛关注。为进一步推动模型可解释性研究的发展,评测数据和对应的评估指标是必需的。

    本次比赛提供阅读理解任务的可解释评测数据集和相应的评估指标,评估模型的可解释性以及解释方法的精准性。本次比赛旨在为研究者提供学术交流平台,推动模型可解释的发展,以协助构建更加可信赖的深度学习模型和系统。

    • 赛题任务

    本次比赛聚焦于阅读理解任务的可解释评测。选手需使用飞桨(PaddlePaddle)深度学习框架,根据给定的一段文本T及与其相关的问题Q,从文本T中抽取问题Q对应的的答案,同时给出模型预测答案所依赖的证据。如下方示例所示,“答案”和“证据”字段对应模型输出,其中答案和证据皆来自输入文本T。

  • 基于openLooKeng SQL语句内存使用量预测系统

    CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。

    大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。

  • 基于文心CV大模型的智慧城市视觉多任务识别

    CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。

    大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。

  • 基于文心NLP大模型的阅读理解可解释评测

    CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会于2013年创办,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛面向重点行业和应用领域征集需求,以前沿技术与行业应用问题为导向,以促进行业发展及产业升级为目标,以众智、众包的方式,汇聚海内外产学研用多方智慧,为社会发现和培养了大量高质量数据人才。

    大赛迄今已成功举办九届,累计吸引全球25个国家,1500余所高校、1800余家企事业单位及80余所科研机构的16万余人参与,已成为中国大数据与人工智能领域影响力最广、参赛规模最大、成熟度最高的综合赛事之一。2022年,我们将迎来第十届CCF BDCI,十年磨砺,创新聚力再出发,CCF BDCI将进一步扩大影响力,关注数字经济技术发展与人才培养,助力推动我国大数据技术及产业生态发展。

    本赛题为大赛赛题之一,另含算法赛道、自主平台赛道、系统赛道、训练赛道等二十余道竞技及训练赛题,查看全部赛题可点击进入 2022 CCF大数据与计算智能大赛(CCF BDCI) 官网。

  • 联通赛-乡村振兴方案

    根据本次比赛所提供的滨州市乡镇人员人口学数据登记的企业工商数据,以“乡村振兴建设”为主题进行数据分析与挖掘。可通过描述性统计分析,展示数据原有的高价值信息对于乡村振兴的价值与意义。参赛团队可关联其它数据或自有数据,灵活运用 NLP 等技术对于原数据中的非结构信息进行充分挖掘,分析滨州当地的乡镇产业资源、产业结构、人口结构,也可与其它乡镇进行对比,在人口问题、产业资源投放、产业结构优化等方面提出建议。参赛团队也可围绕其它与主题相关的参赛思路展开自主分析。
  • 云上花蕾飘四方:以羌绣激活阿坝州文旅高质量发展

    任务要求:结合羌绣文献资料、政府公开数据、旅游消费数据、内容传播数据等,对四川羌绣的文化推广和旅游发展状况展开调研和分析,深入挖掘羌绣的艺术文化与经济价值,并结合当地文旅资源,形成以羌绣为核心的文旅发展可行性评估方案,为打造阿坝州非遗文化IP、提升区域文化品牌、带动当地文旅增长提供参考。

    方案中需要回答以下几个问题:

    羌绣在互联网上的认知度?

    羌绣相关的旅游资源以及经济、文化价值排序?

    定位羌绣旅游的目标受众及其画像?

    羌绣有哪些特色元素可用以打造阿坝州文化IP?

  • 第四届“泰迪杯”数据分析技能赛

    为推广我国高校数据分析实践教学,培养学生数据分析的应用和创新能力,增加校企交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力,由泰迪杯数据分析技能赛组织委员会主办,广东泰迪智能科技股份有限公司承办,广东省工业与应用数学学会、人民邮电出版社及北京泰迪云智信息技术研究院协办的“泰迪杯”数据分析技能赛(以下简称技能赛)于2021年9月举行。竞赛目的在于以赛促学,激励学生学习数据分析的积极性,提高学生分析、解决实际问题的职业技能;以赛促教,推动数据分析技术在职业院校的推广和应用;以赛促创,通过竞赛提高学生的数据分析应用创新能力。
  • 图像分类练习赛——苹果品牌Logo识别

    【赛题背景

    logo是徽标或者商标的英文说法,起到对商标拥有公司的识别和推广的作用,形象的logo可以让消费者记住公司主体和品牌文化,logo对于品牌来说非常重要,是品牌价值的重要组成部分。如果要盘点世界上最有价值的logo的话,苹果的logo肯定要位列其中。

    苹果最初的Logo在1976年由创始人三人之一韦恩设计,只在生产Apple-I时使用,为牛顿坐在苹果树下看书的钢笔绘画。在1976年由乔布斯决定重新委托广告设计,并配合Apple-2的发行使用,本次Logo确定使用了彩虹色、具有一个缺口的苹果图像。

    这个Logo一直使用至1998年,在iMac发布时作出修改,变更为单色系列。2007年再次变更为金属带有阴影的银灰色。事实上,该品牌最近又恢复了2000年的标识,这表明如果标识足够强大,用户仍然会认出来。

  • 飞桨学习赛:吃鸡排名预测挑战赛

    飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台。更多飞桨资讯,点击此处查看。
    飞桨学习赛由百度飞桨于 2019 年发起,面向全球 AI 开发者,赛题范围广,涵盖领域多。学习赛旨在通过长期发布的经典比赛项目,为开发者提供学习锻炼机会,助力大家在飞桨大赛中获得骄人成绩。
    参赛选手需使用飞桨框架,基于特定赛题下的真实行业数据完成并提交任务。学习赛采取月度评比方式,为打破历史最高记录选手和当月有资格参与月度评奖的前 10 名选手提供飞桨特别礼包奖励。更多惊喜,更多收获,尽在飞桨学习赛。

    赛题背景

    《绝地求生》(PUBG) 是一款战术竞技型射击类沙盒游戏。在游戏中,玩家需要在游戏地图上收集各种资源,并在不断缩小的安全区域内对抗其他玩家,让自己生存到最后。当选手在本局游戏中取得第一名后,会有一段台词出现:“大吉大利,晚上吃鸡!”。
    我们提供了PUBG游戏数据中玩家的行为数据,希望参赛选手能够构建模型对玩家每局最终排名进行预测。
  • 千言数据集:文本相似度可解释性评测(英文)

    This task is to evaluate both the prediction accuracy and interpretability of semantic textual similarity models. Given a text pair, the model needs to provide the predicted similarity label and the rationale that supports the current prediction. The model accuracy is evaluated on predicted labels, and the performance of interpretability is evaluated on provided rationales.
    This task provides a fine-grained evaluation dataset with human-annotated rationales and perturbed examples, which can be used to evaluate interpretability from multiple perspectives. Please see the paper “A Fine-grained Interpretability Evaluation Benchmark for Neural NLP“ for the details of dataset construction. Besides, an example from this dataset is shown in “dataset” section, and the metrics are introduced in “metrics” section. We hope this dataset can facilitate the research progress of interpretability.
    页次:7/30 每页20 总数593    首页  上一页  下一页  尾页    转到: