本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事 —— 心跳信号分类预测。
赛题以心电图心跳信号数据为背景,要求选手根据心电图感应数据预测心跳信号所属类别,其中心跳信号对应正常病例以及受不同心律不齐和心肌梗塞影响的病例,这是一个多分类的问题。通过这道赛题来引导大家了解医疗大数据的应用,帮助竞赛新人进行自我练习、自我提高。
为了更好的引导大家入门,还特别为本赛题定制了学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。通过对本方案的完整学习,可以帮助掌握数据竞赛基本技能。(也可以进行视频直播学习)
新人赛的目的主要是为了更好地带动处于初学者阶段的新同学们一起玩起来,因此,我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及一些核心的思路等内容。
本次教学赛是数据科学家陈博士发起的数据分析系列赛事第3场 —— 汽车产品聚类分析
赛题以竞品分析为背景,通过数据的聚类,为汽车提供聚类分类。对于指定的车型,可以通过聚类分析找到其竞品车型。通过这道赛题,鼓励学习者利用车型数据,进行车型画像的分析,为产品的定位,竞品分析提供数据决策。
数据分析达人赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
本次教学赛是数据科学家陈博士发起的数据分析系列赛事第2场 —— 产品关联分析
赛题以购物篮分析为背景,要求选手对品牌的历史订单数据,挖掘频繁项集与关联规则。通过这道赛题,鼓励学习者利用订单数据,为企业提供销售策略,产品关联组合,为企业提升销量的同时,也为消费者提供更适合的商品推荐。
数据分析达人赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
本次教学赛是数据科学家陈博士发起的数据分析系列赛事第1场 —— 用户情感可视化分析
赛题以网络舆情分析为背景,要求选手根据用户的评论来对品牌的议题进行数据分析与可视化。通过这道赛题来引导常用的数据可视化图表,以及数据分析方法,对感兴趣的内容进行探索性数据分析。
数据分析达人赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
本次教学赛是陈博士发起的数据分析系列赛事第3场 —— 证券数据可视化分析
赛题以证券数据分析为背景,对股票价格、融资融券数据的日线、月线、K线进行探索。同时选手也可以探索量化交易的指标,比如采用MACD,KDJ指标等进行投资决策,计算投资策略的年化收益率,最大回撤等。
金融数据分析比赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
本次教学赛是陈博士发起的数据分析系列赛事第1场 —— 银行客户认购产品预测
赛题以银行产品认购预测为背景,想让你来预测下客户是否会购买银行的产品。在和客户沟通的过程中,我们记录了和客户联系的次数,上一次联系的时长,上一次联系的时间间隔,同时在银行系统中我们保存了客户的基本信息,包括:年龄、职业、婚姻、之前是否有违约、是否有房贷等信息,此外我们还统计了当前市场的情况:就业、消费信息、银行同业拆解率等。
用户购买预测是数字化营销领域中的重要应用场景,通过这道赛题,鼓励学习者利用营销活动信息,为企业提供销售策略,也为消费者提供更适合的商品推荐。
金融数据分析比赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
本次教学赛是陈博士发起的数据分析系列赛事第2场 —— 保险反欺诈预测
赛题以保险风控为背景,保险是重要的金融体系,对社会发展,民生保障起到重要作用。保险欺诈近些年层出不穷,在某些险种上保险欺诈的金额已经占到了理赔金额的20%甚至更多。对保险欺诈的识别成为保险行业中的关键应用场景。
金融数据分析比赛的目的是为了更好地带动数据科学初学者一起玩起来,因此我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及数据分析思路等内容。
ICDAR 2023 BDVT-QA (Competition for Born Digital Video Text Question Answering)挑战赛即将开启,并开放业内第一个基于数字原生视频文本问答的数据集。竞赛聚焦视频文字的关键技术问题的研究和探索,旨在与全球科研人才一同推动视频文字相关的应用和发展。
视频作为移动互联网时代最常见的内容服务,在购物、直播、短视频、和社交等邻域扮演着越来越重要的角色。视频中的文字作为视频中的显著特征,是关键信息的载体和媒介。数字原生视频是相对于自然场景视频而言的分类,其内容往往通过后期的制作和处理,才会对外传播,我们常见的视频动画、特效和提示词都是数字原生的重要对象。因此在数字原生视频中的文字,有比自然场景视频的文字更高的出现频率,并有更为明显的意图性。
视频文字问答主要针对视频中的文字进行提问和回答。数据集的制作过程中侧重选择有视频文字特色的数据,(1)文字有较多动画和特效,如渐入渐出,放大缩小等;(2)文字随着载体有变化的运动轨迹,如运动中的富文本商品等;(3)问题的答案需要处理多帧的文本,如安装某个工具的第几步等。竞赛主要设计了两个赛道。第一个赛道关于视频中的文本数字化,相比已有的视频文本数据集,会更加侧重于视频文字的融合和去重。第二个赛道是问答,据我们所知,这是业界第一次针对视频文字的问答,也是我们思考数字原生视频OCR的最终目的后做出的设置,即,机器应该在完成视频OCR的融合后去理解整段且分句展示的文本内容。需要强调的是,为了让算法研究更加聚焦于视频文字本身,题目的设置尽最大可能避免过度依赖图文关联的多模态问题和常识的知识图谱问题。
ICDAR 2023 BDVT-QA (Competition for Born Digital Video Text Question Answering)挑战赛即将开启,并开放业内第一个基于数字原生视频文本问答的数据集。竞赛聚焦视频文字的关键技术问题的研究和探索,旨在与全球科研人才一同推动视频文字相关的应用和发展。
视频作为移动互联网时代最常见的内容服务,在购物、直播、短视频、和社交等邻域扮演着越来越重要的角色。视频中的文字作为视频中的显著特征,是关键信息的载体和媒介。数字原生视频是相对于自然场景视频而言的分类,其内容往往通过后期的制作和处理,才会对外传播,我们常见的视频动画、特效和提示词都是数字原生的重要对象。因此在数字原生视频中的文字,有比自然场景视频的文字更高的出现频率,并有更为明显的意图性。
视频文字问答主要针对视频中的文字进行提问和回答。数据集的制作过程中侧重选择有视频文字特色的数据,(1)文字有较多动画和特效,如渐入渐出,放大缩小等;(2)文字随着载体有变化的运动轨迹,如运动中的富文本商品等;(3)问题的答案需要处理多帧的文本,如安装某个工具的第几步等。竞赛主要设计了两个赛道。第一个赛道关于视频中的文本数字化,相比已有的视频文本数据集,会更加侧重于视频文字的融合和去重。第二个赛道是问答,据我们所知,这是业界第一次针对视频文字的问答,也是我们思考数字原生视频OCR的最终目的后做出的设置,即,机器应该在完成视频OCR的融合后去理解整段且分句展示的文本内容。需要强调的是,为了让算法研究更加聚焦于视频文字本身,题目的设置尽最大可能避免过度依赖图文关联的多模态问题和常识的知识图谱问题。
为响应国务院《新一代人工智能发展规划》的号召,加大力度面向全国青少年普及人工智能的相关知识和技能,提高青少年的人工智能素养,培育未来的人工智能英才,中国人工智能学会日前发起“天池杯”全国中小学科技少年AI领航计划(简称“科技少年AI领航计划”),并由阿里云天池平台承办。
回到活动主页面: "天池杯"全国中小学科技少年AI领航计划
高级挑战设置为“地址结构化解析挑战赛”,详情可点击“赛题与数据描述”了解。
人类的活动离不开位置,从空间上可以表征为坐标,从文本上表征为通讯地址。通讯地址广泛存在于电商物流、政府登记、金融交通等领域。对通讯地址的分析、聚合服务已经是一项重要基础服务,支撑着诸多互联网场景,比如地图搜索、电商物流分析等。实际应用中,地址文本存在写法自由、缺省别名多、地域性强等特点,对地址的解析、归一和匹配等都造成困难。