• 【Python入门系列】用Pandas揭秘美国选民的总统喜好

    Python入门系列主要带领学习者利用Python进行数据分析以及数据可视化,包含数据集的处理、数据探索与清洗、数据分析、数据可视化四部分,利用pandas、matplotlib、wordcloud等第三方库带大家玩转数据分析~还有丰富礼品等你来领取哦~

    针对数据新人开设的实战练习专场,以有趣主题作为实践场景,提供详尽入门教程以及DSW算力资源,手把手教你学习Python语法。天池希望此赛事能成为高校备受热捧Python实战课程,帮助更多学生掌Python技能、增加实战项目经验。

    本期由开源学习组织Datawhale主办, 欢迎更多合作方加入开源学习的大家庭。

  • 最简数据挖掘练习赛-猫狗大战

    有人说,猫与狗上千年历史的敌对状态,主要是由于在长期进化过程中迫于对生存资源进行争夺而造成的残酷竞争导致的;也有人说,是他们天生的交流方式不同导致的;今天猫狗大战开始了,为了避免被这些家伙拆房的危险,各位智慧的人类,请速来隔离高冷猫和憨厚狗。

    参赛者需要从训练集里建立一个模型去识别测试集里的小狗来。谁能识别出最多的数量,谁的成绩就更好。
    参赛者需要提交你识别出认为是小狗图片的图片名,不包括文件类型,例如:xabcd.jpg,则提交的uid为xabcd。详情参考示例提交文件。

  • 最简数据挖掘练习赛-矛与盾

    人类的终极智慧——密码学。 密码学,聆听死人的心跳。 生活中我们都要用到密码,使用银行卡,登陆邮箱,qq,微博等等。到底密码是什么?其实这些密码并不是真正意义上的密码,只是口令,就像“天王盖地虎,宝塔镇河妖”一样的暗号。密码学是研究编制密码和破译密码的技术科学。研究密码变化的客观规律,应用于编制密码以保守通信秘密的,称为编码学;应用于破译密码以获取通信情报的,称为破译学。
  • 最简数据挖掘练习赛-猜你喜欢

    个性化推荐已经成为各大电子商务网站的必备服务。准确的推荐不仅可以提高商家的产品销量,更能为顾客提供优质快速的购物体验。推荐系统发展至今,已经有许多非常优秀的推荐算法,从各种不同的角度来为电子商务大厦添砖加瓦。这一次,我们特意为大家准备了一个商品网站的用户评分数据,记录了几年时间内,站内的每一位顾客在某一时刻对某商品的打分值。         迄今为止,已经有不少研究表明,用户在短期时间内会浏览相似的商品,但其兴趣可能会随时间发生些许变化。在此练习赛中,希望通过训练带有时间标记的用户打分行为,准确地预测这些用户对其他商品的打分。

  • 最简数据挖掘练习赛-地点推荐系统

    该比赛是移动数据挖掘课程的大作业,同学们利用用户的签到记录和地点的位置、类别等信息,为每个用户选取出可能感兴趣的兴趣地点。 需要参赛者就训练集数据中的每一位用户,各推荐50个用户感兴趣的地点。
  • 门店行业自动分类竞赛

    本次赛题以门店类别识别为主题,利用人工智能技术,对门店的图片进行识别,并对门店图片进行分类。
  • 最简数据挖掘练习赛-借贷风险预测

    给定银行用户信息,建立分类模型,预测银行用户的信用好坏。
  • 最简数据挖掘练习赛-员工离职预测

    给定影响员工离职的因素和员工是否离职的记录,建立模型预测有可能离职的员工。
  • 最简数据挖掘练习赛-空气质量预测

    给定一段时间内的北京天气相关指数数据和北京PM2.5指数等,建立模型预测接下来一段时间内北京的PM2.5指数。
  • 最简数据挖掘练习赛-房价预测

    给定的房屋基本信息以及房屋销售信息等,建立模型预测房屋的销售价格。
  • 最简数据挖掘练习赛-垃圾邮件分类

    给定邮件文本信息,建立分类模型,判断哪些邮件属于垃圾邮件。
  • 最简数据挖掘练习赛-文本情感分析

    给定电影评论文本信息,建立分类模型,判断网站评论数据中的情感类别。
  • 最简数据挖掘练习赛-手写数字识别

    给定若干个二元化表示的灰度图,建立分类模型,判断该灰度图显示什么数字。
  • 最简数据挖掘练习赛-识别失信企业

    建立分类模型,识别有失信记录的企业。
  • 最简数据挖掘练习赛-租金预测

    给定房屋租金价格的各个影响因素数据,建立模型预测国内某城市房屋的租金价格。
  • 最简数据挖掘练习赛-客户流失判断

    给定企业客户信息,建立分类模型,判断企业客户是否会流失。
  • 【Python入门系列】画月饼过云上中秋

    天池python入门系列赛是针对数据新人开设的实战练习专场,以有趣主题作为实践场景,提供详尽入门教程以及DSW算力资源,手把手教你学习python语法。天池希望此赛事能成为高校备受热捧的python实战课程,帮助更多学生掌握python技能。
  • 零基础入门数据分析-学术前沿趋势分析

    本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第六场 —— 零基础入门数据分析之学术前沿趋势分析。

    赛题以数据分析为背景,要求选手使用公开的arXiv论文完成对应的数据分析操作。与之前的赛题不同,本次赛题不仅要求选手对数据进行分析,而且需要选手利用赛题数据完成具体的可视化分析。

    为更好的引导大家入门,我们为本赛题定制了学习方案和学习任务,其中包括数据科学库使用(PandasNumpyMatplotlib)、数据分析介绍和数据分析工具使用三部分。在具体任务中我们将讲解具体工具和使用和完成任务的过程。通过对本方案的完整学习,可以帮助掌握数据分析基本技能。同时我们也将提供专属的视频直播学习通道。

    新人赛的目的主要是为了更好地带动处于初学者阶段的新同学们一起玩起来,因此,我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、数据分析及可视化、算法模型的分析以及一些核心的思路等内容。

  • 【长期赛】流评测(模型server)练习赛

    流评测练习场赛事旨在让参赛者对大赛的流评测形式和如何将自己训练好的模型变成server服务有个基本了解与实际应用,帮助大家更好的参加后续大赛并且掌握模型到服务的基础技能。

    新人赛的目的主要是为了更好地带动处于初学者阶段的新同学们一起玩起来,因此,我们鼓励所有选手,基于赛题发表notebook分享,内容包含但不限于对赛题的理解、算法模型的分析以及一些核心的思路等内容。

  • 零基础入门数据挖掘 - 二手车交易价格预测

    本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。

    赛题以二手车市场为背景,要求选手预测二手汽车的交易价格,这是一个典型的回归问题。通过这道赛题来引导大家走进AI数据竞赛的世界,主要针对于于竞赛新人进行自我练习、自我提高。

    为了更好的引导大家入门,我们同时为本赛题定制了系列学习方案,其中包括数据科学库、通用流程和baseline方案学习三部分。通过对本方案的完整学习,可以帮助掌握数据竞赛基本技能。同时我们也将提供专属的视频直播学习通道。

    页次:1/30 每页20 总数593    首页  上一页  下一页  尾页    转到: