• (练习赛) 摩拜

    摩拜单车自推出以来,深受用户喜爱,在很多城市已经成为除公共交通以外的居民首选的 出行方式,大大减轻了城市路网压力和拥堵情况。随着绿色出行和环保观念的深入人心, 将会有更多的用户选择摩拜单车,进一步实现让自行车回归城市的目标。同时,摩拜致力 于应用前沿科技的帮助人们更好地出行,利用机器学习去预测用户的出行目的地便是众多 应用场景中重要的一个。 

    目前,摩拜单车在北京的单车投放量已经超过40万。用户可以直接在人行道上找到停放的单车,用手机解锁,然后骑到目的地后再把单车停好并锁上。因此,为了更好地调配和管理这40万辆单车,需要准确地预测每个用户的骑行目的地。

  • 高级机器学习课程项目

    本竞赛是学堂在线“高级机器学习”课程的课程项目之一。
     
    在许多应用中,同名消歧 (Name Disambiguation - aiming at disambiguating WhoIsWho) 一直被视为一个具有挑战性的问题,如科学文献管理、人物搜索、社交网络分析等,同时,随着科学文献的大量增长,使得该问题的解决变得愈加困难与紧迫。尽管同名消歧已经在学术界和工业界被大量研究,但由于数据的杂乱以及同名情景十分复杂,导致该问题仍未能很好解决。
  • 智源抗疫 - 药物研发小分子性质预测赛

    药物研发是一项成本极高的工作。著名的医学期刊JAMA的一篇调查论文显示,研发一款癌症药物的成本在6.48亿美元左右[1]。 其中,大量成本都会用于待选药物分子的测试实验上。虚拟筛选等计算技术可以缩小筛选对象集,降低制药成本,而机器学习技术的出现极大地辅助了计算机辅助药物设计的进步。因此,化学信息学或药物研发领域开始使用各种机器学习技术,包括SVM [3]、随机森林 [4]和深度学习 [5][6] ,以及图神经网络[7]等。不过,相关技术仍有提升空间。
  • 新冠流行预测(第一阶段)

    传染病爆发会危害全球的健康和经济。最近几年,基于病原生物学、生物信息学和机器学习的交叉学科开始研究和预测传染病爆发的发生和持续走向。研究人员希望这些计算工具可以改善针对传染病的预防和应对决策。本次评测的目的是预测新冠肺炎的未来趋势。
  • 2021搜狐校园文本匹配算法大赛

    自然语言理解是人工智能的重大难题之一,也是目前智能语音交互和人机对话的核心挑战。

     

    在自然语言理解中,自然语言推理(Nature Language Inference,NLI)被认为是一个非常基础但重要的研究任务。它要求机器去理解自然语言的深层次语义信息,进而做出合理的推理。更具体的推理任务,则是判断句子关系,即对于给定的两个句子,判断它们含义是否一致。

     

    NLI任务作为一种分类任务,可以帮助评价机器的自然语言理解能力。如果一个模型在NLI任务上有良好表现,则可以认为该模型具备一定的自然语言理解能力。

     

    当前,NLI领域虽然发展迅猛,但仍有诸多难点和挑战,比如如何将常识知识融入机器推理模型中、如何更准确地理解语义等等。

     

    在上述背景之下,搜狐发起并主办 “2021搜狐校园算法大赛”,有针对性地设置30万条数据,总奖金池6.5万元。旨在通过提供业务场景、真实数据、专家指导,选拔和培养有志于自然语言处理领域的算法研究、应用探索的青年才俊,共同探索更多可能、开启无限未来。

  • 【追风少年】台风图像时间序列预测

    在太平洋西侧,每年夏季会陆续生成一系列热带风暴,其中有些发展成为台风乃至于超级台风,一边旋转一边向亚洲东海岸移动。台风往往在东南亚国家、中国、日本、以及朝鲜半岛登陆,带来狂风暴雨,造成巨大的财产损失,时有人员伤亡。如果能够提早一两天预测到台风的发展强度、行进轨迹、乃至于降水在各地的实时详细分布,就有可能为各国人民提供宝贵预警时间,多做防灾减灾工作。

    赛题由马里兰大学博士宋宽构思设计,原始数据来源于日本气象厅葵花 8 号卫星的公开数据记录,由日本千叶大学进行第一轮数据处理,由宋宽博士进行第二轮数据处理。

    比赛以算法交流为出发点,尝试深度学习在气象卫星图像领域的应用,希望通过社区的力量为台风预警与防灾探索可能的方向。欢迎各界共同参与讨论,如有意向开展关于赛题相关领域的交流、研讨、合作,或者关于杭州云栖Hackathon现场想法等等,可联系钉钉群主或邮件 jingyi.hjy@alibaba-inc.com

  • Tianchi Data Hero Cup —— 短租数据集分析

    共享,通过让渡闲置资源的使用1.要求以个人形式参与比赛,并确保报名信息准确有效;
    2. 报名方式:用淘宝或阿里云账号登入天池官网,完成个人信息注册,即可报名参赛;
    3. 参赛指南
    4. 历届比赛沉淀。权,在有限增加边际成本的前提下,提高了资源利用效率。随着信息的透明化,越来越多的共享发生在陌生人之间。短租,共享空间的一种模式,不论是否体验过入住陌生人的家中,你都可以从短租的数据里挖掘有趣的信息。
  • 快来一起挖掘幸福感!

    天池新人实战赛是针对数据新人开设的实战练习专场,以经典赛题作为学习场景,提供详尽入门教程,手把手教你学习数据挖掘。天池希望新人赛能成为高校备受热捧的数据实战课程,帮助更多学生掌握数据技能。
  • 阿里云安全恶意程序检测

    作为天池平台与阿里云安全联合举办的最具“正义感”和“实战感”的算法大赛,一直在探索AI和网络安全防御的融合边界,在过去赛事中,安全和算法交叉领域的各路英豪已经展现了人工智能在网页内容分析,webshell检测,扫描爆破拦截,web攻击防御等领域的强大量。今年我们将聚焦恶意文件云检测这一问题,让云计算的数据优势通过选手的聪明才智转化为行业解决方案,让病毒木马无所遁形,让“云计算”与“安全”发生新的化学反应。
  • 工业蒸汽量预测

    火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。
  • Keypoints Detection of Apparel-Challenge the Baseline

    Upgrades in consumption patterns mean that there is significant room for potential growth in the fashion industry. According to official statistics from different countries, the market value of the global apparel market is worth over USD 3 trillion. Although artificial intelligence (AI) technology has been evolving along with the fashion industry, there are still different challenges in different areas that need to be addressed.

    To promote the development of the fashion industry, the Vision & Beauty Team of the Alibaba Group and the Institute of Textile and Clothing of The Hong Kong Polytechnic University are pleased to jointly launch a revolutionary dataset which integrates both professional fashion knowledge and machine learning formulation.

    This challenge is focusing on one part of the dataset: keypoints detection of apparel. The analysis of apparel with computers could be easily affected by the dimension and shape of the apparel, distance and angle of shooting, or even how the apparel is displayed or the model is posing. Contestants are required to detect keypoints of apparel images. This task can help to improve the performance of applications such as alignment, recognition of the local attributes and auto-editing of the images of apparel.

  • Attributes Reconition of Apparel-Challenge the Baseline

    Upgrades in consumption patterns mean that there is significant room for potential growth in the fashion industry. According to official statistics from different countries, the market value of the global apparel market is worth over USD 3 trillion. Although artificial intelligence (AI) technology has been evolving along with the fashion industry, there are still different challenges in different areas that need to be addressed.

    To promote the development of the fashion industry, the Vision & Beauty Team of the Alibaba Group and the Institute of Textile and Clothing of The Hong Kong Polytechnic University are pleased to jointly launch a revolutionary dataset which integrates both professional fashion knowledge and machine learning formulation.

    This challenge is focusing on one part of the dataset: attributes recognition of apparel. Apparel attributes are the basic knowledge of fashion field, which are large and complex. We constructed a hierarchical attributes tree as a structured classification target, to describe the cognitive process of apparel. Contestants are invited to design algorithms to recognize attributes of apparel images. This task might be widely applied for apparel image searching, navigating tagging, mix-and-match recommendation, etc.

  • MTWI 2018 挑战赛一:网络图像的文本

    在互联网世界中,图片是传递信息的重要媒介。特别是电子商务,社交,搜索等领域,每天都有数以亿兆级别的图像在流动传播。图片中的文字识别(OCR)在商业领域有重要的应用价值,同时也是学术界单研究热点。然而,研究领域尚没有基于网络图片的、以中文为主的OCR数据集。本竞赛将公开基于网络图片的中英数据集,该数据集数据量充分,涵盖数十种字体,几个到几百像素字号,多种版式,较多干扰背景。期待学术界可以在本数据集上作深入的研究,工业界可以藉此发展在图片管控,搜索,信息录入等AI领域的工作。
  • MTWI 2018 挑战赛三:网络图像的端到端

    在互联网世界中,图片是传递信息的重要媒介。特别是电子商务,社交,搜索等领域,每天都有数以亿兆级别的图像在流动传播。图片中的文字识别(OCR)在商业领域有重要的应用价值,同时也是学术界单研究热点。然而,研究领域尚没有基于网络图片的、以中文为主的OCR数据集。本竞赛将公开基于网络图片的中英数据集,该数据集数据量充分,涵盖数十种字体,几个到几百像素字号,多种版式,较多干扰背景。期待学术界可以在本数据集上作深入的研究,工业界可以藉此发展在图片管控,搜索,信息录入等AI领域的工作。
  • MTWI 2018 挑战赛二:网络图像的文本检测

    在互联网世界中,图片是传递信息的重要媒介。特别是电子商务,社交,搜索等领域,每天都有数以亿兆级别的图像在流动传播。图片中的文字识别(OCR)在商业领域有重要的应用价值,同时也是学术界单研究热点。然而,研究领域尚没有基于网络图片的、以中文为主的OCR数据集。本竞赛将公开基于网络图片的中英数据集,该数据集数据量充分,涵盖数十种字体,几个到几百像素字号,多种版式,较多干扰背景。期待学术界可以在本数据集上作深入的研究,工业界可以藉此发展在图片管控,搜索,信息录入等AI领域的工作。
  • 天池新人实战赛o2o优惠券使用预测

    天池新人实战赛是针对数据新人开设的实战练习专场,以经典赛题作为学习场景,提供详尽入门教程,手把手教你学习数据挖掘。天池希望新人赛能成为高校备受热捧的数据实战课程,帮助更多学生掌握数据技能。
  • 天猫复购预测之挑战Baseline

    商家有时会在特定的日期(如节礼日甩卖、"黑色星期五 "或 "双十一(11月11日)")开展大型促销活动(如折扣或现金券),以吸引大量新买家。但是,很多被吸引来的买家都是一次性的,他们在这次消费之后就再也没有购买,针对这些用户的促销活动并没有给店铺带来未来销售的增加。为了缓解这个问题,商家必须确定哪些人可以转化为重复购买者。通过对这些潜在的忠诚客户进行精细化营销,商家可以大大降低促销成本,提高投资回报率(ROI)。众所周知,在网络广告的领域,用户精准定位具有极大的挑战性,尤其是对于新买家。不过,借助天猫长期积累的用户行为日志,我们或许可以解决这个问题。在本次挑战中,我们提供了一组商家以及他们在 "双11 "促销活动中获得的新买家。你的任务是在给定商家中预测其中哪些新买家会在未来成为忠实客户。换句话说,你需要预测这些新买家在未来六个月内再次在同一个商家购买商品的概率。我们给出一个包含约20万用户的数据集进行训练,另一个规模相近的数据集进行测试。与其他比赛类似,你可以提取任何特征,然后用其他工具进行训练。你只需要提交预测结果进行评估。
  • 淘宝穿衣搭配-挑战Baseline

    淘宝网是中国深受欢迎的网购零售平台,其中服饰鞋包行业占据市场的绝大部分份额,围绕着淘宝诞生了一大批优秀的服饰鞋包导购类的产品。穿衣搭配是服饰鞋包导购中非常重要的课题,它所延伸出的技术、算法能广泛应用到大数据营销几乎所有场景中,如搜索、推荐和营销服务。淘宝穿衣搭配算法竞赛将为参赛者提供搭配专家和达人生成的搭配组合数据,百万级别的淘宝商品的文本和图像数据,同时还将提供用户的脱敏行为数据。期待参赛者能从以上行为、文本和图像数据中挖掘穿衣搭配模型,为用户提供个性化、优质的、专业的穿衣搭配方案。
  • 新浪微博互动预测-挑战Baseline

    新浪微博作为中国最大的社交媒体平台,旨在帮助用户发布的公开内容提供快速传播互动的通道,提升内容和用户的影响力。本次赛题的目标是发现能够最快找到有价值微博的方法,然后应用于平台的内容分发控制策略,对于有价值的内容可以增加曝光量,提高内容的传播互动量。
  • 资金流入流出预测-挑战Baseline

    蚂蚁金服拥有上亿会员并且业务场景中每天都涉及大量的资金流入和流出,面对如此庞大的用户群,资金管理压力会非常大。在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金的流入流出情况变得尤为重要。此届大赛以《资金流入流出预测》为题,期望参赛者能够通过对例如余额宝用户的申购赎回数据的把握,精准预测未来每日的资金流入流出情况。对货币基金而言,资金流入意味着申购行为,资金流出为赎回行为 。
    页次:19/30 每页20 总数593    首页  上一页  下一页  尾页    转到: