• 兴智杯 全国人工智能创新应用大赛:百度飞桨论文复现赛

    为进一步激发创新活力,促进人工智能核心技术突破和产业生态建设,推动人工智能与实体经济深度融合,工业和信息部、科学技术部、深圳市人民政府于2022年8-12月共同主办首届“兴智杯”全国人工智能创新应用大赛。

    当前,以深度学习为代表的人工智能技术快速迭代创新,世界各大顶级学术会议上的创新算法不断涌现。推动前沿创新模型在产业级深度学习平台复现,对于加快智能算法工程化发展,推动学术创新成果规模化落地应用具有重要意义。

    基于国产深度学习框架飞桨的前沿模型复现赛,旨在通过比赛机制,鼓励选手使用国产飞桨深度学习平台实现高水平论文算法,产出高质量的模型代码,支撑学术研究成果向工程化应用落地,推动国产深度学习框架应用与开源生态人才培养。

  • 新型电力系统人工智能应用大赛赛题二:电力生产知识图谱多模式信息抽取

    随着新型电力系统建设的逐步深入,电力生产信息规模显著增大、种类更加复杂,依靠人工处理对知识储备、处置经验和反应速度要求越来越高,对业务人员提出巨大挑战。为促进电力生产信息的高效处理,亟需引入人工智能技术,总结各类系统和文件中的典型知识模式,将混杂在非结构化内容中的知识进行结构化,推动构建电力生产知识图谱,支撑建设基于结构化知识的智能应用。

  • 员工离职预测训练赛

    任务描述 我们希望学完《数据分析师(入门)》的学员,可以根据课上老师所讲授的知识和逻辑回归的方法,从给定的影响员工离职的因素和员工是否离职的记录,建立一个逻辑回归模型预测有可能离职的员工。 难易程度 较简单。适合学完逻辑回归课程的学员。
  • 美国King County房价预测训练赛

    我们希望学完《数据分析师(入门)》的学员,可以根据课上老师所讲授的知识和回归分析的方法,从给定的房屋基本信息以及房屋销售信息等,建立一个回归模型预测房屋的销售价格。
  • 飞桨学习赛:螺旋桨RNA结构预测竞赛

    飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台。更多飞桨资讯,点击此处查看。

    飞桨学习赛由百度飞桨于 2019 年发起,面向全球 AI 开发者,赛题范围广,涵盖领域多。学习赛旨在通过长期发布的经典比赛项目,为开发者提供学习锻炼机会,助力大家在飞桨大赛中获得骄人成绩。

    参赛选手需使用飞桨框架,基于特定赛题下的真实行业数据完成并提交任务。学习赛采取月度评比方式,为打破历史最高记录选手和当月有资格参与月度评奖的前 10 名选手提供飞桨特别礼包奖励。更多惊喜,更多收获,尽在飞桨学习赛。

  • 2022世界人工智能大会黑客马拉松:百度飞桨论文复现赛

    2022世界人工智能大会(WAIC 2022)将于2022年9月1-3日在上海举办。大会由国家发展和改革委员会、科学技术部、工业和信息化部、国家互联网信息办公室、中国科学院、中国工程院、中国科学技术协会和上海市人民政府共同主办。本届大会将通过“会展赛用”四大板块、围绕“人类、科技、产业、城市、未来”五大元素,以“元宇宙”为切入点,深度演绎“智联世界”这个主题。

    赛事评奖是WAIC “会、展、赛、用”四大板块之一,由世界人工智能大会组委会主办,上海市人工智能行业协会作为唯一组织、服务、支撑和管理单位。

    WAIC 2022现有品牌赛事包括:黑客马拉松、BPAA应用算法实践典范、AIWIN世界人工智能创新大赛和团市委青少年人工智能创新大赛。根据世界人工智能大会SAIL奖的推荐规则和资格要求,品牌赛事承办方将有机会推荐本赛事中的优秀项目参与SAIL奖评选。

    飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,2016年正式开源,是中国首个也是全面开源开放、技术领先、功能完备的产业级深度学习平台。2020年正式发布飞桨框架2.0版本,全面升级了动态图的相关功能并带来了更加成熟完备的API。更多飞桨资讯,点击 此处 查看。

    一、赛程赛制

    本次论文复现挑战赛以线上比赛的形式进行,参赛选手在规定时间内使用飞桨框架动态图最新版本复现模型, 共计10道赛题,最先达到 指定精度 的选手通过验收为本道赛题的冠军,可获得高额奖金。10位冠军所提交的Repo会接受来自飞桨专家和社区开发者的评审,根据Repo的完善度、文档的标准性等标准筛选出六位选手进入决赛。

  • 2022信创“大比武” -- 新型电力系统人工智能应用大赛:应用竞赛单元

    实现“双碳”目标,是以习近平同志为核心的党中央统筹国内国际两个大局作出的重大战略决策。日前,国务院印发《2030年前碳达峰行动方案》,提出要“构建新能源占比逐渐提高的新型电力系统”。为适应新发展要求,亟需开展信息技术应用创新,推动数字与能源技术融合提发展,适应大规模高比例并网、消纳和分布式能源、储能等设施广泛接入,保证电力企业经营管理过程的实时感知、可视可控、精益高效,满足用电客户日益多元化、个性化和互动化的需求。目前,各电力企业正逐步加大人工智能技术应用力度,在发、输、变、配、用等环节广泛部署智能识别、决策和交互应用,有效提升了业务质量、管理效率和客户满意度。
  • 新型电力系统人工智能应用大赛赛题一:基于强化学习技术的源网荷储实时协同调度

    随着新能源、储能以及海量柔性负荷不断接入,电力系统的技术基础、控制基础和运行机理发生深刻变化,电网平衡模式由源随荷动的实时平衡逐步向源网荷储协调互动的非完全实时平衡转变,给调控运行带来极大挑战,源网荷储协同调度已成为必然趋势。基于传统的机理建模及分析方法难以满足新能源、柔性负荷等大规模接入后调控需求,基于强化学习的调度决策训练可为应对电网不确定性运行风险提供解决问题新思路。
  • 2022信创“大比武”——新型电力系统人工智能应用大赛

    为加快推动能源电力数字化转型,有效整合电力行业技术研究和应用研发资源,努力构建电力信息技术创新生态,稳步助推电力信创产业高质量发展,在北京航空航天大学、北京理工大学、中国电子工业标准化技术协会信息技术应用创新工作委员会的指导下,由中国电力企业联合会牵头,会同国家电网、南方电网及五大发电集团等,依托信创平台,开辟首个以“电力系统与人工智能相结合”为主题的活动方向,即“新型电力系统人工智能应用”。活动以电力行业人工智能技术突破和应用创新为重点课题,面向企业和开发者,通过举办高质量的技术与应用交流活动,助推能源电力数字生态快速演进。
  • 千言数据集:阅读理解可解释性评测(英文)

    This task is to evaluate both the performance on predicted answers and interpretability of the machine reading comprehension models. Given a passage and a corresponding question, the model needs to provide the predicted answer and the rationale that supports the current prediction. The model F1-score is evaluated on predicted answers, and the performance of interpretability is evaluated on provided rationales. This task provides a fine-grained evaluation dataset with human-annotated rationales and perturbed examples, which can be used to evaluate interpretability from multiple perspectives. Please see the paper “A Fine-grained Interpretability Evaluation Benchmark for Neural NLP“ for the details of dataset construction. Besides, an example from this dataset is shown in “dataset” section, and the metrics are introduced in “metrics” section. We hope this dataset can facilitate the research progress of interpretability.
  • 千言数据集:情感分析可解释性评测(英文)

    This task is to evaluate both the prediction accuracy and interpretability of the sentiment analysis models. Given a text, the model needs to provide the predicted sentiment label and the rationale that supports the current prediction. The model accuracy is evaluated on predicted labels, and the performance of interpretability is evaluated on provided rationales.
    This task provides a fine-grained evaluation dataset with human-annotated rationales and perturbed examples, which can be used to evaluate interpretability from multiple perspectives. Please see the paper “A Fine-grained Interpretability Evaluation Benchmark for Neural NLP“ for the details of dataset construction. Besides, an example from this dataset is shown in “dataset” section, and the metrics are introduced in “metrics” section. We hope this dataset can facilitate the research progress of interpretability.
  • 千言数据集:视频语义理解评测

    在移动互联网、大数据的时代背景下,互联网上的视频数据呈现爆发式增长,作为日益丰富的信息承载媒介,视频的深度语义理解是诸多视频智能应用的基础,具有重要的研究意义和实际应用价值。传统基于感知的视频内容分析缺乏语义化理解能力,而充分利用知识图谱的语义化知识并结合多模态学习和知识推理技术,有望实现更深入的视频语义理解。
    Semantic video understanding technology plays an integral role in quite a few of the most well-known mobile applications. In the past years, various perception-based video understanding methods are proven to be inadequate in cases where semantic knowledge or multi-modal information are essential cues for understanding.

    知识增强的视频语义理解任务,期望融合知识、NLP、视觉、语音等相关技术和多模态信息,为视频生成刻画主旨信息的语义标签,从而实现视频的语义理解。本评测任务以互联网视频为输入,在感知内容分析(如人脸识别、OCR识别、语音识别等)的基础上,期望通过融合多模信息,并结合知识图谱计算与推理,为视频生成多知识维度的语义标签,进而更好地刻画视频的语义信息。
    Knowledge-enhanced video understanding technology addresses this issue by introducing multi-modal learning and knowledge reasoning techniques. In this competition, you’re challenged to develop classification algorithms, as well as video tagging algorithms, which accurately assign video-level labels using the provided datasets and knowledge resources. To focus on the scope, perception information of the videos, including face recognition results, OCR results, ASR results, and visual feature vectors are provided alongside.

  • 千言数据集:知识对话评测

    知识对话是指对话系统利用外部知识信息,使聊天内容更加丰富、准确,这对提升用户体验是非常重要的,近年来受到学术界和工业界的广泛关注。
    Knowledge grounded dialogue means that the dialogue system uses external knowledge information to make the conversation more engaging and factually correct. This is very important for improving user engagement and has gained a lot of attention from both academia and industry in recent years.

    为了解决静态知识的丰富性、时效性和个性化问题,我们提出了一个全新的知识对话任务——搜索信息增强的对话(SINC)。对话系统在对话的过程中动态地搜索外部知识信息,并将搜索知识用于回复生成中。为此我们建设了外部知识搜索API,可以根据给定query和用户地理位置实时搜索各类通用知识、动态知识和个性化知识,同时我们利用这个API人工建设了用于该任务研究的对话数据集DuSinc。
    To address the lack of richness, timeliness, and personalization of static knowledge, we propose a novel knowledge grounded dialogue task called Search INformation augmented Conversation (SINC). The dialogue system dynamically searches for external knowledge information in the process of conversation and uses the searched knowledge in response generation. To this end, we have built an external knowledge search API, which can search various general knowledge, dynamic knowledge, and personalized knowledge in real-time according to the given query and user geographic location. At the same time, we use this API to manually build a dialogue dataset named DuSinc for this task research.

    本次竞赛中,我们主要从以下两个子任务评测系统的知识对话能力:1)Query生成任务:给定多轮对话历史,生成用于查询搜索引擎的Query;2)回复生成任务:给定文本知识与多轮对话历史,生成合适的对话回复。
    In this challenge, we mainly evaluate the knowledge grounded dialogue ability of the system from the following two subtasks: 1) Query Generation Task: given dialogue history, generate a query for querying the search engine; 2) Response Generation Task: given text knowledge and dialogue history to generate appropriate dialogue responses.

  • 千言数据集:段落检索评测

    段落检索(passage retrieval)是指从大规模语料库中找出和用户查询最相关段落的过程。段落检索作为许多自然语言处理任务中的关键组件,是自然语言处理和人工智能领域的重要前沿课题,近年来受到了学术界和工业界的广泛关注。
    Passage retrieval is the process of obtaining the most relevant passages to the user query from a large-scale text corpus. As a key component in many natural language processing tasks, passage retrieval is an important cutting-edge topic in the fields of natural language processing and artificial intelligence, which has received wide attention from both academia and industry.

    近年来,得益于带有高质量人工标注的大规模段落检索数据集的出现,基于稠密向量的表示学习方法在段落检索领域取得了重大进展。 然而,由于缺乏相应的大规模中文检索数据集,在中文场景下应用稠密检索模型的相关研究受到了极大的限制。为了推动中文段落检索技术的发展,我们利用真实场景下的用户搜索日志,建立了首个大规模高质量中文段落检索数据集:DuReader_retrieval,并采用多路集成召回标注及训练、测试集语义去重等策略,提升了开发集和测试集的标注质量,保证评估的效果。DuReader_retrieval中的样本均来自于实际的应用场景,考察点丰富多样,覆盖了真实应用场景下诸多难以解决的问题。
    In recent years, dense representation learning has made significant progress in the field of passage retrieval due to the advent of the large-scale dataset with high-quality human annotations. However, due to the lack of corresponding Chinese large-scale datasets, relevant studies on applying dense retrieval models in the Chinese context are restricted. In order to remove this barrier, based on the logs submitted by real users to Baidu Search, we build the first large-scale Chinese passage retrieval dataset: DuReader_retrieval, and improve its quality by ensemble retrieval with human annotation, removing the semantically similar questions, etc. The data in DuReader_retrieval all come from actual application scenarios, which have various evaluation points, covering many challenges in real applications.

    本次评测首次开放了全球首个来源于搜索引擎真实应用场景的高质量中文段落检索数据集DuReader_retrieval,旨在为研究者和开发者提供学术和技术交流的平台, 进一步提升机器中文段落检索的研究水平,推动自然语言处理和人工智能领域技术和应用的发展。本次竞赛将在第七届“语言与智能高峰论坛”举办技术交流论坛和颁奖仪式。 诚邀学术界和工业界的研究者和开发者参加本次竞赛!
    This shared task firstly provides the world’s first high-quality Chinese information retrieval dataset for real application scenarios of search engines: DuReader_retrieval. It aims to provide a platform to improve the SoTA of Chinese information retrieval for researchers and developers. This shared task will hold the workshop and award ceremony in the seventh “Language and Intelligence Summit Forum”. We sincerely invite researchers and developers from academia and industry to participate in this competition!

  • 飞桨论文复现挑战赛(第七期)

    飞桨论文复现挑战赛全新上线,通过比赛机制,鼓励选手使用国产框架复现顶会论文,助力更多科研成果落地,为中国开源生态建设贡献力量。
    本次论文复现挑战赛以线上比赛的形式进行,参赛选手在规定时间内使用飞桨框架动态图最新版本复现模型,最先达到 指定精度 的选手通过验收可获得高额奖金。
    飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,2016年正式开源,是中国首个也是全面开源开放、技术领先、功能完备的产业级深度学习平台。2020年正式发布飞桨框架2.0版本,全面升级了动态图的相关功能并带来了更加成熟完备的API。更多飞桨资讯,点击 此处 查看。

    本次活动,共分为飞桨论文复现挑战赛与飞桨特色模型挑战赛两部分。赛题释放将分为两个阶段,每阶段放出50道题目。

  • 开放数据价值提升方案(数智赋能赛道)

    参赛队伍可综合利用四川公共数据开放网提供的全部内容及参赛单位自有公共数据,重点围绕“开放高价值数据、开放高质量数据、创新开放数据应用、开放数据风险识别”等课题,基于四川省公共数据开放现状,在充分结合国内外公共数据开放发展趋势的基础上,提出包含数据安全策略在内的数据开放全生命周期的解决方案(如:开放数据价值评估模型、开放数据质量评估模型、创新应用场景设计、开放数据风险识别模型等)。
    其中,高价值数据指应用价值高、需求量大的数据;高质量数据指准确可靠、可用性高的数据;开放数据应用指基于开放的公共数据产生的社会应用;数据风险识别指识别数据泄露、非法篡改、不当利用等潜在风险。

     

  • 2022扬州大数据开发应用创新大赛——案例类赛道

    2022年4月19日,习近平总书记主持召开中央全面深化改革委员会第二十五次会议,审议通过了《关于加强数字政府建设的指导意见》。会议强调,要全面贯彻网络强国战略,把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行,为推进国家治理体系和治理能力现代化提供有力支撑。《江苏省“十四五”数字政府建设规划》提出“开展数字再造,推进数字治理系统变革和整体重塑,打造‘数字化、智能化、一体化’现代一流数字政府”。2022年2月,扬州市委市政府召开优化提升营商环境大会,提出“围绕‘让数据多跑路’,深入推进政务服务‘一张网’建设,使更多事项能够‘一键上网’‘一网通办’”。同时,扬州市政府印发了《关于加快推进制造业智能化改造和数字化转型的实施意见》,要求培育数字生态体系,夯实智能制造基础支撑。
  • 2022扬州大数据开发应用创新大赛——案例类赛道

    2022年4月19日,习近平总书记主持召开中央全面深化改革委员会第二十五次会议,审议通过了《关于加强数字政府建设的指导意见》。会议强调,要全面贯彻网络强国战略,把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行,为推进国家治理体系和治理能力现代化提供有力支撑。《江苏省“十四五”数字政府建设规划》提出“开展数字再造,推进数字治理系统变革和整体重塑,打造‘数字化、智能化、一体化’现代一流数字政府”。2022年2月,扬州市委市政府召开优化提升营商环境大会,提出“围绕‘让数据多跑路’,深入推进政务服务‘一张网’建设,使更多事项能够‘一键上网’‘一网通办’”。同时,扬州市政府印发了《关于加快推进制造业智能化改造和数字化转型的实施意见》,要求培育数字生态体系,夯实智能制造基础支撑。
  • 2022扬州大数据开发应用创新大赛——创意类赛道

    2022年4月19日,习近平总书记主持召开中央全面深化改革委员会第二十五次会议,审议通过了《关于加强数字政府建设的指导意见》。会议强调,要全面贯彻网络强国战略,把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行,为推进国家治理体系和治理能力现代化提供有力支撑。《江苏省“十四五”数字政府建设规划》提出“开展数字再造,推进数字治理系统变革和整体重塑,打造‘数字化、智能化、一体化’现代一流数字政府”。2022年2月,扬州市委市政府召开优化提升营商环境大会,提出“围绕‘让数据多跑路’,深入推进政务服务‘一张网’建设,使更多事项能够‘一键上网’‘一网通办’”。同时,扬州市政府印发了《关于加快推进制造业智能化改造和数字化转型的实施意见》,要求培育数字生态体系,夯实智能制造基础支撑。
  • 支气管肺泡灌洗液细胞分类计数挑战赛

    支气管镜检查是呼吸系统疾病的重要检查方法,通过回收支气管肺泡灌洗液并进行细胞分类计数,能够提示呼吸疾病的性质,有助于明确诊断。传统的细胞分类计数均以人工进行,工作效率较低,也因技术人员的经验差异存在一定程度的错误。为了能够提高细胞分类计数的工作效率,并减少因经验差异而造成的识别错误,需要利用目标检测等人工智能技术对支气管肺泡灌洗液中的细胞进行分类和计数。

    支气管肺泡灌洗液的细胞通常被分为四类:巨噬细胞、淋巴细胞、中性粒细胞和嗜酸性粒细胞。有核细胞数(90~260)×106/L,肺泡巨噬细胞85%~96%,淋巴细胞6%~15%,中性粒细胞≤3%,嗜酸性粒细胞<1%。

    上述细胞具有如下特征:巨噬细胞为圆形或椭圆形。细胞浆丰富,可充满吞噬小泡呈泡沫样;细胞核较大,多数为单个核,少数呈多核,可有分裂相,染色较浅,核仁显著。淋巴细胞尺寸不一,分为小淋巴细胞和大淋巴细胞。小淋巴细胞直径为6~9μm,呈圆形或类圆形。细胞浆极少,近似裸核,常呈淡蓝色或深蓝色,常无颗粒。细胞核呈类圆形或圆形,染色质聚集呈大块状,无核仁。大淋巴细胞直径为12~15μm,呈圆形或类圆形。细胞浆稍多,呈透明的淡蓝色,常有少许嗜天青颗粒。细胞核椭圆形,常偏一侧,可有单侧切迹。核染色质紧密而均匀,无核仁。中性粒细胞尺寸介于淋巴细胞和巨噬细胞之间,细胞浆较丰富,呈无色或极浅的淡红色,有许多弥散分布的细小颗粒,呈浅红或浅紫色。细胞核呈杆状或2~5分叶状,叶与叶间有细丝相连。嗜酸性粒细胞细胞直径10-15μm,细胞浆近似中性粒细胞,其中含有较粗糙的嗜酸性颗粒,分布不均,呈橘红色。细胞核分叶,或呈S形或不规则形,着色较浅。

    页次:9/30 每页20 总数593    首页  上一页  下一页  尾页    转到: