千言数据集:视频语义理解评测
大赛名称 千言数据集:视频语义理解评测
详情链接 https://aistudio.baidu.com/aistudio/competition/detail/434/0/introduction
大赛简介

在移动互联网、大数据的时代背景下,互联网上的视频数据呈现爆发式增长,作为日益丰富的信息承载媒介,视频的深度语义理解是诸多视频智能应用的基础,具有重要的研究意义和实际应用价值。传统基于感知的视频内容分析缺乏语义化理解能力,而充分利用知识图谱的语义化知识并结合多模态学习和知识推理技术,有望实现更深入的视频语义理解。
Semantic video understanding technology plays an integral role in quite a few of the most well-known mobile applications. In the past years, various perception-based video understanding methods are proven to be inadequate in cases where semantic knowledge or multi-modal information are essential cues for understanding.

知识增强的视频语义理解任务,期望融合知识、NLP、视觉、语音等相关技术和多模态信息,为视频生成刻画主旨信息的语义标签,从而实现视频的语义理解。本评测任务以互联网视频为输入,在感知内容分析(如人脸识别、OCR识别、语音识别等)的基础上,期望通过融合多模信息,并结合知识图谱计算与推理,为视频生成多知识维度的语义标签,进而更好地刻画视频的语义信息。
Knowledge-enhanced video understanding technology addresses this issue by introducing multi-modal learning and knowledge reasoning techniques. In this competition, you’re challenged to develop classification algorithms, as well as video tagging algorithms, which accurately assign video-level labels using the provided datasets and knowledge resources. To focus on the scope, perception information of the videos, including face recognition results, OCR results, ASR results, and visual feature vectors are provided alongside.

举办方 百度
参赛方式

(1)公平竞技: 参赛者禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现将取消比赛成绩并严肃处理;
(2)组织声明: 组委会保留对比赛规则、赛事安排进行调整和修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团队奖项的权利;
(3)基线模型: 基线模型供参赛选手参考,可以选择在其基础上改进。参赛选手不能直接提交基线模型结果;如果提交文件与基线模型结果高度相似,则将取消比赛成绩;
(4)作品产权: 参赛作品(包含但不限于算法、模型等)知识产权归参赛选手所有,组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目,大赛组织单位享有优先合作权利。

注:信息来源于赛事平台,侵删