海洋是多变的,水声信道的复杂性,给水声通信带来了诸多挑战。一般来讲,水声信道具有多途、频散、环境噪声高、信道带宽窄、多普勒频移大等特点、特别是海洋中存在各种时间和空间尺度的海洋动力过程,引起了水体的非均匀性,加之海面的随机波动性和海底地形底质的复杂性等因素,对水中声波的传递造成了极大影响,使得水声通信信道具有显著的空间差异和时间起伏,严重影响了水声通信的检测解码性能,给实现稳健通信造成了很大难度。
2022年全国水下机器人大赛水声通信线上赛针对水声通信具体技术难点,主要考察水声通信相关算法的可用性和稳健性。
面向国内及海外各院校和科研机构、科技企业,以水下机器人的目标检测算法为重点,着重考察选手的实践能力和创新能力。本次比赛将深化和拓宽水下机器人和水下目标检测领域的相关研究,推进技术向应用赋能。
海洋是多变的,水声信道的复杂性,给水声通信带来了诸多挑战。一般来讲,水声信道具有多途、频散、环境噪声高、信道带宽窄、多普勒频移大等特点、特别是海洋中存在各种时间和空间尺度的海洋动力过程,引起了水体的非均匀性,加之海面的随机波动性和海底地形底质的复杂性等因素,对水中声波的传递造成了极大影响,使得水声通信信道具有显著的空间差异和时间起伏,严重影响了水声通信的检测解码性能,给实现稳健通信造成了很大难度。
2022年全国水下机器人大赛水声通信线上赛针对水声通信具体技术难点,主要考察水声通信相关算法的可用性和稳健性。
百度网盘AI大赛——图像处理挑战赛是百度网盘开放平台面向开发者发起的图像处理挑战赛事,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下的前沿图像处理与计算机视觉技术,设计合适模型,并提升模型的效果,助力互联网用户更便捷地进行数字生活、学习和工作,为中国开源生态建设贡献力量。本次图像处理挑战赛以线上比赛的形式进行,参赛选手在规定时间内提交基于评测数据集产出的结果文件,榜单排名靠前并通过代码复查的队伍可获得高额奖金。百度网盘开放平台致力于为全球AI开发者和爱好者提供专业、高效的AI学习和开发环境,挖掘培养AI人才,助力技术产业生态发展。
此次大赛主题结合日常生活常见情景展开,当使用移动设备扫描获取文档的过程中,很多是文字、字母和数字等符号内容。通过拍摄截取等方式获取文档,就非常有可能导致内容模糊、噪音叠加等问题的发生,使得无法实际发挥作用。期望同学们通过计算机技术,帮助人们将模糊失焦的文档恢复清晰,提高使用便捷度和效率。
随着经济全球化发展和“一带一路”国家倡议的提出,跨境的国际合作和交流日益频繁,越来越多的中国企业正走向世界参与世界经济发展和管理,对多语种语音技术提出大量多样化的需求。
“多语种语音识别挑战赛”旨在加强多语种识别研究的交流、促进技术的发展。大赛在过去几年,已成功举办包括方言挑战赛,多语种分类挑战赛、连续多语种分类挑战赛等,从多实用、高效的语音识别、语种分类技术在竞赛中得到打磨。
本届竞赛聚焦我国“一带一路”战略实施中语言大互通需求,攻克数据和专家资源稀缺的多语种语音语言关键技术,支撑包括斯瓦西里语、越南语、波斯语这3个语种的语音识别任务,期待业内同仁们能在这些任务上相互切磋、共同进步。
机器翻译质量评估(QE)指在没有人工翻译参考下对机器翻译系统译文进行自动打分。一方面,QE技术可以协助人工校正机器翻译后编辑(PE)过程,通过QE评分指示机器翻译结果是否值得译后编辑;另一方面,QE技术可以用来改善机器翻译系统,通过QE技术挖掘机器翻译系统存在的死点问题,从而进行数据清洗,迭代优化机器翻译模型质量。
当前基于神经网络模型的QE技术受到学术界关注,但是工业级QE技术应用尚不成熟,由于人工评分数据稀疏、评分主观性较大、数据多样性差等问题,QE技术还需要研究和优化。
随着Siri、Alexa 和 Cortana等语音应用的出现,语音识别系统已经被广泛用于会议、车载等实际生活环境中,极大地便利了人们的生活。但在复杂声场环境(例如,家庭和会议),背景噪音、混响、远场、语音重叠等干扰因素严重的影响了单音频语音识别系统的识别性能。例如,在CHiME-6餐厅挑战赛中,最出色的单模态语音识别系统词错误率高达40%。 受此启发,MISP2021 挑战通过引入额外的模态信息(如视频或文本),来进一步提升语音识别系统在声场下的识别性能和鲁棒性。
讯飞AI语音唤醒技术基于深耕多年的人工智能和大数据技术,通过智能设备的麦克风阵列对输入的语音信号进行分析和处理,实现对智能设备的唤醒,赋予设备自动感知的能力,可以解放用户的双手,带给用户更加便利、更加舒适和更加智能的人机体验。
尽管语音唤醒技术已经取得很大的进步,但复杂声学环境(例如远场、混响和背景噪声)应用场景下的单语音系统仍具有挑战性,尤其对于智能家居和会议场景,有时已经严重影响到用户对产品的使用质量。通过引入面部和嘴唇运动等视觉线索来补充目标说话人的声学信息已经被证明是有效的,尤其是在嘈杂的环境中。如何通过引入视频模态到音频唤醒并进行有效融合,以降低错误唤醒和错误拒绝唤醒的比率,提高用户的产品使用质量,为唤醒领域亟待突破的关键问题。
随着经济全球化发展和“一带一路”国家倡议的提出,跨境的国际合作和交流日益频繁,越来越多的中国企业正走向世界参与世界经济发展和管理,对多语种语音技术提出大量多样化的需求。
“多语种语音识别挑战赛”旨在加强多语种识别研究的交流、促进技术的发展。大赛在过去几年,已成功举办包括方言挑战赛,多语种分类挑战赛、连续多语种分类挑战赛等,从多实用、高效的语音识别、语种分类技术在竞赛中得到打磨。
本届竞赛聚焦我国“一带一路”战略实施中语言大互通需求,攻克数据和专家资源稀缺的多语种语音语言关键技术,支撑包括斯瓦西里语、越南语、波斯语这3个语种的语音识别任务,期待业内同仁们能在这些任务上相互切磋、共同进步。
随着经济全球化发展和“一带一路”国家倡议的提出,跨境的国际合作和交流日益频繁,越来越多的中国企业正走向世界参与世界经济发展和管理,对多语种语音技术提出大量多样化的需求。
“多语种语音识别挑战赛”旨在加强多语种识别研究的交流、促进技术的发展。大赛在过去几年,已成功举办包括方言挑战赛,多语种分类挑战赛、连续多语种分类挑战赛等,从多实用、高效的语音识别、语种分类技术在竞赛中得到打磨。
本届竞赛聚焦我国“一带一路”战略实施中语言大互通需求,攻克数据和专家资源稀缺的多语种语音语言关键技术,支撑包括斯瓦西里语、越南语、波斯语这3个语种的语音识别任务,期待业内同仁们能在这些任务上相互切磋、共同进步。
此次大赛,将在遥感光学影像上对18个类别进行检测。在精度达到一定标准的情况下,将优先考查模型运行效率。在决赛算法提交阶段,模型大小和模型优化也将纳入考查范围。
对于预训练模型和数据,大赛只允许:
(1)使用开源模型,需提供开源模型来源
(2)选手可利用开源数据集进行模型训练。
(3)通过监督/自监督/无监督方法对比赛训练集、公开数据集(已发表论文,arXiv除外)训练得到的模型作为预训练模型,要求预训练模型可复现。