大赛名称 | 基于多模态信息的音视频语音唤醒挑战赛 |
---|---|
详情链接 | https://challenge.datacastle.cn/v3/cmptDetail.html?id=709 |
大赛简介 | 讯飞AI语音唤醒技术基于深耕多年的人工智能和大数据技术,通过智能设备的麦克风阵列对输入的语音信号进行分析和处理,实现对智能设备的唤醒,赋予设备自动感知的能力,可以解放用户的双手,带给用户更加便利、更加舒适和更加智能的人机体验。 尽管语音唤醒技术已经取得很大的进步,但复杂声学环境(例如远场、混响和背景噪声)应用场景下的单语音系统仍具有挑战性,尤其对于智能家居和会议场景,有时已经严重影响到用户对产品的使用质量。通过引入面部和嘴唇运动等视觉线索来补充目标说话人的声学信息已经被证明是有效的,尤其是在嘈杂的环境中。如何通过引入视频模态到音频唤醒并进行有效融合,以降低错误唤醒和错误拒绝唤醒的比率,提高用户的产品使用质量,为唤醒领域亟待突破的关键问题。 |
举办方 | 中国科学技术大学 |
参赛方式 | 1、报名参赛:选手选择竞赛,点击“报名参赛”完成注册或者登录即可报名成功。选手可以单人建队参赛,也可以与他人组队参赛。 2、提交结果:报名后选手“下载数据”,按照比赛要求进行数据处理,根据要求“提交结果”并获得分数。 3、赛后获奖:比赛结束后官方工作人员会在竞赛圈公布获奖队伍名单,并联系获奖选手。 比赛过程中请仔细阅读赛程安排、参赛规则、赛题数据说明等竞赛信息,如有疑问请联系竞赛工作人员。 |
注:信息来源于赛事平台,侵删 |