2019年4月11日,由来自中国科学院计算技术研究所、英国帝国理工大学、英国牛津大学、三星美国研究院的研究人员,联合申办的普通话音视频语音识别竞赛正式启动。该竞赛面向对模式识别、计算机视觉、图像序列处理、语音识别,尤其是视觉语音识别等感兴趣的所有研究人员和学生等。
该竞赛的主题是音视频结合的语音识别与检索,旨在借助当下蓬勃发展的计算机视觉技术,探讨视觉信息对语音识别的帮助作用,促进音视频结合的相关研究。该竞赛主要包含3个主题:(1) 闭集的词级单视觉/音视结合的语音识别;(2) 开集的词级单视觉/音视语音结合;(3) 基于视觉信息的关键词检索。对于三个主题任务的冠亚军,将有相应奖金。
除了以上3个主题任务外,我们也同时接收不参与竞赛任务但与该主题相关的论文。经过双盲评审后接收的所有论文(含参与或不参与竞赛任务的所有接收论文),将会收录进ACM ICMI的论文集。投稿范围包含但不限于:
该竞赛的任务提交日期与论文提交日期如下:
竞赛组委会:
竞赛任务与论文投稿详情,请移步:http://vipl.ict.ac.cn/homepage/mavsr/index.html,也可扫描下方二维码访问竞赛与相关数据库LRW1000。
若您有任何问题,欢迎联系 lipreading@vipl.ict.ac.cn 。
附件: