基于长短时预测一致性的大规模视频语义识别算法

Zheng WANG,Zejia WENG,Rui WANG,Jingjing CHEN,Yu-Gang JIANG

Science in China(Information Sciences)（2020）

引用 0|浏览17

暂无评分

摘要

片段视频语义识别旨在识别视频中短小片段的语义概念,是视频分析的一项重要任务.由于片段视频的数量巨大且缺乏可参考的网络标签,片段视频的标记十分困难,通常只能对部分片段视频进行标记.如何利用有限的语义标签提高片段视频语义识别的准确率是一项关键挑战.因此本文提出了一种基于长短时预测一致性的视频语义识别算法.该算法通过引入完整视频语义与片段视频语义一致性的约束,对片段视频语义识别结果进行筛选,以此提高片段视频语义识别的准确率.本文提出的算法在大规模视频数据集YouTube-8M的片段视频语义识别任务上达到了82.62％的平均均值准确率(mean average precision,MAP)识别精度,在第三届YouTube-8M比赛中排名第二.

查看译文

关键词

Semantics,Pattern recognition,Ranking,Computer science,Artificial intelligence,Feature aggregation,Recognition algorithm,Semantic consistency

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要