多媒体技术研究:2014——深度学习与媒体计算

Journal of Image and Graphics（2015）

Cited 4|Views6

No score

Abstract

目的海量数据的快速增长给多媒体计算带来了深刻挑战.与传统以手工构造为核心的媒体计算模式不同,数据驱动下的深度学习(特征学习)方法成为当前媒体计算主流.方法重点分析了深度学习在检索排序与标注、多模态检索与语义理解、视频分析与理解等媒体计算方面的最新进展和所面临的挑战,并对未来的发展趋势进行展望.结果在检索排序与标注方面,基于深度学习的神经编码等方法取得了很好的效果;在多模态检索与语义理解方面,深度学习被用于弥补不同模态间的"异构鸿沟"以及底层特征与高层语义间的"语义鸿沟",基于深度学习的组合语义学习成为研究热点;在视频分析与理解方面,深度神经网络被用于学习视频的有效表示方式及动作识别,并取得了很好的效果.然而,深度学习是一种数据驱动的方法,易受数据噪声影响,对于在线增量学习方面还不成熟,如何将深度学习与众包计算相结合是一个值得期待的问题.结论该综述在深入分析现有方法的基础上,对深度学习框架下为解决异构鸿沟和语义鸿沟给出新的思路.

AI Read Science

Must-Reading Tree

Example

Generate MRT to find the research sequence of this paper

Chat Paper

Summary is being generated by the instructions you defined