ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】在海量的视频数据面前,人们要想像检索文字信息一样去检索自己感兴趣的视频内容,其中最关键的问题就在于视频能否具备与其内容相匹配的文字索引。随着深度学习的发展,计算机视觉及自然语言技术的进步,机器自动为视频添加文字描述带来了极大的方便,本文简要介绍了视频描述技术的发展历程,主要研究了基于深度学习的编码解码器框架下的视频描述技术及其待解决的问题。