编辑: 达达恰西瓜 | 2015-08-22 |
9 期1999 年9月软件学报JOU RNAL O F SO FTWARE Vo l .
10, No.
9 Sep.
1999 相似顺序图用于视频镜头的组织 Ξ 白雪生 徐光礻右 史元春 (清华大学计算机科学与技术系 北京 100084) (清华大学智能技术与系统国家重点实验室 北京 100084) 摘要 在对视频进行基于内容检索时, 对由分割得到的镜头进行有效的组织是提高检 索效率的一种重要手段. 在绝大多数情况下, 传统的自动组织方法不能给出令人满意的 结果, 而需要通过人机交互来进行组织. 文章提出了相似顺序图的概念, 即对镜头代表 帧重新排序, 使得感官上相近的代表帧在新序列中位置相近, 以便于用户的交互组织. 文章还提出了相似距离的概念以作为对序列中相近代表帧相似性的度量, 并采用了改 进的遗传算法来进行求解. 文章阐述了相似顺序图、 相似距离和求解采用的改进遗传算 法的基本思想, 并给出了实验结果和分析. 关键词视频检索, 相似距离, 相似顺序, 相似顺序图, 遗传算法. 中图法分类号 TP311 随着数字化时代的到来和多媒体技术的发展, 视频信息也摆脱了以模拟信号形式在磁性介质(录像带) 上 进行存储的时代, 而代之以易于计算机处理的数字化存储方式. 在信息社会里, 每天都有大量的视频信号产生, 这些信号的存储和检索也就成为人们需要解决的问题. 视频信号的检索要求有别于传统数据库, 在多数情况下, 人们希望能够根据信号内容来进行检索. 在检索 视频信号时, 由于视频的流特性, 需要将其分割为具有独立语义信息的片段―― 镜头来作为检索的基本单 元[1] . 但当信号中含有大量镜头时, 直接对镜头浏览检索较为困难, 往往需要对镜头进行组织并建立更高层的 索引结构. 目前常用的方法是, 对这些镜头先在内容描述空间聚类, 再在时间轴上聚类[2] . 但基于目前图像理解 技术的水平, 自动组织的结果往往难以令人满意. 相比之下, 若能提供一种简便的方法使用户可通过交互更快 地完成镜头组织, 也就具有更为重要的意义了. 在本文中, 我们提出了一种新的镜头组织方法――相似顺序图法. 与基于聚类的自动组织方法不同, 该方 法根据镜头的内容描述进行组织后并不给出聚类结果, 而是给出一个按镜头内容描述距离远近构成相邻关系 的一维序列――相似顺序图. 在序列中, 内容描述相近的镜头位置相近, 内容描述相差较大的镜头位置相距较 远. 这样, 用户通过简单的交互就可以完成正确的镜头组织. 为了对不同序列中相近代表帧的相似性进行比较, 我们引入了相似距离的概念, 从而将相似顺序图的求解 转化为一个优化问题. 在此基础上, 我们采用遗传算法来求解相似顺序图. 在遗传算法的求解中, 我们除了采用 传统的重组和变异算子之外, 还提出根据知识的染色体片段迁移来产生新个体的算法, 以加快算法的收敛. 本文第
1 节对视频镜头的组织问题作简要的介绍. 第2节详细说明相似顺序图的含义、 相似距离的定义以 及求解相似顺序图的遗传算法的基本思想. 第3节给出了相似顺序图的模拟仿真和对实际视频流镜头组织的 实验结果. Ξ 本文研究得到国家
863 高科技项目基金和国家
211 学科建设项目基金资助. 作者白雪生,
1972 年生, 博士生, 主要 研究领域为基于内容检索, 计算机视觉. 徐光礻 右,