编辑: 麒麟兔爷 | 2019-07-04 |
321 个剧变和渐变视频片段, 每个视频片段由
16 帧 图像序列组成.在此基础上再去调整模型参数得到 我们所采用的网络模型.具体的网路结构及参数设 置如表
1 所示. 表1 网络结构及参数设置 当前层 Data Conv1 Pool1 Conv2 Pool2 Conv3 Conv4 Conv5 Pool5 Fc6 Fc7 Fc8 Softmax 核参数 - (3*3*3*3)*96 - (3*3*3*96)*256 - (3*3*3*256)*384 (3*3*3*384)*384 (3*3*3*384)*256 - (8*7*7*256)*2048 2048*2048 2048*3 Label 连接层 - ReLU+LRN - ReLU+LRN - ReLU ReLU ReLU - ReLU+Dropout.5 ReLU+Dropout.5 - -
4 实验结果及分析 为了验证本算法的有效性, 我们在 H.264/AVC 参考软件 JM16.0 和HEVC 参考软件 HM13.0 上进行 了算法实现,并在8个通用测试序列上进行了实郝小龙, 等 基于深度学习的视频图像再压缩方法 - -191 《电子设计工程》 2019年第11期验.其中, 表2和表
3 分别展示了全 I 帧及 IPPP 帧编 码结构下的实验结果. 如表2所示,对 于平缓的视频内容( 如FourPeople 序列) , 相比于经典的 H.264/AVC 编码标 准, 我们的码率节省可以达到 84.1%.对于目前最 先进的 HEVC 编码标准, 我们的码率节省同样可以 达到 15.21%.当视频内容变化剧烈时, 我们的编码 增益会有所降低.如BasketballDrill 序列,我们在H.264/AVC 和HEVC 编码器上的码率节省分别为41.31%和2.12%.另外, 相比于帧内编码结构, 帧间 编码的码率节省会相对减少.如表
3 所示, 我们的 算法在 H.264/AVC 和HEVC 上的平均码率节省分别 为28.01%和3.47%. 表2 全I帧编码结构下实验结果 测试序列 Akiyo BasketballDrill Claire Drawing Foreman FourPeople Pairs Silent Average H.264/AVC -70.22% -41.31% -71.21% -42.16% -48.60% -84.10% -42.31% -61.01% -57.62% HEVC -10.21% -2.12% -22.16% -2.41% -3.65% -15.21% -2.21% -8.95% -8.37 表3 IPPP帧编码结构下实验结果 测试序列 Akiyo BasketballDrill Claire Drawing Foreman FourPeople Pairs Silent Average H.264/AVC -38.31% -20.21% -32.10% -19.41% -22.21% -40.15% -21.10% -31.11% -28.01% HEVC -4.10% -1.11% -8.16% -0.98% -1.88% -7.12% -1.10% -3.34% -3.47%
5 结论文中提出了一种基于 CNN 技术的视频图像再 压缩方法, 在重构质量不变的情况下可显著提升现 有视频编码标准 (如H.264/AVC 和HEVC) 的压缩性 能.同时准备了一个足够训练出准确的 CNN 的标 注数据集, 包括
399 万帧图像数据.该方法根据图 像内容变化程度进行分类, 并针对不同类别视频片 段的冗余特点进行压缩, 实现了语义分析和去冗余 的联合优化. 参考文献: [1] Vila M,Bardera A,Xu Q,et al. Tsallis entropy- based information measures for shot boundary detection and keyframe selection [J]. Signal, Image and Video Processing, 2013,
7 (3) : 507-520. [2] Tran D,Bourdev L,Fergus R,et al. Learning spatiotemporal features with 3d convolutional networks[C]//Proceedings of the IEEE international conference on computer vision. 2015: 4489-4497. [3] Baraldi L,Grana C,Cucchiara R. A deep siamese network for scene detection in broadcast videos [C]//Proceedings of the 23rd ACM international conference on Multimedia. ACM, 2015:1199-1202. [4] Domnic S. Walsh C Hadamard transform kernel- based feature vector for shot boundary detection [J]. IEEE Transactions on Image Processing, 2014,
23 (12) : 5187-5197. [5] Lu Z M,Shi Y. Fast video shot boundary detection based on SVD and pattern matching [J]. IEEE Trans. Image Processing, 2013,
22 (12) :5136-5145. [6] Mohanta P P,Saha S K,Chanda B. A model- based shot boundary detection technique using frame transition parameters [J]. IEEE Transactions on multimedia, 2012,