如果要比较原视频与压制后视频的画质损失,或者不同参数预设的压制后视频画质区别,一般有两个方法。
其一是肉眼对比观看,这也是最推荐的。
其二是跑分,本帖分享这个。
跑分软件是FFMetrics,github有下载,直接搜能搜到。或者回帖上附有云盘下载地址。

跑分模式有PSNR、SSIM、VMAF三种。
推荐VMAF,VMAF是某飞推出的,比较接近人眼对画质的感觉,前两者比较接近电脑认为的对画质的感觉。
稍微扩展一下(以下都是粗浅举例,数据可能不对,但大体的意思差不了多少)。
人眼对亮度敏感,对色彩不敏感。亮度信息里,又有人眼对暗度敏感,对光度不敏感。
太阳亮度20亿尼特,户外汽车表面亮度60万尼特,室内灯光1.1万你特,室内手机屏幕500尼特以内。人眼感觉1000尼特亮度是400尼特的1.3倍而非2.5倍,人眼感觉2000尼特亮度是1000尼特的1.15倍而非2倍。
而人眼对色彩信息就更加不敏感了。
我们常见的有损压缩视频是420色度二次抽样的,相对于无损视频,色彩信息只有25%。
举个例子,1080P的无损视频和420压缩视频,无损视频当然保留所有信息了,420压缩视频亮度信息分辨率无压缩有1080P,但色彩信息分辨率只有540P了。
同样的,4K的无损视频和420压缩视频也是如此,420压缩视频亮度信息有4K,色彩信息只有1080P了。
PSNR、SSIM、VMA这三种跑分模式,前两者是电脑认为的画质损失,vmaf则是更接近人眼。
视频用1/3码率保存亮度信息,用2/3码率保存色彩信息。如果是前两种模式,压缩视频两种情况,其一亮度信息损失一半且色彩信息保留=1*(0.5*(1/3)+1*(2/3)),其二亮度信息保留且色彩信息损失1/4=1*(1*(1/3)+0.25*(2/3)),对电脑来说是一样的画质的,但人眼会感觉前者画质很差,后者感觉画质很好。所以PSNR、SSIM可能会和人眼感知有较大差别,某飞的VMAF与人眼感知比较接近。
回到FFMetrics软件本身。
PSNR、SSIM不用勾选,VMAF勾上,就是跑VMAF模式。
左下方的选项是导出非常详细的测试结果到表格,一般只需要看个最后跑分的分数即可,详细不需要,可以不勾选。
右下角,pooling是平均数算法,Mean是算术平均数,也就是我们常用的平均数,Harmonic Mean是调和平均数。
调和平均数就是把每一项数据转化为它的倒数,进行平均数计算,最后再次转化倒数转化回来。
调和平均数相对于常用的算术平均数,它的特点是相对不容易受到极大、极小等极端数据的影响,它更专注于中间变化较小的数。个人推荐选调和平均数。
右边的Phone,勾选跑分会更加宽松,也就是画质差的视频分数也比较高,不勾选则跑分比较严格。可以根据自己情况选,用手机看视频就勾选,用电脑电视看就不勾选,建议不勾选。
model,即AI模型,某飞开源了VMAF相关技术,自己可以下载相关源码搭建环境自己训练AI模型,这里FFMetrics默认预设了某飞自己训练的模型。vmaf_4k_v0.6.1是比较严格的模型,超过4K的原视频会临时压缩到4K分辨率再进行比较,最终跑分会偏低,vmaf_v0.6.1则是超过1080P的原视频临时压缩到1080P分辨率再进行比较。这个根据自己原视频分辨率来选择。
最上方的,option->scaling method则是原视频和压制后视频分辨率不一致时,进行的缩放算法。spline缩放效果好,跑分严格。
最后,上方红框放入原视频,下放白框/绿框放入压制后视频,最多可以放入24个视频,点击start就可以跑分了。
其一是肉眼对比观看,这也是最推荐的。
其二是跑分,本帖分享这个。
跑分软件是FFMetrics,github有下载,直接搜能搜到。或者回帖上附有云盘下载地址。

跑分模式有PSNR、SSIM、VMAF三种。
推荐VMAF,VMAF是某飞推出的,比较接近人眼对画质的感觉,前两者比较接近电脑认为的对画质的感觉。
稍微扩展一下(以下都是粗浅举例,数据可能不对,但大体的意思差不了多少)。
人眼对亮度敏感,对色彩不敏感。亮度信息里,又有人眼对暗度敏感,对光度不敏感。
太阳亮度20亿尼特,户外汽车表面亮度60万尼特,室内灯光1.1万你特,室内手机屏幕500尼特以内。人眼感觉1000尼特亮度是400尼特的1.3倍而非2.5倍,人眼感觉2000尼特亮度是1000尼特的1.15倍而非2倍。
而人眼对色彩信息就更加不敏感了。
我们常见的有损压缩视频是420色度二次抽样的,相对于无损视频,色彩信息只有25%。
举个例子,1080P的无损视频和420压缩视频,无损视频当然保留所有信息了,420压缩视频亮度信息分辨率无压缩有1080P,但色彩信息分辨率只有540P了。
同样的,4K的无损视频和420压缩视频也是如此,420压缩视频亮度信息有4K,色彩信息只有1080P了。
PSNR、SSIM、VMA这三种跑分模式,前两者是电脑认为的画质损失,vmaf则是更接近人眼。
视频用1/3码率保存亮度信息,用2/3码率保存色彩信息。如果是前两种模式,压缩视频两种情况,其一亮度信息损失一半且色彩信息保留=1*(0.5*(1/3)+1*(2/3)),其二亮度信息保留且色彩信息损失1/4=1*(1*(1/3)+0.25*(2/3)),对电脑来说是一样的画质的,但人眼会感觉前者画质很差,后者感觉画质很好。所以PSNR、SSIM可能会和人眼感知有较大差别,某飞的VMAF与人眼感知比较接近。
回到FFMetrics软件本身。
PSNR、SSIM不用勾选,VMAF勾上,就是跑VMAF模式。
左下方的选项是导出非常详细的测试结果到表格,一般只需要看个最后跑分的分数即可,详细不需要,可以不勾选。
右下角,pooling是平均数算法,Mean是算术平均数,也就是我们常用的平均数,Harmonic Mean是调和平均数。
调和平均数就是把每一项数据转化为它的倒数,进行平均数计算,最后再次转化倒数转化回来。
调和平均数相对于常用的算术平均数,它的特点是相对不容易受到极大、极小等极端数据的影响,它更专注于中间变化较小的数。个人推荐选调和平均数。
右边的Phone,勾选跑分会更加宽松,也就是画质差的视频分数也比较高,不勾选则跑分比较严格。可以根据自己情况选,用手机看视频就勾选,用电脑电视看就不勾选,建议不勾选。
model,即AI模型,某飞开源了VMAF相关技术,自己可以下载相关源码搭建环境自己训练AI模型,这里FFMetrics默认预设了某飞自己训练的模型。vmaf_4k_v0.6.1是比较严格的模型,超过4K的原视频会临时压缩到4K分辨率再进行比较,最终跑分会偏低,vmaf_v0.6.1则是超过1080P的原视频临时压缩到1080P分辨率再进行比较。这个根据自己原视频分辨率来选择。
最上方的,option->scaling method则是原视频和压制后视频分辨率不一致时,进行的缩放算法。spline缩放效果好,跑分严格。
最后,上方红框放入原视频,下放白框/绿框放入压制后视频,最多可以放入24个视频,点击start就可以跑分了。