开启辅助访问
 找回密码
 立即注册

如何看待阿里奇点编码器可以把视频压缩上千倍而画质影响不大?

DAIWEISI3 回答数5 浏览数175
如何看待阿里奇点编码器可以把视频压缩上千倍而画质影响不大?
使用道具 举报
| 来自北京
wjlzyh | 来自北京
我能说脏话么?
不能的话,就当我说了吧。
<hr/>阿里作为行业搅屎棍,涉足多个行业,宣称拿下该行业技术。每次都是惯用宣传手段罢了,动不动就要颠覆格局的样子,最后发现全是人家基础上搞的东西。
我以前在阿里云,他们刚开始用流计算。声称我要battle批处理最强的 spark,对外宣称阿里有实时处理地表最强的流计算——阿里云流计算。
刚开始上云的企业,哪看中你这算力,人家就是图不用自己团队维护、开发大数据计算平台罢了。
阿里云流计算团队宣传不往这上面宣传,一个劲儿宣传我计算有多牛班~~~一秒我能处理PB级别数据(实际上压测……你懂得)。可人家用户哪管你多强,人家就像想买服务而已,所有用户都知道你在吹牛,人家也不戳破你。也有头铁的客户,碰到很多计算反压的问题,就质问,你不是一秒亿级计算么,为啥我才几万就计算拥堵了……这时候,大家都尴尬,工程师一看,哎呀你逻辑太复杂了,就是不说flink底层机制层出不穷的算力问题。


大家都知道Flink是阿里研发的,上云后就是阿里云的流计算。
可是吧,这玩意是德国团队开发的哇,人家还在Apache基金会开源了。
阿里借助程序员多,钱多,在Apache上贡献代码比较多,就说自己是开发的flink,说到底,这玩意就是阿里优化而已。


阿里对于流计算的宣传

一个新技术的出现,发展最快是什么时候?就是刚开始时,一切皆有可能时入局,阿里程序员几十个几百个入局去开源端贡献代码。
最后把开源的东西包装、优化一下,上了阿里云,说这玩意是我们自研的流计算技术。为了圆这个梦,还花了钱把人家创始团队给买了,技术归阿里了。


阿里收购flink新闻

所以大家最后知道,flink 阿里工程师开发的,流计算阿里云上有。
还有……
那时候阿里的一楼处,刚成立了达摩院,说我们要研究芯片。
3年后,宣传史上最强,全球领先……5nm制程芯片出来了。GPU处理能力又咋咋的,跑分远超标准20%……


阿里达摩院三年研究成果

全国沸腾。
我仔细一看,好家伙,你这是设计芯片的啊。我以为你做出芯片了。而且你这芯片给服务器用,也没服务器厂商用你的啊。
2022年达摩院裁人……


这次又是啥……号称,不影响画质还能压缩几千倍的视频编码器。
原来是编码器换马甲来忽悠了。
雾草,这套路如此熟悉,要是真的我吃翔。
现在我经常用的编码就是H.264 ,据我所知,我2G的1080P的avi视频,经过H.264压缩,做成720P,可以达到70MB左右,也就30倍。可是我清楚啊,这还是我牺牲了分辨率和码率带来的收益。
720P对于小屏手机来说,画质还能接受。但是你换成大屏,像4K电视,外接屏幕……我差点得白内障好吧啦。
这就好比我高清无码,转码后变成标清还全屏加轻度马赛克。不过也还行,起码硬盘女神还是能分辨谁是谁的。如果再夸张点你直接来个千倍,我只能想到已经成全屏马赛克PPT了,你说不影响画质,我是万万不信的。你说你行,你做出来,证明给我看,我亲自当你免费测试,看到效果能看清我女神,我直播倒立拉稀。
H.264在降低码率与画质上做了平衡,我是觉得做的最好的了。
阿里说,他编码器降低几千倍,不影响画质!


别扒出来底层就是H.264。
或者你丫的在H.264基础上优化也不要这么宣传啊。
散会……
回复
使用道具 举报
xiezhigang | 来自北京
利用信息差忽悠大众。
大众以为是把原本一小时1G Byte大小左右的Mp4电影压缩成1M Byte
但是实际上,1小时的,1920x1080尺寸的高清视频,25帧每秒,8bit量化,RGB色彩的视频大小,大众根本不清楚。
计算当然极其简单粗暴。因为上述条件下,每一帧就是一个画面中,单一像素的大小是8bit x 3 (RGB色彩,每个颜色的数据是8bit),也就是24bit/像素
所以上述视频的原始文件大小应该是
1(小时) x 3600(秒/小时) x 25(帧/秒)  = 90000(帧)
1920 x 1080 = 2073600 (像素/帧)
综上
90000(帧) x 2073600 (像素/帧) x 24(bit/像素)  = 4,478,976,000,000 bit
这个值 x 0.125(Byte/bit) = 559,872,000,000 Byte
此时,我们用1000B = 1kByte来换算
则上面这个559,872,000,000 Byte是559.872GB,四舍五入一下560GByte
一个一小时的彩色视频,1080P 25帧每秒,居然要560G???
是的,这才是正常的视频尺寸。
所以,所谓的1000倍也就是吧一个小时560G的视频压缩成了560M Byte。
<hr/>这个视频的码率是多少呢?
用之前很长的一个大数去算原始视频码率
4,478,976,000,000 bit/小时 x (1小时/3600秒) = 1,244,160,000 bit/秒
这个bit/秒就是bps(bit per second)
也就是说原始视频是
1,244,160,000 bps = 1,244,160 kbps = 1,244.16 mbps 的码率。
所谓压缩1000倍就是1.24 mbps咯
在目前的HEVC编解码技术下,这个码率对应的PSNR和SSIM(两个评价压缩后质量的参数)其实还可以。
不是评价阿里本身这个科研成果的情况。
只是告诉大家,这里面有信息差。
以上
回复
使用道具 举报
vvenufedun | 来自北京
编码本身是怎么回事高赞说的很透彻。
无需补充了。
我想补充的是,所谓“互联网大平台”高科技忽悠的套路:
1,把成熟算法的一个关键指数调高,牺牲其他指数,然后对外忽悠“性能提高了XX倍”。
2,利用第三方工具,做一个可以show的应用,比如用某些数据训练一个神经网络,然后对外宣称“智能XX产生了”。
3,用算力堆出来一个正常公司都不会去做的所谓计算,然后宣称“XX云解决了世纪难题”。
4,用攒电脑的办法,所有东西都买别人了,“搞”出来云硬件,用开源代码,换个皮,做成云计算云存储管理软件,然后宣称“云技术世界第一第二”
5,把某一领域的烂大街技术,拿到一个应用领域,做噱头,比如用虚幻三做个支付场景的3d表现,然后对外说“VR支付时代开始了”。
6,用硬件算力、大量后备冗余算力和开源软件堆出来一个并发数,对外宣称“处理了世界上最多并发数的交易”。
把以上这些玩意抛掉以后。
这些“高科技”公司毛都没有。
只剩下大鱼吃小鱼的垄断逻辑。
忽悠着能当高科技,所以不用真的去研究高科技了。
回复
使用道具 举报
忘了喝水的鱼 | 来自北京
如何看待?又要麻烦丞相出来一次啰……



1.标题党。2.年底了,阿里的KPI考核开始了么?3.欺负读者不会看外网消息

<hr/>先介绍一下视频压缩的背景知识:
4K分辨率,8bit色深,24 FPS(Frames Per Second,每秒帧数)的视频未压缩码率是 3840×2160×8×3×24=4,777,574,400 bps=4777 Mbps。压缩1000倍就是4777 Kbps。

国内视频网站的4K视频基本就是这个压缩率。例如爱奇艺(借用少数派某篇文章[1]的图),4K内容码率是4816 Kbps:


华为iLab的某份报告中所列数据[2](数据有点旧,2017年的,不过似乎现在也没什么变化):


10部里面有三部不到4.7 Mbps

4K视频平均码率:5.3 Mbps

数据说明

所以,视频内容压缩1000倍是(抠门视频网站的)常规操作,重点在于画质。

<hr/>然后,还是先看看新闻,万一被人当鱼钓了就不好了,随手找到了一个[3]。
12月15日,2020 年 MSU 世界视频编码器大赛成绩公布,阿里巴巴自研奇点编码器首次参赛就包揽图像失真指标PSNR的两项冠军,该编码器在离线和在线场景下将视频压缩50-1000倍后,均实现了最好的画质。据介绍,奇点编码器未来可为8K超高清视频提供流畅体验。

MSU世界视频编码器大赛是视频压缩领域最权威的赛事,参赛编码器代表了行业发展的风向标,Google、Intel及Netflix等科技公司都曾多次参与该比赛。今年共有21款编码器参赛,最终,阿里自研奇点编码器在PSNR(峰值信噪比)指标中获得两项冠军。
有头有脸的,当然先找消息来源官网[4]:


划重点:

  • 对比还在进行;
  • FHD分辨率的对比(Part 1)完成了;
  • 对FHD分辨率的主观评价(Part 2),4K视频的报告(Part 3)计划明年1月份发布。

等等,忘了介绍一下MSU世界视频编码器大赛了,这是个莫斯科国立大学图形和媒体实验室支持的项目,对流行的视频编码器编码质量进行对比,从2005年开始第一届。2020年是第十五届了,本届参赛视频编码器名单[5]:


*AOM成员包含[6]:


的确是顶级水准。

顺道说一嘴,第8项的Reference x265,x265是2015年,MSU第一届使用HEVC编码进行对比时的最佳整体效率编码器,这里说的最佳效率,是同等画质码率最低的意思,也就是压缩比最高。过往几年的比赛报告中,都以x264作为参照标准,2020年第一次使用x265编码器作为参照标准。
<hr/>比赛没问题,直接看结果[5]:


恭喜字节和腾讯,字节牛逼,腾讯牛逼!!!


等等,我好像在回答阿里编码器的问题?再仔细点看看表格,上面阿里的S265的确出现了很多次,前面全都是最佳画质……晕死,哪个才是?就算新闻说的PSNR,还分avg.log和avg.MSE,还有,为什么avg.log里面,Offline有两个S65;avg.MSE里面,Online也有两个S265的?

下载个免费版报告(马赛克了不少内容,完整版要收950美刀,没钱给)仔细看看。第9页,目标与测试规则中,有这么一段话:
For objective quality measurements we used YUV-SSIM metric (see Appendix F.1) as a main objective indicator, and other metrics (PSNR, VMAF) as an additional quality metrics. Our team is constantly researching the area of objective video quality metrics to find good solutions for large comparisons.
机翻一下:
对于客观质量度量,我们使用YUV-SSIM度量(请参阅附录F.1)作为主要的客观指标,并使用其他度量(PSNR,VMAF)作为其他质量度量。我们的团队一直在研究客观视频质量指标的领域,以便为大型比较找到良好的解决方案。
我记得香港的BTV每年选香港小姐,除了冠亚季军以外,还有什么最上镜小姐和友谊小姐。所以阿里这是拿了个最上镜小姐奖?

<hr/>填一下前面的坑:

后面附录再翻了一下,PSNR的avg.log和avg.MSE,就是计算公式不同:


就是用平均MSE当分母算噪点分贝;还是逐个算噪点分贝,算完了再平均的区别

然后online的图免费版报告看不到,看看offline里面,  的两个S265:


就是S265分两个模式:码率模式和质量模式

关于MSU的online、offline区别:在给定的硬件配置(一台8700K,32G内存的台式机)上,根据开发者提供或者MSU自行找到的最佳编码参数,offline必须满足最低每秒1帧的转码速度,online必须满足每秒30帧的转码速度。
<hr/>真的可以压缩千倍画质影响不大么?

这个要看RD曲线。以Offline来说,这次Part1测试的都是FHD视频,帧率大部分是24~30,少数50/60。按照30 FPS来算,每秒数据量1920×1080×8×3×30=1,492,992,000 bps=1493 Mbps。压缩一千倍大概就是1.5 Mbps。


报告中的RD曲线,1.5 Mbps左右,S265码率模式的SSIM只有0.700不到。作为参考,阿里这个编码器在画质模式下,最低SSIM大约在0.775左右,需要2 Mbps多一点的码率。

所以,0.7不到的SSIM画质影响不大?新闻标题是“压缩上千倍画质无损”?这是对采用SSIM作为主要评价指标的MSU开嘲讽么?

<hr/>PS:关于SSIM、PSNR、VMAF是什么,以及为什么MSU用SSIM作为最关键的画质指标,说起来有点长篇,就先不说了。如果追更的人多我再找时间给大家介绍一下。
<hr/>
回复
使用道具 举报
南方的雨 | 来自广东
我很难得会骂人,这次就给阿里吧
在这个宣传上,阿里就是个混帐王八蛋,利用普通人不懂技术,搞虚假宣传,欺骗用户,同时侮辱了整个视频编码技术领域从业者。
如果阿里的研发人员知道并且配合这样的宣传,那么你们的良心不会痛吗?
1080p的视频,换算成yuv420是3 MB左右
按30fps计算每秒视频是90+MB
压缩1000倍,是90+KB
换算成码率是 750kbps
这就是H.265的常规水准,这种画质放到pc的大屏幕会有点模糊,放到手机上就比较清晰
这有啥了不起的,就算阿里做了些算法优化改进,那也就比H.265好一点,不可能有质的变化。
如果在这个基础上还能再压缩几倍,还能保持画质,那么就是在挑战信息论了,香农老爷子的棺材板要压不住了。
回复
使用道具 举报
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影