目前,5G技术应用正在逐步推进,相比目前广泛使用的4G, 它具有更高的速率,更大的容量,同时延迟更低, 可靠性更高。
在5G时代,得益于网络带宽的提升,视频未来将成为主流的传播媒介。越来越多的业务和应用将视频化、直播化。大量互动的内容将通过5G以低延时的方式以视频的形式传输。5G将对视频分辨率和清晰度提出越来越高的要求。
淘宝作为一个数亿级用户的短视频与直播平台,业务多样,两端用户分布广,设备和网络情况复杂,给多媒体内容存储和分发带来巨大挑战。
本文由淘宝直播音视频算法团队分享,对实现高清、低延时实时视频直播技术进行了较深入的总结,希望分享给大家。
1)《移动端实时音视频直播技术详解(一):开篇》:
http://www.52im.net/thread-853-1-1.html
2)《移动端实时音视频直播技术详解(二):采集》:
http://www.52im.net/thread-955-1-1.html
3)《移动端实时音视频直播技术详解(三):处理》:
http://www.52im.net/thread-960-1-1.html
4)《移动端实时音视频直播技术详解(四):编码和封装》:
http://www.52im.net/thread-965-1-1.html
5)《移动端实时音视频直播技术详解(五):推流和传输》:
http://www.52im.net/thread-967-1-1.html
6)《移动端实时音视频直播技术详解(六):延迟优化》:
http://www.52im.net/thread-972-1-1.html
面对实时视频直播技术的的高需求,当前面临的主要问题有:
1)需要在内容生产过程中把控好质量和成本;
2)需要在内容分发和消费过程中确保用户体验。
为了解决这个问题, 我们有两个优化目标:
1)一是在画质不变的前提下降码率;
2)二是在码率不变的前提下提升画面质量。
在降码率上,我们通过以下手段有效地降低了视频码率带宽:
1)自研高效编码器;
2)升级播放架构;
3)添加智能ROI;
4)场景编码;
5)智能码控等工具。
在这些技术中:
1)高效的编码器能够在质量不变的前提下显著降低码率;
2)场景编码能够根据不同的画面内容配置合适的编码参数;
3)ROI挑出画面中人眼比较关注的区域交给编码器重点编码;
4)智能码控根据人眼主观特性,消除因为超过人眼阈值而浪费的码字。
在画质上,我们使用了以下算法提高生产内容的观感质量:
1)前处理增强;
2)去噪;
3)超分高动态范围等。
在体验优化上:通过低延时编码技术,在降低了编码延迟的同时损失很小的码率,增加观众和主播的体验。
围绕着提高问题发现、问题处理效率的出发点,具备数据采集、存储、异常事件收集、智能告警、告警数据运营、可编码诊断平台、故障自动化处理、变更联动等能力。我们搭建了一套基于淘宝直播的全链路监控体系,从音频,视频,网络这三个方面入手去解决目前淘宝直播全链路的现有问题以及将来可能出现的问题。不断去优化整套高画质低延时系统。
与此同时,我们建立了客观质量和主观质量评价体系,采用vmaf、psnr、ssim这一系列的指标作为客观质量评价。针对海量无源场景,我们还基于cnn建立了无源评价模型,保证无源场景下质量评价的准确性。以这些有效的评价手段来确保“画质不变”,并监控线上视频质量。
下面的章节将针对上述的主要技术实践,进行深入的分享。
因微信内容审查原因,本文无法全文发布在公众号, 如需阅读全文,请前往即时通讯网(52im.net)社区:http://www.52im.net/thread-3220-1-1.html,或点击下文的“阅读原文”!以上,多谢理解!
微信中无法引用外链,本文相关资料链接如下:
1)《零基础,史上最通俗视频编码技术入门》:
http://www.52im.net/thread-2840-1-1.html
2)《技术干货:实时视频直播首屏耗时400ms内的优化实践》:
http://www.52im.net/thread-2087-1-1.html