声网发布“实时高清·超级画质”,提升实时视频场景画质及使用体验

短视频、直播正渗透进生活及各行各业的方方面面,不过依然有不少直播用户反映,在观看直播时,主播端的画质存在泛白泛灰、发丝边缘模糊、美颜效果差、颗粒感明显等问题,严重影响了观看体验。

7月26日,实时互动云服务商声网发布全新解决方案“实时高清·超级画质”,致力于提升实时视频场景的画质和使用体验。据了解,“实时高清·超级画质”拥有至臻画质、美颜悦色、丝滑流畅、低码高清、PC 开播等特性,帮助开发者和企业实现视频画质、用户体验和互动玩法的全面升级,从而拓展更为广阔的营收增长空间。

随着硬件设备的持续迭代和网络基础设施的发展,互联网用户对于使用体验流畅、视觉效果更惊艳的 FHD 及 4K 高清画质的需求也随之增长。

声网CTO&首席科学家钟声在发布会指出,高清画质能够有效助力平台用户观看时长的提升,根据声网的数据分析,低分辨率的频道内观众的次均/人均留存时长,明显低于中/高分辨率频道的用户次均/人均留存时长。

钟声在分享中提到,实时高清的呈现首先基于视觉感知的前处理,比如暗光、噪声改善,AI 视觉感知处理,再通过多格式视频编码及弱网对抗,视频自适应分发(低码高清、动态传输路径规划),最后进行基于视觉感知的后处理。

同时,通过RTC搭载美颜技术,“实时高清·超级画质”实现了复杂场景精细化调优,明暗动静全覆盖。此外,该平台还考虑到不同人种脸部特征,实现了高精准的五官贴合和高稳定的点位追踪,达到无抖动无延时的美颜效果。

IDC数据显示,声网是中国音视频通信(RTC)赛道的龙头,其2021年的市场份额超过第2~8位的总和,而且同比增量在所有厂商中排名第一。有关资料显示,声网的实时互动技术服务覆盖全球200多个国家和地区,截至2022年12月31日,声网全球注册应用已超54.8万。

声网研发总监秦泽雄祥细介绍了声网实时高清技术。声网 AI 推理引擎是实现实时高清的基石。在前处理阶段,基于深度学习的AI感知处理,能够带来30%视频压缩效率增加。在编码阶段,实时高清·超级画质采用 H.265 高效编码器,H.265 使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,能够在有限带宽下传输更高质量的网络视频,同样码率下的H.265画质明显优于H.264。在传输阶段,声网采用自适应弹性传输算法,适应不同网络环境,接受者可以根据下行带宽自适应接受对应级别的内容。在后处理阶段,声网基于深度学习,修复增强高清画质,在不改变分辨率的情况下,智能调整画质锐度和对比度,让好的画质更好,改善用户主观体验。此外,在AI 算法低消耗方面声网也有做调优,使得低端机算法自动降级,链路各模块自动协商,统一调度不冗余,硬件模块全面使能。

据了解,实时高清·超级画质从清晰度、美观度、流畅度三方面对画质、体验、玩法进行全面升级,特别针对秀场直播、电商直播、赛事直播、多人连屏、跨房间PK等场景。根据声网平台数据分析统计,高清画质相比标清画质,频道内用户留存时长高10.3%。