近日,联合图画专家组JPEG发布了JPEG AI规范渠道提案成果,火山引擎多媒体实验室凭借软件渠道BEE的优异体现,获得片面质量功能评比最佳成果。

JPEG是世界规范化安排、世界电工委员会和世界电信联盟的工作小组。信息“爆炸”年代,图画紧缩关于互联网数据的传输和存储至关重要。得益于深度学习在图画紧缩技能上的飞速发展,JPEG AI小组发布了JPEG AI规范渠道提案的搜集,希望构建全新的智能图画编码体系,在提升图片质量的同时,也能进步紧缩功能。

来自世界各地的高校、科研院所、企业等数十家单位,提交了各自的软件渠道计划。在相同文件巨细的前提下,图画紧缩最重要的点评指标是人类的片面视觉感触。此次片面质量功能评比中,火山引擎软件渠道BEE优于其他参赛软件渠道,名列该项评比的榜首。

据悉,自动驾驶、媒体分发等场景对图画紧缩技能有较高的要求,需要在有限带宽的条件下传输更多高质量图片。智能图画编码是人工智能技能在图画紧缩上的跨领域使用,在工业使用中具有巨大潜力,是图画紧缩的重要发展方向。

火山引擎多媒体实验室负责人表明,BEE软件渠道提出了多个立异算法,解决了智能图画编码软硬件实现中的一系列难题,独创的“解耦式熵编码”技能更是化解了长期困扰端到端紧缩的数据依靠,使得编解码速度有了根本性提升。

据介绍,业界在智能图画编码过程中,熵编码与像素重建过程是高度耦合的,“这就如同一个力工和一个瓦工配合造房,力工每次给瓦工一块砖,等瓦工抹好水泥砌上并给出收条后,他才会去搬下一块。这在流程上形成了‘耦合’与‘依靠’,会影响造房效率。”

火山引擎“解耦式熵编码”技能打破了这种制约,“力工不必再等瓦工抹水泥,只需要不停地搬砖放到指定方位就能够,甚至能够叫来更多力工一起搬。而瓦工也不必重视力工,只需指定方位有砖,他就能够不停地砌墙,然后大幅进步出产效率”。

JPEG公布智能图像编码提案结果,火山引擎排名主观质量评测第一
图1:JPEG官方片面测验成果图,TEAM16、24为火山引擎的计划

JPEG公布智能图像编码提案结果,火山引擎排名主观质量评测第一
图2:JPEG片面测验DMOS表,TEAM16、24为火山引擎的计划

测验成果表明,BEE渠道的解码速度要比其他参赛软件渠道高1-3个数量级,其速度现已超过最新的规范H.266/VVC。在图形处理器GPU加持下,BEE渠道解码时刻仅为H.266/VVC官方参考软件的一半。

火山引擎多媒体实验室是字节跳动旗下的研讨团队,致力于探究多媒体领域的前沿技能,参加世界、国内的规范化工作,其很多立异算法现已广泛使用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技能服务。