文末有抽奖!

最近,一款全新的音频理解与生成系统 AudioGPT 惊艳亮相,将 ChatGPT 与音频根底模式相结合,让用户能够轻松创立丰厚多彩的音视频内容。在新技能与体验双重驱动下,音视频技能的开展走向极致,具有无限或许性。

曩昔几年里,随着元世界、VR 等技能不断演进和鼓起,音视频对强互动、低时延、超高清有了更高的要求,最显著的变化便是,不断提高在线文娱社交工业的丰厚程度和体验感,撬动传统企业以长途作业为代表的强实时、强互动场景的数字化升级。直播、短视频、云会议、云作业等新生产生活方式需求爆发,使得音视频正在成为一种不可或缺的社会根底设施。未来几年,音视频技能的开展将是互联网技能开展的重头戏,在各行各业中的音视频运用占比一定会进一步提高,随之而来的是怎么与各种前沿技能交融,持续立异和突破。比方,现在抢手的运用,如视频修改、图画组成、虚拟化装等都离不开人脸的感知,怎么让算法在能捕捉到精准纤细的面部表情和姿势的一起保证实时性,就成为咱们待解的难题之一。

6 月 30 日- 7 月 1 日北京新云南皇冠假日酒店,由稀土技能社区举办的「稀土开发者大会2023」上,刘歧FFmpeg 官方源代码维护者)作为出品人,为大家带来《音视频技能前沿》专场,火山引擎视频点播产品担任人赵春波、烟台小樱桃网络 CTO杜金房、网易云信视频编解码算法专家苗晋伟、声网 AI 算法工程师王丽,将为技能开发者们共享音视频技能最佳实践,一起探究音视频技能的极致。

追求极致,一起聊聊2023音视频技术如何发展?

讲演嘉宾:赵春波 火山引擎视频点播产品担任人

10 余年视频云相关研发和产品经历。当时首要担任火山引擎视频点播的产品作业,支撑抖音、西瓜等事务的点播体验优化和本钱优化,并将这些技能才能沉积到火山引擎,来服务更多的职业客户。

讲演主题:怎么利用播放器节省 20% 点播本钱

在具有视频点播事务的公司里,点播的根底设施本钱经常是公司收购本钱的重要构成部分,怎么做优化本钱是事务开展的必备作业。咱们在 toB 事务交流中发现,大部分公司都关注到了服务端才能降本的手法,比方压低带宽收购价格、提高转码压缩率等,但较少有团队关注到客户端播放器在本钱优化的关键作用。本次共享结合咱们实践的本钱优化经历和降本战略,介绍客户端播放器对点播事务的本钱优化办法,以及背后数据驱动才能的建造思路。

讲演纲要:

  1. 点播本钱构成
  2. 播放器的本钱优化办法
  3. 本钱评估公式
  4. 数据挖掘本钱优化空间
  5. 总结和展望

讲演嘉宾:杜金房 烟台小樱桃网络 CTO

FreeSWITCH 中文社区创始人,《FreeSWITCH 威望攻略》、《Kamailio 实战》作者。烟台小樱桃网络科技有限公司CTO,腾讯云 TVP。

讲演主题:FreeSWITCH 衔接 RTC 及人工智能交融通讯实践

聚集实时音视频与各种前沿技能交融。通讯的实质是“通”。本次讲演便以 FreeSWITCH 开源软件为根底,兼谈商业化实践,共享交融 SRS、声网SDK、腾讯会议、微软 Teams、微信小程序、4G VoLTE、5G VoNR、ASR/TTS、ChatGPT 等各种平台和技能,打造一致通讯平台的技能要点和实践经历。

讲演纲要:

  1. FreeSWITCH 与 RTC 简介
  2. MCU 与 SFU 对接解决方案
  3. FreeSWITCH 衔接各种音视频服务
  4. FreeSWITCH 衔接 AI 平台及 AI 服务
  5. 小结

讲演嘉宾:苗晋伟 网易云信视频编解码算法专家

10 余年视频编解码与处理、音视频引擎开发优化等实践经历。曾上任于华为、腾讯,现在在网易云信担任视频编解码算法的开发和优化作业,首要包括 RTC 实时通讯场景、视频直播点播转码场景等。

讲演主题:RTC 场景下的视频编码优化与 AI 超分结合实践

网易云信在 RTC 场景下的 NE 系列视频编码器包括 NE264、NE265、NEVC 编码器,其中 NE264、NE265 是符合标准的 H264、H265 协议,在此根底上结合 RTC 场景下的一些痛点问题,定制了 NEVC 私有编码器,能够进一步改进 RTC 场景下端到端的通话体验。针对 NE 系列视频编码器,在下降码率、提高质量、码控控制等方向上,咱们尝试了大量的快速算法的优化。一起也结合 AI 前处理,结合网络状态等,也做了许多编码优化。别的,结合网易云信自研的轻量级的 AI 超分算法,在 NEVC 编码器内部做了自适应降分辨率的战略,能够在坚持片面质量不下降的情况下,进一步的下降编码码率。

讲演纲要:

  1. NE 编码器介绍
  2. NE 编码器在 RTC 场景下的优化
  3. 轻量化端侧的 AI 超分介绍
  4. NE 编码器与 AI 超分结合的落地实践

讲演嘉宾:王丽 声网 AI 算法工程师

复旦大学计算机系理学博士。首要从事根据深度学习的计算机视觉方向研讨,研讨内容包括 2D/3D 方针检测、人群计数、3D 人体/人脸重建等。在计算机视觉范畴发表学术论文 10 余篇,引用量达 1500 余次,获 ICME 2017 最佳会议论文奖。2022 年加入声网,首要从事 3D 人体/人脸重建方向的研讨和运用。

讲演主题:根据单张 RGB 图片的人脸重建办法

运用单张 RGB 图片进行人脸表情、姿势捕捉,进一步进行人脸重建,已成为计算机视觉范畴的一个新式研讨课题。它的迅速开展驱动了 VR/AR 的 3D Avatar 创立,能够帮助进行人机交互。现在抢手的运用,如视频修改、图画组成、虚拟化装等都离不开人脸的感知。怎么让算法在能捕捉到精准纤细的面部表情和姿势的一起保证实时性,则成为咱们首要的研讨方向。本次共享将分为三个部分:第一部分介绍人脸重建的布景和首要技能道路;第二部分介绍怎么在移动端实时的进行人脸表情、姿势捕捉及重建;第三部分介绍算法的后续或许开展方向。

讲演纲要:

  1. 人脸重建的布景和首要技能道路介绍
  2. 在移动端实时进行人脸重建技能介绍
  3. 人脸技能当时的局限性以及未来开展方向

除了以上嘉宾共享的**「音视频技能前沿」外,本届大会策划的专题还包括「大模型与AIGC、云原生实践、前端工程实践、前端未来、分布式云和边际计算、可观测性探究、低代码技能实践和立异运用」等数十个技能专场,这些议题由来自字节、腾讯、FFmpeg、哗哩哗哩、阿里巴巴、小红书**等公司具备技能影响力与洞察力的职业专家担任把控。现在大会出品人已悉数集齐,讲师阵容也行将承认完毕。

约请你 线下参会

扫描下方购票,购买线下门票的同学即可获得【在吗?在码!】开发者大会系列定制T恤。

扫码购票:

追求极致,一起聊聊2023音视频技术如何发展?

购票后请填写问卷:

追求极致,一起聊聊2023音视频技术如何发展?

约请你 线上预定

扫描下方二维码进入直播预定界面,点击「预定直播」,预定2023稀土开发者大会主论坛,即可参加极米投影仪抽奖。

抽奖链接:

追求极致,一起聊聊2023音视频技术如何发展?

微信群

追求极致,一起聊聊2023音视频技术如何发展?