不知不觉,如火如荼的世界杯已经落下帷幕。
决赛夜一波三折,最终阿根廷队如愿拿下队史第三冠。
【资料图】
特别是一边看到梅西终于捧起大力神杯,一边听着解说员煽情的讲述时,相信很多人都为之动容。
说到解说,今年世界杯,大家是在哪个平台看的呢?
是庄重优雅的央视,还是轻松热闹的咪咕?又或者是在玩法颇多、星光璀璨的抖音?
无论哪个平台,相信大家都能收获属于自己的感动。
不过呢,今年小编在抖音看比赛时,还收到了另外一份感动。那就是抖音上线的“无障碍字幕”直播间。
它让听力有障碍的朋友也能通过字幕更好地掌握场上动态,同时感受到解说员分析、点评时的那份激情。
而这样一个“无障碍字幕”直播间的背后,还有一个可能被我们忽视的功臣,那就是火山引擎。
具体是怎么回事呢?下面IT之家详细和大家说说。
无障碍字幕直播间,激情下的一抹温柔
我们知道,观看体育比赛是一个需要声画配合的过程,特别是结合解说员的分析和点评,才能更深入地了解场上战况。
但一直以来,对于听力障碍的朋友来说,这样的体验却成为奢侈。
不过,今年世界杯,如果你是在抖音平台上观看比赛直播,就可以在不同的直播间选项中看到“无障碍字幕”的直播间。
这个直播间,不仅提供比赛直播的声音和画面,还能够将主持人、解说员所说的话实时转写成文字字幕。
要知道,这可是直播,让转写员人工手打输出字幕,显然不现实。
我们需要借助 AI 的力量。
而火山引擎,采用火山同传的创新 AI 字幕方案,
它工作的流程是:
先接到直播流,然后对其中的语音信号进行实时识别和转写,输出 AI 流式字幕。接着,翻译员可以在延时的 30 秒内对 AI 字幕进行人工二次校对,最后整句推出字幕。
这个过程中,AI 对语音的精准快速识别是基础。因此,火山语音团队特别对足球领域专有名词、球队和球员名称等术语进行了专项优化,从而提高了 AI 模型识别的准确率。
而且,他们还对大量足球解说场景的音频特征做了分析,并进行模型调优,所以能保证在有背景音的情况下也能清晰地识别人声。
由此,“无障碍字幕”的直播间可以在“低延时”的情况下输出“更精准”的字幕,从而给观众带来更优质的观看体验。
还有在字幕呈现上,火山同传还进行了样式优化,用精心设计的、更清晰的双行字幕,让大家在长时间看字幕时,不会觉得疲惫。
总之,他们不仅是做了实时字幕的功能,还在尽可能将字幕呈现、观看的各方面体验做好,让听障用户真正能够更舒适地享受这四年一届的足球盛宴。
数据显示,截至 12 月 6 日,世界杯无障碍字幕直播间累计观看超过了 1800 万次。
插一句,这里面可能不只是听障人士在用,对于普通用户来说,当他们身处需要安静的环境,不方便听解说时,这个功能也能带来方便。
但更重要的,肯定是对于听障人士的意义。
据世界卫生组织的统计,全球有超过 4 亿的听障人士,而我国就有近三千万人,是最多的。他们当中无论是不是球迷,相信绝大多数都会关注世界杯这个全民讨论的赛事。但是,听力上的障碍却大大影响了他们在观赛过程中对信息的获取和理解。
而且,除了世界杯,日常生活中他们也有观看其他文娱节目、收听海量资讯的需求。听障,却成为一条鸿沟。
从这个角度说,火山引擎的这套技术方案,不单单是能帮助他们解决当下观看世界杯问题,在更多的场景中,也有值得推广的社会意义。
它就像是这个世界杯激情下的一抹温柔,为体育赛事直播注入人文关怀的同时,也让很多人在这个冬季,感受到被关注的温暖。
这不正是科技“以人为本”的体现吗?
无障碍直播外,火山引擎也让更多人看得更爽
其实,除了无障碍直播,这届世界杯,火山引擎所做的还有更多。
他们是这次抖音平台世界杯直播的主力技术服务商。不仅如此,火山引擎还为央视频全程提供超高清、低延时的直播技术支持。
此外 PICO 端世界杯超高清低延时沉浸式直播也是火山引擎在支持。
总之,很多地方都能看到它的影子。
而它为我们带来的,首先是更出色的直播品质。
这届世界杯,大家能观赏到更高清晰度的比赛画面,还有更出色的 HDR 效果、更逼真的色彩,更饱满的球场和解说音质……
一路看过来,小伙伴们应该有被爽到吧。
火山引擎是怎么做到的呢?
第一,是在清晰度上。今年火山引擎支撑抖音世界杯直播实现了业内首次面向公众移动设备、大规模提供超高清画面。
他们通过自研的 BVC 编码器和高清低码算法深度还原了赛场细节,让球迷在手机上体验到大屏广电级观赛画质。
第二是比赛直播的流畅稳定性上。
以这次世界杯决赛为例,抖音直播间最高同时观看人数达到了超 3700 万的历史峰值,而火山引擎依托全域覆盖的边缘云资源、高效连接的协同网络以及海量算力资源,支撑抖音顺利通过了世界杯直播的全部流量大考。
根据火山引擎给出的数据,他们支撑各转播平台带宽峰值已接近 50Tbps ,创下新高。
能有如此稳妥的应对能力,一方面是火山引擎准备充分,他们构建了“秒级监控、1 分钟级响应、3 分钟止损”的保障 SOP 体系。
另一方面,也是依靠火山引擎边缘云强大的应对力能做基础,它拥有全域覆盖的边缘计算节点,提供 1-40ms 网络接入与数据卸载能力,还有百 T 级的边缘资源储备、过亿级别的 QPS 并发能力。这些足够支持用户在最高峰的时候稳定流畅地看完比赛,完成互动。
还有,直播的延迟同样也是影响体验的重要因素。
针对今年世界杯赛事直播,火山引擎首次用上了 RTM 低延迟直播技术。这项技术在提供大规模分发能力的同时,还能实现直播画面的端到端延迟最低降至 1s 左右。
所以,大家在屏幕前看到的比赛画面,几乎就是与卡塔尔比赛现场同步的,更加身临其境。
大家在获得更具沉浸感的直播声画品质的同时,进一步又会追求观看直播时的参与感,互动感,这是更高阶的观赛体验。
而火山引擎也通过对应的技术解决方案一并给到了大家。
例如很多朋友在抖音平台观看比赛时非常喜欢的“边看边聊”功能,可以在直播间里创建专属“好友聊天区”,和天南地北的朋友一起组局看球,不仅可以文字聊,还能语音聊,比赛的精彩时刻也可以一键分享给朋友,属实是把互动感给拉满了。
而这个功能背后,则得益于火山引擎 RTC(实时通讯)技术的加持,它能够在百万级流量并发下,始终为用户提供高品质音频体体验。
当大家边看比赛边用音频聊天时,火山引擎 RTC 还通过音频托管结合自研智能 3A 算法,保证大家在外放场景下说话无回声,并提供自适应人声音量均衡、智能音频闪避等技术,从而在保证赛事最佳音质的同时,还能提供更清晰流畅的语音交流体验。
此次火山引擎还助力抖音,为平台上的足球类达人提供了虚拟演播平台,主播使用虚拟演播平台能够随时随地开启一场世界杯专属的赛事解说直播,打破了传统活动中对场地、设备以及时间的限制。主播坐在绿幕环境中,通过虚拟演播平台便可加载专属的虚拟解说厅场景,不仅能够省去线下搭建场景的时间和人力成本,还可以搭建出实际空间中无法复现的高品质、多元化的场景,通过火山引擎自研的各类算法,实现软件的像素级抠像、实时渲染的高精 3D 场景、映射人物和虚拟场景的空间关系,增强真实感,让主播和观众仿佛身临其境。
可以说,这些技术带来的功能、创造的沉浸感体验,陪伴我们度过了整个世界杯赛程。正因为这样的体验,我们才能如临现场般看清每一个精彩瞬间,和现场观众同步庆祝支持球队胜利的喜悦,也得以和球友们一起观赛,大聊特侃,彻底尽兴……
超视频时代到来,火山引擎视频云实力秀肌肉
世界杯,如同一个绝佳的试验场,它让我们看到,在新时代里,视频内容的精彩呈现有多重要。
而这个新时代,我们可以称之为“超视频时代”。根据中国互联网信息中心发布的第 48 次《中国互联网络发展状况统计报告》,截至 2021 年 6 月,中国短视频用户规模已经达到 8.88 亿,短视频应用人均单日使用时长已超 120 分钟。
同时,IDC 在其《超视频时代视频云演进趋势》白皮书中也指出,当今时代已经经历了长视频、短视频与直播应用阶段,进入超视频时代。
无论是直播带货还是短视频信息流的泛滥,再到移动会议、办公、远程教育、医疗等各行各业,各种场景,视频都正成为信息传递的新一代高速公路,同时也是千行百业都在挖掘的新时代生产力。
消费者也对视频内容产生了新的需求,高清化、交互性、沉浸式等体验都为视频内容提供者带来了新的挑战。
此背景下,视频云建设已成为大势所趋,将视频云能力应用到千行百业,成为商业与技术的新赛道。
而火山引擎,这家字节跳动旗下的云服务平台,很早就通过自身在视频应用领域天然的积累和创新,构建了完整的视频云产品矩阵。
根据今年 2 月火山引擎公布的最新视频云产品矩阵,他们已经形成一个包含泛互联网、游戏、金融、广电等场景,视频点播、veImageX、实时音视频等核心产品,以此构成完整的解决方案。最底层的核心中台,则是火山引擎在服务抖音、西瓜视频等优秀应用积累和沉淀下来的技术能力,覆盖网络传输、智能生产和智能处理全链路的能力。
而细分到每一项能力方面,火山引擎视频云也有对应的技术优势。
比如在编码方面,火山引擎的 BVC 系列编码器在视频编码器全球顶级赛事 MSU2020 中获得 17 项冠军;在视频播放体验上,火山引擎拥有独创的“零首帧”优化,实现短视频首帧起播小于 100ms,长视频首帧起播小于 400ms,带来无感知的流畅播放体验。
还有我们前面在介绍火山引擎提供世界杯直播服务时,集中展现出来的各种领先技术能力……
而基于这些优势,火山引擎视频云也在为不同的行业提供极致的视频体验,并实现了很多优秀的商用落地案例。
比如今年 7 月,抖音、西瓜视频、今日头条、鲜时光 TV 上映的“Beyond Live 1991 生命接触演唱会”及纪念音乐会精选重映,引发 1.4 亿乐迷集体怀旧。
这背后,就是火山引擎视频云能力的一次成功应用,他们在画质受损修复、色彩还原、人像重建、运动补偿、音质修复等各方面展现出来的强大实力,惊艳外界的同时,也让人看到了这种技术广阔的应用前景。
再比如火山引擎和快看漫画的合作。现在很多“超新 Z 世代”喜欢在快看上看“漫剧”,这种全新的视频内容形式背后就有火山引擎视频云的助力。火山引擎视频云为快看“漫剧”创作提供了强大的视频编辑,推动 UGC 内容的繁荣,同时还为快看提供了零首帧的相关优化经验,提升了用户观看体验。
就拿这次用 PICO VR 一体机看世界杯来说,背后就是通过火山引擎视频云实现了超高清的比赛直播画面,并且还借助火山引擎 RTC 方案,为用户带来了可随位置、头部姿势变化而变化的空间音频,从而实现更好地 VR 观赛互动效果……
总之,一次次成功的商用落地,一次次出色的产业赋能,都让火山引擎在视频云赛道未来的表现更加令人期待。
结语
世界杯,已经结束。但属于视频云的时代,却刚刚开始。
古人说,人就是“乘于天明以视,寄于天聪以听”。“视听”是人类感受世界最基础的方式,而这样的方式,必将在新时代里迎来新的颠覆。
火山引擎视频云,就是要让人们看到的、听到的,能够以前所未有的深入和直接方式,感受到这个世界。
标签: 的情况下