ai可以修复声画,也能修复回忆吗视频

作者何思思

编者按林觉民

有一种叫Beyond的感情。 黄家驹一开口,谁的DNA动了?

7月3日19点,“Beyond Live 1991生命接触音乐会精选& 纪念演唱会精选超清修复版》在嘀嘀打车、西瓜视频、今日头条等多个平台再次上映。 时隔31年,Beyond再次进入了大众的视野。

“今天只有残存的肉体在灿烂的岁月风雨中拥抱着自由”,这句话瞬间把beyond 1991年9月在中国香港红矶体育馆举办的“Beyond Live 1991生命接触音乐会”带回到了人们的脑海,那场音乐会也是Beyond Live 1991

这次的修复版音乐会是《光辉岁月》、《海阔天空》、还有《不再犹豫》.1.4亿在线观众的经典歌曲。 活动结束后,很多人在评论区说:“我没有看够。 再播放一次。 在哪里可以下载高清版的视频”等消息,向经典致敬,向Beyond致敬。

不仅充满了情感和回忆,而且在演唱中,可以感受到在画面亮度、色彩饱和度、音质降噪等方面,在线音乐会的收视效果得到了很大的恢复,火山引擎参与了这场音乐会的修复,在算法的支持下,观看了

对于嘀嘀打车和火山引擎来说,其使命不是修复演唱会,提高画面的清晰度和可视性,而是通过修复唤起几代人背后的回忆,产生共鸣,擦出火花,这才是修复的价值。

时隔31年,年轻的Beyond回来了

各短视频平台都频繁出现修复版电影的重映,这也成为表达人们敬意的经典最佳方式之一,其背后往往需要AI技术的加持。

AI修复电影已经不是新鲜事了,随着技术的反复更新,最近AI修复音乐会成为了新的风口。 从修复类型来看,两者都属于视频修复范畴,但存在较大差异。

火山音响技术团队研究员舒晓峰表示,电影和演唱会的内容和制作方法存在很大差异,其中演唱会以歌曲的形式输出,现场环境比电影环境更复杂,不仅有环境声音,还有歌声,而且与拾音设备也有一定的距离,所以演唱会的

值得注意的是,屏幕决定了音乐会的整体外观,因此是音乐会修复的重要一环。

火山引擎多媒体实验室研究员赵世杰告诉雷峰网,演唱会的画质修复并不像大家想象的那么简单。 以Beyond Live 1991生命联络音乐会为例,当时音乐会整体环境较暗,细节不够丰富,场景切换迅速,灯光声音环境复杂等,给修复工作带来了严峻的挑战,算法

赵世杰表示,在早期视频设备分辨率比较低、拍摄画面分辨率低、清晰度差、画面往往模糊、纹理缺失的压缩存储中,早期的电影隔行扫描方式会导致条纹缺陷问题,画面的美观和完整性

此外,色彩、亮度也是修复的一大难点,由于原始摄影设备的原因,电影中存在大量的曝光过度和死黑场景,如何避免亮度调整中的低噪声放大,如何降低高噪声带来的不适感

其实在画质修复的环节中,最难的是人脸,这也是观众最在意的一点。 在音乐会中,人脸往往会出现多个角度,如脸的正面、侧脸、俯视脸、仰视脸等。 也有被乐器遮住的人的脸。 如何调节不同的景色,用不同的姿势修复人脸的效果,不同的背景给算法带来了严峻的考验。

针对这些问题,赵世杰向雷峰网阐述了火山发动机增强算法的应对之道:

在分辨率修复方面,基于经过大量数据训练的深度学习算法,火山引擎通过提高分辨率和缺陷修复技术将视频分辨率从低分辨率处理更改为超高分辨率,从而在纹理不足的区域产生更丰富的细节。

同时,针对隔行扫描的视频画面,火山引擎多媒体实验室设计了多帧输入的神经网络去交织方法。

赵世杰特别强调,这主要是由于早期视频大多采用隔行扫描方式处理、编码和显示,在现代机器直接播放过程中会引起严重的闪烁现象。 这主要是因为隔行信号,两行只有一行图像,另一行是黑色的,所以为了将隔行信号转换成逐行信号需要进行隔行处理。

在这种情况下,在传统解交织方案中,输入仅是单个交织帧,时域中的内容变化感知较差,因此对运动场景的拉伸情况的响应较差。

与传统的隔行扫描方式相比,火山引擎设计的多帧输入神经网络隔行扫描方法实现了传统隔行扫描方法无法达到的技术效果,凭借其通用性特点,出现在Beyond演唱会中更多的细节和运动场景

前后对比效果表明,演奏者手中原本存在横纹拉丝问题,画面模糊,但经过修复,无论是钢琴还是人手画面,现场的真实感和亮度都得到了完美的恢复。

在亮度、颜色修复方面,针对Beyond演唱会中存在的老视频褪色、颜色异常、曝光过度、太暗等问题,火山引擎采用了基于美学分数的自适应区域颜色亮度增强算法。

该算法主要以具体的视频源效果为基础,基于美学评价,在颜色、亮度、对比度、饱和度、人物ROI和背景方面进行分区增强,根据不同帧的颜色统计信息进行自适应亮度增强,使得亮区域和暗区域都达到最高

在脸部修复中,在音乐会的许多场景中脸部存在较大的颜色噪声、压缩损伤等问题。 另外,据了解,目前行业大部分的面部修复只是基于一张照片,很难找到基于视频的面部修复。 由于视频中每帧的人脸角度都不一样,因此需要对各种姿势下的人脸进行算法处理。

火山引擎重点突破,基于深度学习模型,采用自适应人像增强算法对Beyond音乐会进行修复。 通过先验特性,在消除人脸模糊和压缩损伤的同时还可以重建五官,重建和添加头发等细节和纹理,进行不同景色、不同姿势的人脸修复工作,使人脸更加清晰。

从整场音乐会的主观感觉来看,修复后的画面更加清晰逼真。

评论区有用户的评论,修复后的演唱会有现场观看的感觉,歌手的脸和乐器的舞台等细节清晰可见,感觉像置身于Beyond Live 1991的生活事件中。

时隔31年再现的Beyond的歌声不会减少“演唱会”

很多人认为高解析度的音质会提高整个音乐会的完整性和精致度,观众的外观也会大幅提高。

在Beyond这样能唤起人心情的古典音乐会上,修复的好处很受欢迎,修复的坏处可能是悲剧。

在Beyond这场音乐会的修复过程中,音质也给修复带来了一定程度的困难挑战。

舒峰向雷峰网介绍了音质修复的难点:

第一,录音设备和环境的噪音会导致音质下降,根据周边环境的不同,会有低噪声被录音;

其二,由于设备压缩算法等导致的截止效率降低导致带宽不足的问题

第三,混响过大会导致音质变差,响度问题会带来听觉不舒服等问题。

为此,火山引擎音视频技术团队进行了针对性的研究,并给出了相应的解决方案。

首先,关于噪声干扰问题,舒晓峰表示,目前行业大多采用传统的降噪方式,但其特点主要应用于人声,音乐经过降噪算法处理会受到一定程度的损伤,但音乐会混杂着人声、音乐声、现场环境声等

考虑到这一点,火山引擎开发了针对这种多因素场景的音频降噪算法。 与传统的消噪方案不同,它与音乐场景和人声场景兼容,能够在保留人声、音乐声的情况下抑制其他噪声。

其次,带宽也是影响音乐会音质的重要因素。 舒峰告诉雷峰网,演唱会期间由于拾音装置、录音硬件或压缩等原因导致高频信息受损,影响听觉体验感。 在此基础上,火山引擎通过音频超分辨算法,对人声部分进行频带扩展,在不破坏音质的情况下丰富高频信息,使声音在蒸后更加明亮。

从频谱图中可以看出,通过超分模块的处理,原始音频的高频部分得到了扩展和增强。

另外,音乐会经常伴随着乐器的声音、观众的欢呼声、现场各种各样的大声音和小声音。 火山引擎通过响度算法对歌曲部分进行单独提取和调整,然后最后混合,使人声和其他声音的音量配比更加舒适,提高观众的听觉感受。

值得注意的是,这次修复音乐会由1991年的生命接触音乐会和纪念音乐会两部分组成。 舒峰表示,这大大增加了修复难度,为了避免两部分音量不同,对两个音乐会的衔接部分进行了响度调整,另外对前后两部分不同歌手的音量大小也进行了响度调整,大大提高了听觉体验。

不少观众表示,通过Beyond演唱会的重映,不仅画面清晰,在音质上也体验到了在线听演唱会的听觉感受。

旧视频修复,Beyond之后是谁?

AI修复视频成为近两年许多厂商感兴趣、费时费力的一件有意义的事情,也成为许多平台新的增长极。

在视频的修复中,实际上火山引擎从去年开始有了动作。 去年10月,西瓜视频( Sky Video )联合火山引擎发布了“经典视频4K修复计划”。 不到一年,通过AI技术的手段完成了100部经典动画的修复。 其中包括71部电影的4K修复,童年记忆《葫芦兄弟》的播放次数达到了300万次。

火山引擎能够完成如此高质量的修复任务,主要是视频云方面的技术积累和成功实践。 同时,嘀嘀打车、西瓜视频(西瓜视频)、今日头条等不同场景提供了试验田。

据介绍,火山引擎视频云通过技术积累,可以负责用户的四种体验,包括交互、播放、画质、性能四种体验感。 在优秀的用户体验下,火山引擎音视频技术已经渗透到游戏、电子商务、教育、金融等行业。

旧视频的修复才刚刚开始,从经典动画到音乐会,再到更多经典视频的修复,都需要不断的技术迭代来实现。

剪辑教程

推荐6个小众的软件工具下载,推荐6个小众的软件工具

2022-11-11 2:45:43

剪辑教程

韩国八个人的女子组合,韩国人气最高的女子组合

2022-11-11 2:50:52

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索