ECCV2020|AI把视频里的你抹掉了!效果丝滑,毫无痕迹,还能完美去水印

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

来源:机器之心

一言不合就被从视频中完全抹掉,要怎么证明你来过?

画面中的人物,骑着白马飞驰,却在跨栏的一瞬间突然消失,这一定是穿越时空才有的情节?

‍在公园中旋转起舞的女孩,转身间消失无踪:


‍街道上行驶的汽车,几秒内驶入虚空:

现实世界中,我们大概率不会亲眼目睹这些场景(太过灵异)。在传统影视制作流程中,「消失」或「隐身」特效需要依靠多段视频叠加处理,工艺相对复杂。

第一次看到哈利波特穿隐身衣的罗恩:惊讶. gif。

近日,弗吉尼亚理工大学和 Facebook 的研究者提出了一种基于流的视频补全新方法,在视频去水印、物体移除、画面扩展等方面均有着出色的表现。该研究已入选 ECCV 2020。

论文链接:https://arxiv.org/pdf/2009.01835.pdf

图灵奖得主 Yann LeCun 也在推特上推荐了这项研究:

视频补全(video completion)任务是用新合成的内容填充给定的时空区域。它有很多具体应用,包括修复(去除划痕)、视频编辑、特效处理(去除不需要的对象)、去水印以及视频稳定化等。新合成的内容应该无缝嵌入视频中,使得更改不被察觉。

视频补全任务是具有挑战性的,需要确保补全后的视频在时间上是连贯的(不会闪烁),同时还要保留动态摄像机的运动和视频中复杂的物体运动。

直到几年前,大多数方法都还使用基于补丁的合成技术。这些方法通常合成速度很慢,并且合成合成新内容的能力有限,因为它们只能重新混合视频中已有的补丁。

近来,基于学习的技术实现了更合理的合成效果。但是由于视频占用的内存较高,基于 3D 时空核的方法存在分辨率上的问题。迄今为止,最成功的方法是基于流的。他们一起合成色彩和流,沿着流的轨迹传播颜色,以提升视频的时间连贯性。从而减轻内存占用问题并实现高分辨率输出。这项新研究也采用了这种通用方法。

使用基于流的方法获得良好结果的关键是准确的流补全,尤其是沿着目标边缘合成高度精确的流边缘。但是,之前的方法都无法做到这一点,常会产生过度平滑的结果。尽管使用这种方法在背景平坦的情况下可以顺利地删除整个目标,但如果情况复杂一点,这些方法就会崩溃。例如,现有的方法难以很好地补全部分可见的动态对象(图 1b–c)。值得注意的是,这种情况在补全静态屏幕空间掩码时经常发生。

在这项新研究中,研究者通过显式地补全流边缘来改进流补全,然后再使用已经补全的流边缘来指导流补全,从而产生具有精确边缘的分段平滑流(piecewise-smooth flow)(图 1d)。 

先前基于流的方法的另一个局限性在于,相邻帧之间的相连流向量只能形成连续的时间约束。例如,行走的人腿部是周期性运动,在此情景下,腿部中间的背景是反复可见的,但腿的横扫运动会阻碍形成的连续流轨迹到达(并填充)这些区域。

研究者通过在一组非局部帧中引入额外的流约束来解决这个问题,这就创造了跨越流障碍的捷径,并将颜色传播到视频的更多部分。以往基于流的方法是直接传递颜色值的,但受到光线变化、阴影、自动曝光、白平衡等因素的影响,颜色通常会随着时间的推移而产生微妙的改变。该方法通过也解决了这个问题。

总之,这篇论文通过以下几项改进克服了基于流的视频补全算法的一些局限:

1. 流边缘:通过显式地补全流边缘,研究者得到了分段平滑的流补全。

2. 非局部流:利用非局部流来补全无法通过可传递流(transitive flow)补全的区域;

3. 无缝融合:通过在梯度域中执行融合操作来避免可见的接缝;

4. 内存高效:研究者提出的方法可以处理 4k 分辨率的视频,而其他方法会因为 GPU 内存需求过大而失败。

他们在 DAVIS 数据集上验证了所提方法的有效性。定量和定性结果都表明,本文提出的方法优于 SOTA 方法。

算法概览

在这篇文章描述的方法中,模型的输入是一个彩色视频和一个二元掩码视频,后者用来指示视频的哪些部分需要合成,如图 2a 所示。

图 2:算法概览。

研究者将掩码像素称为缺失区域,其他像素称为已知区域。该方法包含以下三个步骤:

1. 流补全。研究者首先计算了相邻帧以及一组非相邻(non-local)帧之间的前向流和后向流,然后补全这些流场(flow field)的缺失区域。由于边缘通常是流映射中最显著的特征,因此研究者首先提取并补全这些边缘。接下来,他们利用补全之后的边缘来生成分段平滑的流补全(见图 2b)。

2. 时间传播。接下来,研究者沿着流轨迹为每个缺失的像素传播一组候选像素。通过链接前向流向量和后向流向量,他们得到了两个候选像素,最后又得到一个已知的像素。利用非局部流向量,通过对三个时间间隔较大的帧进行检验,研究者又得到了另外三个候选像素。他们为每一个候选像素估计了一个 confidence score 和一个二元有效性指标(见图 2c)。

3. 融合。研究者使用一个置信加权平均将每个缺失像素的候选像素与至少一个有效候选像素融合。他们在梯度域内进行这种融合,以避免可见的颜色接缝(见图 2d)。

如果经过这个过程之后还有缺失的像素,就意味着它们不能通过时间传播来填充(比如在整个视频中都被挡住的像素)。为了解决这一问题,研究者选择了一个关键帧(包含大部分仍旧缺失的像素)并利用一种单张图像补全的技术来补全这些像素。他们利用得到的结果作为上述流程新一轮迭代的输入。这种空间补全步骤保证他们在每次迭代中都取得进展,而且每一次得到的结果都会被传播到视频的其余部分,以便在下一个迭代中强制保持时间一致性。

实验结果

下表 1 展示了静态掩码图像补全方法和目标掩码图像补全方法在视频补全任务中的结果。研究者所提出的方法在 3 项指标中都显著超越了之前的 SOTA 方法。

下图 7 展示了两种掩码图像补全技术的定性结果。

关于论文的完整介绍可以参见以下视频:

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

 • 2
  点赞
 • 1
  评论
 • 5
  收藏
 • 一键三连
  一键三连
 • 扫一扫,分享海报

相关推荐
<p> <span style="color:#337FE5;"><strong>【为什么需要学习C++?】</strong></span> </p> <p style="margin-left:0cm;"> 是否接触很多语言但从来没有解过编程语言本质? </p> <p style="margin-left:0cm;text-align:start;"> 是否想成为一名资深开发人员想开发别人做不高性程序? </p> <p style="margin-left:0cm;text-align:start;"> 是否经常想要窥探大型企业级开发工程思路但苦于没有基础只望洋兴叹? </p> <p style="margin-left:0cm;text-align:start;">   </p> <p style="margin-left:0cm;text-align:start;"> 那么C++就是个人力提升职业之路进阶不二之选。 </p> <p style="margin-left:0cm;text-align:start;"> <br /> </p> <p style="margin-left:0cm;text-align:start;"> <br /> </p> <p style="margin-left:0cm;"> <strong><span style="color:#337FE5;">【课程特色】</span></strong> </p> <p style="margin-left:0cm;text-align:start;"> 1.课程共19大章节239课时内容涵盖数据结构、函数、类、指针、标准库全部知识体系。 </p> <p style="margin-left:0cm;text-align:start;"> 2.带从知识与思想层面从0构建C++知识框架分析大型项目实践思路打下坚实基础。 </p> <p style="margin-left:0cm;text-align:start;"> 3.李宁老师结合4大国外顶级C++著作精华为大家推出《征服C++11》课程。 </p> <p style="margin-left:0cm;text-align:start;"> <br /> </p> <p class="ql-long-24357476"> <span style="color:#337FE5;"><strong>【学完后我将达到什么水平?】</strong></span> </p> <p class="ql-long-24357476"> 1.对C++各个知识够熟练配置、开发、部署; </p> <p class="ql-long-24357476"> 2.吊打一切关于C++笔试面试题; </p> <p class="ql-long-24357476"> 3.面向物联网“嵌入式”和面向大型化“分布式”开发掌握职业钥匙握行业先机。 </p> <p class="MsoNoSpacing" style="margin-left:18pt;"> <br /> </p> <div> <br /> </div> <p> <br /> </p> <p style="margin-left:0cm;text-align:start;"> <span style="color:#337FE5;"><strong>【面向人群】</strong></span> </p> <p style="margin-left:0cm;text-align:start;"> <span style="color:#222226;font-family:PingFangSC-Regular, "font-size:14px;background-color:#FFFFFF;">1.希望一站式快速入门C++初学者;</span> </p> <p style="margin-left:0cm;text-align:start;"> <span style="color:#222226;font-family:PingFangSC-Regular, "font-size:14px;background-color:#FFFFFF;">2.希望快速学习 C++、掌握编程要义、修炼内功开发者;</span> </p> <p style="margin-left:0cm;text-align:start;"> <span style="color:#222226;font-family:PingFangSC-Regular, "font-size:14px;background-color:#FFFFFF;">3.有志于挑战更高级开发项目成为资深开发工程师。</span> </p> <p style="margin-left:0cm;text-align:start;"> <br /> </p> <p> <br /> </p> <p> <span style="color:#337FE5;"><strong>【课程设计】</strong></span> </p> <p> 本课程包含3大模块 </p> <p> <strong>基础篇</strong><br /> 本篇主要讲解c++基础概念包含数据类型、运算符等基本语法数组、指针、字符串等基本词法循环、函数、类等基本句法等。 </p> <p> <br /> <strong>进阶篇</strong><br /> 本篇主要讲解编程中常用一些技包含类高级技术、类继承、编译链接和命名空间等。 </p> <p> <br /> <strong>提升篇:</strong><br /> 本篇可以帮助学员更加高效进行c++开发其中包含类型转换、文件操作、异常处理、代码重用等内容。 </p> <p> <img src="https://img-bss.csdnimg.cn/202007091130239667.png" alt="" /> </p>
©️2020 CSDN 皮肤主题: 书香水墨 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值