大盘点 | 2020年5篇图像分割算法最佳综述

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者丨cynthia yawain

编辑丨极市平台

本文为极市平台原创整理,转载请联系极市小编。

导读

 

本文为我们对2020年全部计算机视觉综述论文分方向梳理第二篇,图像分割方向。内容包含2014-2020年图像分割算法、实时语义图像分割方法、语义分割中的无监督自适应研究以及语义分割损失函数等综述。

引言

在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步。去年上半年,极市曾盘点过计算机视觉领域综述论文,并进行了分类整理,得到了很多读者的支持。因此,在2021年初,我们对2020年出现的全部计算机视觉综述论文进行了分方向梳理,希望能帮助大家学习进步。上周,我们盘点了2020年目标检测算法综述,本文是第二篇,图像分割方向。

注:文章将同步更新于Github上,欢迎大家 star/fork(点击阅读原文即可跳转):
https://github.com/extreme-assistant/survey-computer-vision

综述一

【1】使用深度学习进行图像分割:综述

标题:Image Segmentation Using Deep Learning: A Survey
作者:Shervin Minaee, Demetri Terzopoulos
链接:https://arxiv.org/abs/2001.05566

本文梳理了172篇相关文献。

最近,由于深度学习模型在各种视觉应用中的成功,已经有大量旨在利用深度学习模型开发图像分割方法的工作。本文提供了对文献的全面回顾,涵盖了语义和实例级分割的众多开创性作品,包括全卷积像素标记网络,编码器-解码器体系结构,多尺度以及基于金字塔的方法,递归网络,视觉注意模型和对抗环境中的生成模型。本文研究了这些深度学习模型的相似性,优势和挑战,研究了使用最广泛的数据集,报告了性能,并讨论了该领域有希望的未来研究方向。

2014年至2020年基于DL的2D图像分割算法的时间轴。橙色,绿色和黄色块分别表示语义,实例和全景分割算法。

DeepLabV3在样本图像上的分割结果。

U-net模型。蓝色框表示具有其指定形状的要素地图块。

DeepLabv3 +模型。

以mIoU和平均准确度(mAcc)表示,NYUD-v2和SUN-RGBD数据集上的分割模型的性能。

综述二

【2】 A Survey on Deep Learning Methods for Semantic Image Segmentation in Real-Time

标题:深度学习实时语义图像分割方法综述
作者:Georgios Takos
链接:https://arxiv.org/abs/2009.12942

本文共梳理了9篇相关文献。

语义图像分割是计算机视觉中增长最快的领域之一,具有多种应用程序。在许多领域,例如机器人技术和自动驾驶汽车,语义图像分割至关重要,因为语义分割为基于像素级别的场景理解提供了采取动作所需的必要上下文。此外,医学诊断和治疗的成功取决于对所考虑数据的极其准确的理解,并且语义图像分割是许多情况下的重要工具之一。深度学习的最新发展提供了许多工具来有效地解决这一问题,并且提高了准确性。这项工作对图像分割中的最新深度学习体系结构进行了全面分析,更重要的是,它提供了广泛的技术列表以实现快速推理和计算效率。

完全卷积网络架构:

DeconvNet体系结构:

比例感知语义图像分割架构:

Cityscapes像素级语义标签任务最佳表现模型:

Cityscapes像素级语义标签实时任务最佳表现模型:

综述三

【3】Unsupervised Domain Adaptation in Semantic Segmentation: a Review
标题:语义分割中的无监督自适应研究进展
作者:Marco Toldo,  Pietro Zanuttigh
链接:https://arxiv.org/abs/2005.10876

本文共梳理了120篇相关文献。

本文的目的是概述用于语义分割的深度网络的无监督域自适应(UDA)的最新进展。这项任务引起了广泛的兴趣,因为语义分割模型需要大量的标记数据,而缺乏适合特定要求的数据是部署这些技术的主要限制。

最受欢迎的用于语义分割的UDA策略的维恩图。每种方法都属于代表使用的自适应技术的集合。

从分类(稀疏任务)到语义分割(密集任务)的一些样本图像上一些可能的视觉任务的概述。

可以在不同的空间执行域移位自适应:输入级别,功能级别和输出级别。

综述四

【4】A survey of loss functions for semantic segmentation
标题:语义分割损失函数综述
作者:Shruti Jadon
链接:https://arxiv.org/abs/2006.14822

本文共梳理了23篇相关文献。

本文总结了一些众所周知的损失函数,这些函数广泛用于图像分割,并列出了使用它们可以帮助快速,更好地收敛模型的情况。此外,本文还引入了新的log-cosh骰子损失函数,并将其在NBFS头骨分割开源数据集上的性能与广泛使用的损失函数进行了比较。 本文还展示了某些损失函数在所有数据集上都能很好地发挥作用,并且在未知的数据分发方案中可以被视为很好的基准选择。

语义分割损失函数的类型

二元交叉熵损失函数图。在这里,熵在Y轴上定义,事件的概率在X轴上。

语义分割损失函数的附表。

综述五

【5】A Survey on Instance Segmentation: State of the art
标题:实例分割技术综述
作者:Abdul Mueed Hafiz, Ghulam Mohiuddin Bhat
链接:https://arxiv.org/abs/2007.00047

本文共梳理143篇相关文章,由克什米尔大学的学者发布。

目标检测或定位是从粗略到精细的数字图像推断的增量步骤。它不仅提供图像对象的类别,而且还提供已分类图像对象的位置。该位置以边界框或质心的形式给出。语义分割可通过预测输入图像中每个像素的标签来进行精细推断。每个像素根据其所在的对象类别进行标记。为进一步发展,实例分割为属于同一类的对象的单独实例提供了不同的标签。因此,实例分割可以被定义为同时解决对象检测和语义分割问题的技术。在这份关于实例分割的调查论文中,讨论了实例分割的背景,问题,技术,演变,流行的数据集,相关技术以及最新范围。本文为那些希望在实例分割领域进行研究的人提供了宝贵的信息。

对象识别的演变:从粗略推断到细粒度推断:(a)图像分类,(b)对象检测或定位,(c)实例分割,(d)语义分割。

实例分割中重要技术的时间表

下图为PANet框架。(a)FPN主干。(b)自下而上的路径扩充。(c)自适应功能池。(d)盒支。(e)全连接融合。

Microsoft COCO数据集上值得注意的实例分割工作

以上是对2020年发布的图像分割方向的综述论文的总结梳理,如有遗漏和不足之处,欢迎大家在评论区补充建议。在下篇,我们将对2020年医学影像方向的综述论文进行梳理。

在3D视觉工坊后台回复关键词“图像分割”,即可打包下载上述论文。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

3D视觉工坊 CSDN认证博客专家 算法 3D视觉
个人公众号:3D视觉工坊。公众号特邀嘉宾及合伙人,先后就职于国内知名研究机构、自动驾驶公司、海康研究院,主要研究方向为深度学习、目标检测、语义分割、图像处理、自动驾驶感知算法等,CSDN博客专家。博主先后任职于国内知名研究院、知名大厂,致力于3D视觉算法、VLAM算法开发,涉及相机标定、手眼标定、结构光、点云后处理、三维重建等相关领域的研究,同时也是CSDN博客专家。3D视觉工坊坚持原创,近一年来输出了非常多的高质量文章,获得了粉丝的一致好评,我们将始终坚持走原创路线,打造一个铁杆粉丝的聚集区。
已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 书香水墨 设计师:CSDN官方博客 返回首页
实付 49.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值