【图像分割】图像分割专栏栏主自述：分割，我们究竟在研究什么？

2024-04-26 11:07:00

专栏《图像分割模型》已经完结，也是时候向大家正式介绍一下自己了。趁着新专栏刚刚开始，也借此机会聊聊在我眼中，我们做的分割究竟是什么，又该怎么做。

文/编辑 | 孙叔桥

我是谁

我叫孙叔桥，从14年开始从事计算机视觉研究，先后研究过目标检测、视觉跟踪、立体匹配和图像分割四个主要领域，对基于深度学习的图像处理的相关问题比较熟悉。

作为有三AI的专栏作者，我负责图像分割领域的相关文章。目前，已完结专栏《图像分割模型》，主要介绍在图像分割领域的主流网络结构及设计思想；正在进行中的专栏《图像分割应用》，旨在从应用角度分析各领域内的图像分割问题。

下面聊聊我是怎么开始计算机视觉的吧。其实，与其说是我选择了从事计算机视觉，不如说是计算机视觉找到的我。

入坑是从本科毕设开始的，题目是硕导定的，恰巧我也感兴趣，就这样一拍即合。要是早点知道这个研究方向会从本科一路陪我到博士，还火的一塌糊涂，我可能管管自己的性子，早早用功努力。

选题后不久我就去了国大做交换生，在新加坡的Universal Studio里，计算机视觉在我脑海里留下了第一批具体印象：虚拟视觉加小型过山车太爽了！飞下来救我们的变形金刚好帅！法老那个简直High翻天！

显然，在那个时候的我眼里，所有计算机+视觉的东西都属于“计算机视觉”，至于包括什么、应用领域、实现方法都还一无所知。

后来随着研究的慢慢深入，我慢慢接触了计算机视觉的几个细分领域，掌握的知识和技能也逐渐丰富。此时，计算机视觉与神经网络在我的脑海才真正算是有了点形态，其中的趣味也就慢慢显露了。

我眼中的AI和图像分割

经常有人问我，你是不是搞人工智能的啊？其实，这个问题我不知道该怎么回答。要说是吧，我做的东西其实是底层的技术，计算机视觉层面的东西，这东西我认为它自己是无法单独被称为“人工智能”的，所以我做的东西并没有人工智能这么庞大；但要说不是吧，计算机视觉确实是人工智能的重要一环，它是机器的眼睛，甚至能成为人类眼睛的延伸，确实某些应用领域下就属于人工智能。

后来，我就不纠结这个问题了。别人问我，我就回答“我做计算机视觉的”。要是提问者认为这个回答是肯定，那就是肯定；要是否定，那就是否定。

至于我为什么要做计算机视觉，我以后想不想做，倒是我经常问自己的问题。我深知，哪怕是计算机视觉随便拿出一个芝麻大的分支，也有太浩繁的知识、技巧、应用领域；以我的能力和精力，是不可能面面俱到的，我也不想。我只想用我能做到的事让日子过得轻松一些。

所以，AI和计算机视觉在我眼中，更像是夏天的空调、冬天的暖气，一个小工具罢了，更需要关注的反而是实际生活中遇到的问题和如何去解决。

目前所专注研究的图像分割恰巧是一个切入点。在我看来，图像分割所实现的功能更贴近于人类认知世界的结果。比如我们看到了一个杯子，其实是识别出了杯子所存在的整个空间，根据要实现的目的，我们选择性地是只利用“杯子”这个标签还是整个空间都利用上。举个例子，比如我们需要用杯子接水，那么只需要正确拿起杯子就可以了；但是如果要收拾桌面，则需要保证不会有其他东西砸在被子上面。这也是为什么我选择了图像分割。

即使图像分割已经是一个很具体的方向，但是其需要研究和学习的内容也非常庞杂。从传统的图像分割方法到基于深度学习的方法，其中涉及到的基础知识、网络模型、设计思想、代码实现等等，是一个交叉领域的学习过程，包括了数学、计算机、信号处理、优化等多个学科。公众号内发表的专栏更多的是让大家对这个领域有一定的了解，但是想要真正掌握图像分割的技术，还是需要实际的动手与操作的。

我与有三AI

AI公开课：19.04.18俞益洲—深睿医疗CS《计算机视觉的应用与落地》课堂笔记以及个人感悟

AI公开课:19.04.18俞益洲-深睿医疗CS<计算机视觉的应用与落地>课堂笔记以及个人感悟导读俞益洲,现为深睿医疗联合创始人.首席科学家(Chief Scientist ...
目前人工智能应用场景有哪些？开课吧

AI就是大家说的人工智能,即Artificial Intelligence,英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人工智能的理论.方法.技术及应用系统的一门新的技术科学. 目前人工智能应用 ...
人工智能与计算机视觉是什么关系？

计算机视觉与人工智能有密切联系,但也有本质的不同.人工智能的目的是让计算机去看.去听和去读.图像.语音和文字的理解,这三大部分基本构成了我们现在的人工智能.而在人工智能的这些领域中,视觉又是核心.大家 ...
Facebook利用10亿张社交软件图片，训练AI新算法

Facebook研究人员发布新的人工智能模型,该模型可以利用互联网上任何一组随机无标签图片进行学习. 来源丨Zdnet 作者丨Daphne Leprince-Ringuet 编译丨科技行者 Faceb ...
致敬五四｜CV青年说

CV青年说鲁迅先生曾说,青年"所多的是生力,遇见深林,可以辟成平地的,遇见旷野,可以栽种树木的,遇见沙漠,可以开掘井泉的". 青年是祖国的前途,民族的希望,是整个社会力量中最积极 ...
你想知道的这都有！一文带你快速了解计算机视觉

导语:计算机视觉(Computer Vision, CV)作为人工智能(AI)的核心技术之一,在过去的三十年里发展迅猛,应用范围遍及工业.农业.军事.国防等多个领域.本报告将一步到位,从基础概念到技术 ...
【Python进阶】Python进阶专栏栏主自述：不忘初心，砥砺前行

不忘初心不知道为啥,从小自己对IT有着莫名的兴趣,但由于自己的近视度数太高,爸妈十分反对我学计算机相关的专业,于是高考选择了汽车相关专业.可以说IT与汽车是我目前.也是未来最喜欢的两个专业方向.因此 ...
【NLP】 NLP专栏栏主自述，说不出口的话就交给AI说吧

有三师兄说要专栏主写自我介绍,小Dream哥并不长于辞藻,也没有什么可以炫耀的成绩,所以这事实属让我头疼,也只好硬着头皮简单聊一聊吧. paper和money都重要,也愿今后大家都在AI的学习中,找到 ...
【GAN优化】GAN优化专栏栏主小米粥自述，脚踏实地，莫问前程

今天是加入有三AI的第三期,给大家来个自我介绍,也聊一聊我的一些想法和体会. 作者 | 小米粥编辑 | 言有三随走随行其实我一直非常佩服那些有规划又努力的人,因为我是一个对自己没太多规划的人. ...
【图像分割模型】用BRNN做分割—ReSeg

这是专栏<图像分割模型>的第9篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 尽管许多人都知道RNN在处理上下文上多优于CNN,但如何将RNN用于分割任务还是值得讨论 ...
“不求上进”的动画UP主自述：其实“半吊子”刚刚好

编辑搜图请点击输入图片描述(最多18字) 这一期借机说说心里话. 编辑搜图请点击输入图片描述(最多18字) 动漫自媒体我已经做了5年之久,开始的几年是感觉在不断学习,买了也看了不少动画专门的书,希 ...
易·短评|美妆博主自述被男友家暴，那些非婚关系中的暴力行为该怎样定义？

最近,接连曝出两条关于家暴的新闻,知名美妆博主宇芽遭男友沱沱家暴.明星蒋劲夫又一次暴力对待女友,这样的新闻让人看着难过.要知道才过去的11月25日恰巧是"国际消除家庭暴力日"-- ...
注定在40岁这一年搞些事情？- 仙人球棚主自述

荒漠肉植记学知识.赏美图! (进入公众号,设置"星标",美文不错过!) 引言圈里人都愿意叫我兜叔,谢谢公众号小编邀请我分享一下这些年在多肉圈里的这些事,希望我这是抛砖引玉,未来 ...
主-客位视角对旅游者行为研究的启示

引言 20世纪以来,始于人类学研究的反思意识仍在广泛而深刻地影响着社会科学发展.这种反思意识主要包含:研究者本身在研究中的角色地位:研究问题的类别:研究者的背景(人种.性别.阶层.种族.国籍.意识形态 ...
伏俊璉主編《寫本學研究》（第一輯）出版

主編: 伏俊璉主辦:西華師範大學寫本研究中心.國家圖書館古籍館出版社: 商務印書館出版年: 2021-3 頁數: 207 定價: 86.00元 ISBN: 978-7-100-19447-1 目 ...

【图像分割】图像分割专栏栏主自述：分割，我们究竟在研究什么？

相关推荐