【图像分割】图像分割专栏栏主自述:分割,我们究竟在研究什么?

专栏《图像分割模型》已经完结,也是时候向大家正式介绍一下自己了。趁着新专栏刚刚开始,也借此机会聊聊在我眼中,我们做的分割究竟是什么,又该怎么做。

文/编辑 | 孙叔桥

我是谁

我叫孙叔桥,从14年开始从事计算机视觉研究,先后研究过目标检测、视觉跟踪、立体匹配和图像分割四个主要领域,对基于深度学习的图像处理的相关问题比较熟悉。

作为有三AI的专栏作者,我负责图像分割领域的相关文章。目前,已完结专栏《图像分割模型》,主要介绍在图像分割领域的主流网络结构及设计思想;正在进行中的专栏《图像分割应用》,旨在从应用角度分析各领域内的图像分割问题。

下面聊聊我是怎么开始计算机视觉的吧。其实,与其说是我选择了从事计算机视觉,不如说是计算机视觉找到的我。

入坑是从本科毕设开始的,题目是硕导定的,恰巧我也感兴趣,就这样一拍即合。要是早点知道这个研究方向会从本科一路陪我到博士,还火的一塌糊涂,我可能管管自己的性子,早早用功努力。

选题后不久我就去了国大做交换生,在新加坡的Universal Studio里,计算机视觉在我脑海里留下了第一批具体印象:虚拟视觉加小型过山车太爽了!飞下来救我们的变形金刚好帅!法老那个简直High翻天!

显然,在那个时候的我眼里,所有计算机+视觉的东西都属于“计算机视觉”,至于包括什么、应用领域、实现方法都还一无所知。

后来随着研究的慢慢深入,我慢慢接触了计算机视觉的几个细分领域,掌握的知识和技能也逐渐丰富。此时,计算机视觉与神经网络在我的脑海才真正算是有了点形态,其中的趣味也就慢慢显露了。

我眼中的AI和图像分割

经常有人问我,你是不是搞人工智能的啊?其实,这个问题我不知道该怎么回答。要说是吧,我做的东西其实是底层的技术,计算机视觉层面的东西,这东西我认为它自己是无法单独被称为“人工智能”的,所以我做的东西并没有人工智能这么庞大;但要说不是吧,计算机视觉确实是人工智能的重要一环,它是机器的眼睛,甚至能成为人类眼睛的延伸,确实某些应用领域下就属于人工智能。

后来,我就不纠结这个问题了。别人问我,我就回答“我做计算机视觉的”。要是提问者认为这个回答是肯定,那就是肯定;要是否定,那就是否定。

至于我为什么要做计算机视觉,我以后想不想做,倒是我经常问自己的问题。我深知,哪怕是计算机视觉随便拿出一个芝麻大的分支,也有太浩繁的知识、技巧、应用领域;以我的能力和精力,是不可能面面俱到的,我也不想。我只想用我能做到的事让日子过得轻松一些。

所以,AI和计算机视觉在我眼中,更像是夏天的空调、冬天的暖气,一个小工具罢了,更需要关注的反而是实际生活中遇到的问题和如何去解决。

目前所专注研究的图像分割恰巧是一个切入点。在我看来,图像分割所实现的功能更贴近于人类认知世界的结果。比如我们看到了一个杯子,其实是识别出了杯子所存在的整个空间,根据要实现的目的,我们选择性地是只利用“杯子”这个标签还是整个空间都利用上。举个例子,比如我们需要用杯子接水,那么只需要正确拿起杯子就可以了;但是如果要收拾桌面,则需要保证不会有其他东西砸在被子上面。这也是为什么我选择了图像分割。

即使图像分割已经是一个很具体的方向,但是其需要研究和学习的内容也非常庞杂。从传统的图像分割方法到基于深度学习的方法,其中涉及到的基础知识、网络模型、设计思想、代码实现等等,是一个交叉领域的学习过程,包括了数学、计算机、信号处理、优化等多个学科。公众号内发表的专栏更多的是让大家对这个领域有一定的了解,但是想要真正掌握图像分割的技术,还是需要实际的动手与操作的。

我与有三AI

(0)

相关推荐