人工“智能”图像识别 参考论文

人们很容易知道,图1中四张图片其实来自同一张爱因斯坦的肖像画,第二张图片在尺寸上有变化(为后续行文方便,稱其为苗条爱因斯坦),第三张图片加了个小点缀(称为灵感爱因斯坦),第四张布满了白色噪点(称为混沌爱因斯坦)。人的视觉和头脑很容易就能在一大堆无关的图片中,挑选出这几张图像,并把不完全相同的爱因斯坦归于一组,计算机能做到吗?本文设计了一个活动,以计算图像相似程度为主线,通过“应用—操作—讨论”这三步,探索计算机“辨图”的奥妙。

● 应用——专业找图

TinEye是一个在线的反向图片查找工具,地址是www.tineye.com,用户上传图片,该工具负责找出图片的原始出处。将以上四张爱因斯坦的肖像画上传后,这款工具就能找到相近的爱因斯坦肖像(如图2)。

TinEye能认出图1中这四张图都是“爱因斯坦”吗?其实不能。但计算机能借助算法,判断不同图像之间的差异。或许大家头脑中会冒出诸如“深度学习”“神经网络”这样的名词来,其实要实现上述判断,并不需要用到那些“高端”功能,用感知哈希算法就可以实现了,为了解释感知哈希算法最基本的原理,下面笔者就利用图像编辑工具,一步一步手工进行图像识别,看看计算机是如何判断图像相似程度的。

● 操作——手工辨图

先找到某个图像编辑工具,本文用小巧简单的“易笔易画”软件来举例,大家也可以使用自己熟悉的图像编辑工具来做这个实验。打开爱因斯坦图像,然后缩小到8×8像素,注意这里不要按比例缩小,不管什么形状的图片,都缩小成正方形,虽然缩小图片后许多像素被抛弃,但却仍然保留了一些特征,并且可以发现,即便不同的爱因斯坦图片尺寸比例不同,缩小成正方形后,这些图片看上去就非常相似了(如图3),这正是不同比例图像之间能进行相似程度比较的关键,没想到其实那么简单吧。

接着,是将彩色位图转化为灰阶图像。不同的模型有不同的转化算法,这里就不展开具体讨论了,只用软件默认的转化功能来进行转化。以“易笔易画”软件为例,点击“图像—黑白照”菜单项即可。这么一来,在比较图片时就不必纠结细小的色彩区别了。以“原始爱因斯坦”图像为例,做成8×8像素的灰阶图像后(如图4),虽然已经完全看不出是人脸,但仍然保留了原始图片的一些特征。

最后,是获得灰阶图像的图像指纹。图像指纹其实是一个符号串,其生成方法大致为:首先计算所有像素灰度值的平均值,然后观察每个像素,如其灰度大于等于平均值则记为1,小于UzVjWpVtuTa3Ur/sheRHRP5ugJKA/9EZfIOZhPgc5E0=平均值则记为0,将这些二进制数字连起来,就成了图像指纹。

完成上面这步工作需要编写程序实现,但为了更便捷地体验效果,笔者使用了一种偷懒的计算方法:

首先,获得近似的平均灰度:将图片转为半影调图片,在“易笔易画”中,点击菜单“效果—色彩变换—半影调”即可,数一下空白格子,将空白格子数除以64。以“原始爱因斯坦”图像为例,半影调化后(如图5),数一下就知道,其中有32个白色格子,除以64后值为0.5(0.5表示图像总体亮度的程度)。

其次,回到“原始爱因斯坦”灰阶图像,将该图进行阈值处理。阈值阀门的位置设在0.5比例处,在“易笔易画”中,就是设置为256×0.5=128(如图6)。

最后,设黑色格子为0,白色格子为1,于是就可知图像指纹为:0000000000011100001111110010111100000111000111101010100000000100。

用这种方法生成图像指纹,虽然精确度不高,但足以说明问题。实际应用中的算法考虑了多方面的问题,其具体实施过程要复杂得多。有兴趣的朋友可以进一步深入学习。其他图片也可以照此操作得到图像指纹(如图7)。

苗条爱因斯坦:0000001000011100001111110011111100000111100110110010110000000100;灵感爱因斯坦:0000000001111100011111100010111100000111000110100010100000000100;混沌爱因斯坦:0000000010011100101101110010011110010111101110110010000001000101。参考论文

一般情况下,图像指纹越相似,则图像也越相似。观察上面的图像指纹,苗条爱因斯坦和灵感爱因斯坦这两张图片,与原始图片的相似度都有百分之九十以上,而混沌爱因斯坦与原始图片的相似度只有百分之八十以上。若是换成一张牛顿的图像进行同样操作(如上页图8,牛顿肖像画的图像指纹为0000000000110110000111100001111010011110001110000011111000111110),相似度就只有百分之六十五。

● 讨论和尝试——智能识图

上述算法很简单,但局限性也很大,下面一些问题值得讨论,也可以实际设计一些实验来验证一下自己的想法是否正确:

①怎样在爱因斯坦原图上做一些变动,让感知哈希算法变得无能为力呢?例如,在图像边缘勾上一条和背景颜色反差很大的边框。

②能否找到或亲手绘制一些和爱因斯坦完全无关的图片,让感知哈希算法认为这些图片和爱因斯坦肖像相似程度很高?

③感知哈希算法只能判别图形的相似程度,无法判断图像内容的相似程度,它无法知道那个站在写满物理学公式的黑板前的爱因斯坦,和那个拉着小提琴或者顽皮吐着舌头的爱因斯坦是同一个人。那么,当前还有哪些工具可以帮助人们判断图像内容的相似程度呢?

参考资料;http://zimeitichuangzuo.com/index.php?c=show&id=2192

(0)

相关推荐

  • 实测:多款iPhone出现指纹识别Bug,贴膜后人人可解锁

    贴上指纹贴,重新注册指纹.没想到指纹识别人人可解. 2017年12月,本报曾刊发题为<主流国产手机出现罕见漏洞 或波及上亿部手机>的报道,揭露安卓手机普遍存在的指纹漏洞.经<IT时报 ...

  • 有什么好用的识图软件?

    好用的识图软件包括TinEye.百度识图.搜狗识图.好物识图.全网人脸搜索. 1.TinEye 老牌相似图片搜索引擎 TinEye 是一个非常强大的图片搜索引擎.如果你的电脑中有一张不知道来自哪里的图 ...

  • 智能指纹门锁到底安全吗?

    一次意外的Home键摔裂,手机人人可解,是意外还是必然?多品牌手机出现相同症状,是小概率事件还是产品算法漏洞?相同问题只存在于一家芯片供应商还是普遍问题? 从微博的一则爆料开始,<IT时报> ...

  • 一个硅胶套解锁三星手机 我们曾用一根头发解锁过一大批国产手机

    刚刚,三星电子宣布,已发布软件更新,修复了Galaxy S10和Galaxy Note 10系列手机的指纹识别漏洞.值得注意的是,如果注册指纹时使用过保护套,需要删除指纹重新注册.三星强调:" ...

  • 家庭教育中亲子游戏开展存在的问题及策略探究参考论文

    摘 要:家庭教育对幼儿的发展至关重要,我们常说 "游戏是幼儿基本的活动形式",在托幼机构强调游戏的同时,教师也非常注重幼儿游戏的组织.实施.观察等方面,但是游戏在家庭教育中的现状如 ...

  • 应用型本科院校外语人才跨文化能力培养研究参考论文

    摘 要:我国对外交流与合作的日益频繁和深入对应用型本科院校人才培养提出了更高要求.为培养有跨文化交际能力的人才,从知识.能力和态度与素养三方面培养学生的跨文化交际能力,以满足中国经济社会发展对高层次应 ...

  • 以人为本润物无声参考论文

    摘 要:在班级的管理中,就要坚持以人为本的教育核心,结合学生的思想实际和生活实际探索教育的新方法.新途径,努力的贴近学生的学习和生活,用细雨润物的方法,用爱心和细心做好班级的管理工作. 关键词:以人为 ...

  • 关于举重运动员学训的思考参考论文

    摘 要:举重运动是以体能为主导的力量项目,技术性很强,且危险性较高,基于此,本文对举重运动员当前的学训现状及问题进行思考,并针对性地探究其学训建议. 关键词:举重 运动员学训 思考 举重运动是体育院校 ...

  • 浅谈“课堂观察”在特殊教育学校体育教学中突显的作用参考论文

    随着基础教育课程改革的深入,"课堂观察"作为一种全新的听评课模式,被赋予了新的意义和活力,它促使特殊教育学校教师走向专业化发展. 一.结合体育专项性特点建构相对应的观察量表 特教教 ...

  • 运用多媒体教学 构建生态高效课堂参考论文

    摘 要:随着多媒体技术教学的普及和深入,充分利用多媒体教学可以让课堂内容变得有趣,并且有利于构建生态高效课堂.本文结合自己在教学实践中的一些体会,浅谈如何通过多媒体教学构建高效生态课堂. 关键词:多媒 ...

  • 信息技术在高中生物教学中的应用与创新参考论文

    摘 要:伴随着社会的快速发展,信息技术已经成为高中教学当中一种不可缺少的教学手段,广泛地应用于各个学科的教学当中,其中也包括高中生物课堂,在提高教学质量.培养学生的创新意识等方面发挥了重要的作用.本文 ...

  • 首页教育教学论文 多媒体教学如何提高高中化学的教学质量参考论文

    摘 要:随着科技的飞速发展,我国教育事业的发展情况也越来越被社会各界的人士所关注.为了适应社会对人才的需求,我国的教学也在不断地进行革新,以适应社会的发展,越来越多的多媒体设备被应用到课堂教学之中.在 ...

  • 忽如一夜春风来参考论文

    摘 要:多媒体是一种利用计算机对各种信息进行集中化处理,以此建立人与计算机的信息交互的技术.多媒体技术在生活中被越来越多地应用于各方面.本文将结合笔者工作经验,简要探讨课堂教学中多媒体技术的运用. 关 ...