写给设计师的人工智能指南：图像 / 四六文摘

“在未来30年，

人工智能将取代目前世界上50%的工作。”

——莱斯大学计算机科学教授 Moshe Vardi

不管未来怎么样，我觉得提高设计师的效率是眼前最容易做到的事情。

设计师打交道最多是图像，各种图案、照片、视觉设计稿，都离不开图像。而图像识别正是人工智能的典型应用之一。

所以本期选择了这一主题。

我们先看最简单的例子。

验证码的识别，属于比较简单的图像识别技术：简单的图像分类器。

大致的识别过程：

1）待测试的图片灰度化并二值化

2）预先装载特征库

3）物体轮廓检测

4）扫描待测图片，并进行特征码比对，匹配优先

其实关键在于特征库。

如果我们的特征库足够强大，那随便啥验证码都可以完美识别啦。

是不是这么说？

再看难一点的图像识别类型：

人脸识别。

我们可以打开支付宝，体验下人脸识别；

我是觉得还可以，不知各位体验如何？

那么，人脸识别是什么技术呢？

1、采用的是深度学习，要了解深度学习就得去了解机器学习；

Machine Learning是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

随着这几年硬件设备的发展，机器学习的研究进展也提速了，网上也有许多的开源机器学习库，这里推荐谷歌的tensorflow。

2、机器学习的算法很多，部分如下所列：

决策树

随机森林算法

逻辑回归

SVM

朴素贝叶斯

K最近邻算法

K均值算法

Adaboost 算法

神经网络

马尔可夫

选一种合适的算法很重要，为什么？

复杂的算法并不一定解决问题，得看具体的应用场景。

比如前段时间，我用了K-means聚类，对照片的颜色进行的提取，完成了我的一款app：

「采色灵感」。有兴趣可以下载体验下ios版。

这个算法其实非常简单，把数据投射到一个坐标空间中，通过不断地取离种子点最近均值的算法。

最后，我通过它提取到了图像颜色的分类。我把它限制到了4个以内。

太多其实没多大用处，还不如打开ps用取色器，一个个像素取，对吧？

基于图像，提取特征值，我这里仅仅是进行了颜色这一特征的提取，还算比较简单。

回过头来看人脸识别，需要提取的特征值就复杂多了，主流的方法有EigenFace、FisherFace、LBPHFace三种，加上还有其他各种各样的变种方法，在opencv都有提供。

眼睛、鼻子、嘴巴。。不是这么好识别的，不过，作为设计师我们可以了解图像识别的基本技术路线：

结合大量公开和独有的训练数据集，在超级计算机上学习并提取照片特征，实现高效准确的标定和识别。

记住，一定要大量，只有保证训练数据的大量，才有可能得出相对准确的模型。

这里，如果有兴趣，我们可以用开源的技术框架，进行图像识别的实验。

OpenCV ，包含从底层的图像颜色空间转换到高层的机器学习工具。

可以尝试的项目：

1、做特征匹配，当下最常用和前沿的“以图搜图”的实现方法

2、做人脸对齐，人脸识别和人脸中的五官识别

3、实现监控视频的行人识别与跟踪

关于人脸识别这块，还可以试试科大讯飞的开放平台提供的服务，提供一张图像，科大讯飞返回一张坐标。至于可以有哪些具体应用，设计师们可以创作下～

这里我找到了相关的图像识别的应用案例：

深绘。机器够识别图片中的人物主题和服装，读懂图片中的模特框架、动作、姿态甚至是着装的效果，然后根据不同的需求来裁剪图片以配合不同模板、屏幕的需求。同时帮助商家完成设计、排版、上架等一系列的工作，而且最快只需要几分钟就可以全部搞定。

深绘的技术类似于人脸识别相关技术，只是应用在服装模特照片上。深绘，采用的应该是大量的服装训练集，把模特的动作、姿态、着装效果等进行标记，进行机器学习。期间要用到图像识别、机器学习等相关技术。

tensorflow的相关开源项目

源代码开源哦，想怎么改都行，而且可以跟着作者的思路实现下。

图像描述，即看图说话。image caption:im2txt

基于MNIST数据集的手写数字识别，tensorflow其中最广为人知的example。

这一期就这样吧。

下一期我有可能会更新的主题：

1、聊天机器人的技术；

2、人工智能助理；

3、用人工智能来完成艺术创作，如写作、作诗、谱曲、画画等。

人工智能相关文章：

Javascript也可以玩机器学习

《机器学习》入门的26个概念。笔记1

写给设计师的人工智能指南：图像

相关推荐