AI与设计:技术思维与设计思维的mix
最近在思考一些机器学习给设计带来的思维转变,还有对交互设计的影响,本文把一些读书笔记,及感想总结而成,主要是涉及AI技术、技术思维、设计思维、设计工具、用户体验设计等内容。
1
通过机器做设计带来的思维方式转变
——设计师的任务是把本来存在的最佳设计找出来
引一段米开朗琪罗的名言:
“Every block of stone has a statue inside it and it is the task of the sculptor to discover it.”
每块石头里都有一个雕像,雕刻家的任务就是把它展现出来 。设计不也是这样吗?通过什么方法,可以帮助我们“找出设计”来呢?
1.1 枚举,在有限空间里搜索最佳答案的方法
以如何设计一个酒杯?为例
设计一个酒杯的时候,我们需要考虑杯子的高度和基座宽度的关系。把酒杯做得太高,我们需要加宽基座以防止它翻倒。我们会思考高度跟基座宽度之间的比例达到多少的时候是容易导致杯子翻倒的?我们通过在高度和宽度变化的空间里,寻找此问题的答案。这是典型的“枚举”思维,把高度的各种可能跟基座宽度的各种可能组合在一起,来得到答案。
1.2 降维的方法处理现实复杂问题
很少有真实世界的设计问题仅由两个可变性的轴组成。但是,通过使用所谓的“降维”机器学习系统,可以产生高维特征空间的低维空间。举个树叶的例子,将一组叶轮廓的图像降维,随着训练的展开,算法重新配置每个叶子在二维空间的位置,使得类似的叶子彼此靠近。最终把树叶复杂的变化映射到了一个连续的二维空间。
1.3 通过探索的方法进行设计
给普通人布置一个设计任务:设计客厅。大部分人会觉得很难进行,如果换一种方式,让他们通过在Pinterest上浏览挑选喜欢的元素作为设计的参考,他们会觉得这个任务非常容易完成。因为每个人都有一种天生的美学和设计感,他们对愉悦或有用的东西有自己的见解。通过“探索”来设计,会使得设计的过程更加容易。
1.4 通过语言描述做设计的可能性
在自然语言处理任务中,词如何在计算机中表示,通常有两种表示方式:one-hot representation和distribution representation。
one-hot representation把每个词表示为一个长向量。这个向量的维度是词表大小,向量中只有一个维度的值为1,其余维度为0,这个维度就代表了当前的词。 例如: 设计这个词,可以表示为:
[0,0,0,1,0,0,0,0,0,……]
而distribution representation指的是将词转化成一种分布式表示,代表性技术是 word embedding,词向量技术,是将词转化成为稠密向量,并且对于相似的词,其对应的词向量也相近。例如,设计这个词的表达可以是:
这个迷人的机制提供了一种全新的设计思维方式。它允许我们在语言上运用视觉的概念,例如对美的描述:极简、简洁、简洁大气、简单等等相近的概念,利用词向量技术,我们都可以找到明确的数学表达方式。
2
RNN算法与设计
2.1 RNN
RNN具有自动补全的能力,被广泛应用于预测一串文本中的下一个字符或者一段音乐中的下一个音符之类的任务。
智能文本编辑器
https://cyborg.tenso.rs/
可以帮你自动完成文字创作的文本编辑器。
还有谷歌开源的sketch-rnn,应用于绘画、音乐中。其实,设计步骤,也是序列化的,第一步做什么,下一步做什么。结合推荐系统,根据用户喜好的相似性来推荐音乐或电影,在设计上,可以利用众多设计师的工作流程,根据用户的倾向,推荐适合的工作流程。例子还有阿里的鲁班,使用LSTM来模拟设计流程。
2.2 智能化的工具,一定程度也降低了创新的可能
基于RNN我们可以改造我们的设计工具,但是使用高效、智能化的工具,一定程度上让我们忽略了其他更多的可能结果,有可能创新的结果就被淹没在智能当中。
以使用地图搜索路线为例
举个地图的例子,虽然高级工具可以让我们更快地通过搜索空间找到最佳路线,但同时也会降低移动至空间内任意位置的可能。从这个意义上说,工具不能延伸搜索范围,反而使得我们的探索空间范围变窄,一定程度上破坏了创新的可能。
中场休息下
3
AI产品的用户体验设计
人工智能产品越来越多,机器不仅执行我们的命令,而且他们自己做事。这将改变用户的反应方式、行为方式以及用户对这些产品的心理预期。作为设计师,我们的目标是创造出有用的,易于理解的产品。
3.1 明确告知用户这是算法产生的内容
尤其是个性化推荐系统,例如Netflix上的电影推荐,Google翻译中的翻译或CRM系统中的销售预测,有时候无可避免地会发生错误/奇怪的推荐。
例如,AI预测支持票,它清楚地将此标识为预测。
例如,Firebase的做法,除了提供有关预测准确性的信息,用户还可以设置风险阈值。
3.2 解释机器如何思考
解释了为什么我们推荐某些产品。
自动驾驶车载交互界面,展示了车主周围所有其他汽车和行人的示意图。在需要特别关注的物体旁边还会出现一条红线,例如骑自行车的人和过马路的人。
电子邮件营销工具Drip。它本身不是AI产品,它具有评分功能,显示通讯订阅者的参与度。点击分数,你会得到一个详细的行动列表,解释人们为什么得到他们的分数。
3.3 基于用户个性化数据的产品设计
之前更新过关于《TensorFlow.js、迁移学习与AI产品创新之道》的文章,用户可以非常低成本的训练属于自己的图像分类模型,用于各种分类问题。我们可以拓展下,比如识别用户的手势动作,来控制游戏中的人物;识别用户的表情,控制3d人物的表情;识别图像中的人脸数量,自动隐藏所浏览的内容,防止被窥视……甚至 autodraw 、ui2code 、手写字识别等这些应用都可以尝试融入用户个性化的数据再训练的玩法,给予用户掌控权。新技术都会有一种很自然的新的交互方式与之匹配。基于浏览器的用户个性化数据再训练,可以提炼出以下基本的交互流程:
—> 设定类别
—> 采集数据
—> 开始训练
—> 使用用户数据
—> 核心功能
—> 完成任务/得到某个结果。
用户使用自己的数据,应用更符合用户个性化特征,是一种不同于个性化推荐的“个性化”产品设计方法。
ps:这部分内容,在6月的活动现场已与大家分享过。
4
了解技术的边界
作为设计师,需要了解技术的边界,例如聊天机器人不理解上下文,或人们给他们简单但意想不到的命令。如果在设计之前对所采用的技术边界足够了解,可以有效的避免奇怪的结果。