理解AI：任何设备都能制作“蚂蚁呀嘿”，照片动起来

2024-08-05 10:40:39

跨平台越来越重要了。

——题记

先看方法

iOS设备：本篇文章最近的一篇推文，一步步的教程。

安卓设备：下载LicoLico，官网或者酷安下载都可以，APP内教程很简单。

PC设备：利用开源项目PaddleGAN,更便捷的方式是通过百度AI Studio。

PC设备相对更为复杂一些，但效果更好，搭配Pr、Ae更加如虎添翼。

在完全傻瓜操作情况下，亲自对比了上述三种方式，PC设备仍然是最好的。

下面主要介绍一下PC设备的具体操作：

第一步注册用户：

https://aistudio.baidu.com/

第二步打开这个项目：

https://aistudio.baidu.com/aistudio/projectdetail/1586056?channel=0&channelType=0&shared=1

第三步点击蓝色按钮运行一下：

第四步在notebook标签下一步步按照教程做就可以了！

再看原理

What

软件的原理可以简单地理解为AI换脸。

详细点，这里引入一个名词“一阶运动模型”，即First Order Motion model。

其任务是image animation，给定一张源图片，给定一个驱动视频，生成一段视频，其中主角是源图片，动作是驱动视频中的动作，源图像通常包含一个主体，驱动视频包含一系列动作。

通俗来说，First Order Motion能够将给定的驱动视频中的人物A的动作迁移至给定的源图片中的人物B身上，生成全新的以人物B的脸演绎人物A的表情的视频。

而iOS和Android端实现这种AI换脸或者说表情迁移则是通过网络将照片传到云端实现PC端（后端）这个过程，再传输给手机。

Why

为什么要这样的框架？

为了解决数据依赖和提高模型使用的泛化性。

以表情迁移为例，图像生成任务的传统方法VAE、GAN等需要大量人脸图像，以及这些人脸图像的标注信息（关键点、面部动作单元、三维模型等）；此外，这些训练好的模型只能在特定人物中间使用，没法应用到未知的人脸中。
为什么手机不可以直接做这些AI?

两个原因：一是手机APP所处的环境有限，例如Android是基于虚拟机的操作系统，能够调用的算力有限、，还要考虑发热、耗电等问题；二是用户不会在无趣的操作上花费过多时间，云端可以提供更快的生成速度。

How

输入分两个部分：一个是图片源，另外一个是视频源；
图像产生分为两个模块，一个是动作，另外一个是图像；
动作模块面对的对象主要是：一个是针对关键点的，另外一个针对区域修补的；
动作模块主要采取的核心算法是：一是关键点映射移动，二是区域的仿射变换（有点遮罩的意思），三是针对参考帧的预测；
算法这块就不好理解了，这里只是简单举例说明算法名字的由来，图像中的关键点用

表示，其他图像X、S、D的关键点用

表示。我们知道，我们想要求的

实际上是一个

的映射，该映射在点

的一阶泰勒展开如下：

有大佬看了一下源码，说主要应用算法还是基于关键帧的预测。

后记&&感想

百度AI Studio的开放还是很良心的，也算是百度今年来比较适合追一下的产品了，毕竟未来“全民”AI都是有可能的。

类似的还有腾讯开放平台，阿里云开发平台、字节跳动和B站的创作激励等等。

真是“千帆竞渡，百舸争流”的时代啊！啥时候我们才能完成由小虾米到鱼到网到渔夫到大副到船长的飞跃呢？

火遍全网的「蚂蚁呀嘿」教程开源了！

最近,小伙伴们的朋友圈.某音.某手.某博是不是都被魔性的「蚂蚁呀嘿」换脸视频刷屏了?!!甚至有网友纷纷吐槽:「这几天就仿佛捅了蚂蚁窝-」比如小G的朋友圈就有飞桨团队的激情出演: 看到这里,小伙伴们都 ...
【CV秋季划】人脸算法那么多，如何循序渐进地学习好？

人脸图像在计算机视觉领域中研究方向非常广,其相关研究覆盖底层图像特征,目标检测与跟踪,图像分类和检索,图像滤波,图像分割,三维重建,风格迁移等方向. 在商业界应用落地也有非常多的产品,包括各类软件产品 ...
奖金10000元，谁跟我一个队？｜百度飞桨AI创造营参赛指南

#百度飞桨 AI竞赛#.#技术次之,创意优先# 谁跟我一个队? " Mixlab喊你来组队!" 百度飞桨,AI创造营首届开赛,Mixlab 今天起,正式开启组队通道! 你是否也曾想 ...
情人节「告白生成器」来了！这个AI能让偶像对你说情话，过于真实！

重磅干货,第一时间送达情人节将至,当其他人还在苦思冥想如何准备情人节礼物时,我却已经收到了我最喜欢的idol说给我的情话视频-不仅如此,我还用自己的照片说出了亲爱的ta最喜欢的告白台词,究竟是什么技 ...
仅需 3 行代码，文科生都能上手的百度飞桨Model Hub | Shadow 组队 AI 创造营

飞桨 PaddlePaddle 百度家的飞桨 PaddlePaddle 是首款开源开放的产业级深度学习平台,可以很方便搭建模型. 在这之前,可能用户们最常见的选择是等大佬搭完了丢出来再接,Paddle ...
AI如何通过不透明度命令制作倒影效果

下面小编来教大家如何通过不透明度的命令来制作倒影的效果吧,一起来学习一下. 1.首先我们制作一个图标形状,就是将椭圆的一个锚点变为尖角拖拽出来的. 2.然后在上方添加一个文字,将文字和图形组合到一起. ...
“你们这些医生，离开了设备都不会看病了吗” 影像科医生：“......”

我是一名影像科的医生自从在影像科工作后每天都会碰到一些让我感到很无奈的患者就比如下面这些: ▼▼▼ 01 不用设备真看不了呢 Part.01 患者:"大夫,我刚摔了一跤脚不能动了, ...
AI如何使用封套扭曲制作丝带效果

封套扭曲主要是用于制作合并的形状,下面来实战操作一下使用封套扭曲制作丝带的效果. 1.首先我们使用直线工具绘制出一条直线,添加一个描边. 2.之后按住Alt键多次复制,在对齐中选择水平分布. 3.然后 ...
中国孩子怎么过英文写作关？说实话，理解这些要求，都不容易。

说起英文写作,估计中国小孩是一把心酸泪: 首先,写作本来就是一道难关 ... 写什么,怎么写?就算是中文,也没几个孩子觉得容易的! 然后,还要用英文写!生词.短语.句型.语法,哪个不难? 最后,学校语 ...
掌握四点窍门，阅读理解不拿满分都难！马上...

掌握四点窍门,阅读理解不拿满分都难! 马上期中考试了,语文阅读理解是占分较大的题类,相信会成为很多孩子的丢分点.下面分享几个阅读理解答题技巧,希望能够帮助到孩子. 1.通读有的孩子在拿到题目时,只会 ...
这5个数学猜想最早在30年前提出，如今AI证明它们都错了

近日,以色列特拉维夫大学研究团队在预印论文库提交了一篇名为"Constructions in combinatorics via neural networks"的论文,在这篇论文 ...
跟动画人物一起拍短视频，五毛特效谁都可以制作，但创意不一定有

跟动画人物一起拍短视频，五毛特效谁都可以制作，但创意不一定有
三年级阅读理解九篇，都是从各期中测试卷上...

三年级阅读理解九篇,都是从各期中测试卷上摘录过来的,附答案
隔壁PS都能自己上色了，你却连AI笔刷都不会用！

· 胶囊每天为你更新优质学习资源 · · 软件 | 素材 | 考研考证 | 教程 · 第[661]期视觉胶囊送书的倒数第二天一定要看到最后,文末送书哦! 药丸妹之前做过许多PS笔刷分 ...

理解AI：任何设备都能制作“蚂蚁呀嘿”，照片动起来

相关推荐