一键生成《泰坦尼克号》漫画书!中国高校学者开发全自动漫画生成系统,无需手动输入,不限视频类型 2024-07-30 17:05:25 近年来,随着计算机科学得到飞速发展,科学家们不断取得新的技术突破,尤其是随着机器学习的迅猛发展,各种各样的计算模型被创造出来,比如可以自动生成文本、图像和其他类型数据的计算模型。这些模型相较于传统计算模型,在创建对人类手工制作要求高、耗时长的数据或创意作品时,表现出了很大的优势。例如,在人工智能领域不断涌现出一批具有超凡本领的创作机器人,有自动创作水墨画的 “艺术家”,自动写作诗歌的 “文学作家”,自动生成高考作文的 “高考小能手”,经过大量的经验训练,这些计算模型甚至拥有了过人的创作力。而今,来自大连理工大学和香港城市大学的研究人员在自动创作领域又做出了新成果,该团队联合创建出了一个可以自动生成漫画书的新型系统,该系统通过从电视剧、电影、动画或其他视频中提取数据,从而创作漫画书。 (来源:arXiv)相关研究以 “Automatic Comic Generation with Stylistic Multi-page Layouts and Emotion-driven Text Balloon Generation” 为题,发表在 arXiv 预印本平台上。研究人员在论文中写道:“我们提出一个全自动系统,从任意类型的视频(电视连续剧、电影、卡通剧)生成漫画书。我们的系统不需要用户的任何手动输入,可以生成高质量的漫画页面,具有丰富的视觉效果和富有表现力的故事。”全自动漫画生成系统漫画是一种艺术形式,一种用简单而夸张的手法来描绘生活或时事的图画。漫画的创作过程往往需要经历选题、搜集素材、绘制分镜草稿和编辑调整沟通等一系列过程,漫画书的创作不仅需要精湛的专业技术,更需要丰富的内容素材和大量的创作精力,通常非专业人士很难制作出自己的漫画书。在互联网如此发展迅速的当今,网上每天有成千上万的短视频发布出来,结合漫画便捷的阅读形式和出色的故事描述技术,人们不禁会想象是否可以将这些视频自动转换为具有丰富的视觉效果和出色的叙事能力的高质量漫画书?近年来,由视频生成漫画的相关技术取得了一定的进展,但所创建的模型大多不是全自动的,生成的漫画作品要么需要额外的用户输入,要么使用简化的表示形式或方法进行漫画页布局,从而导致整个漫画效果缺乏视觉多样性和表现力。该最新研究解决了通过算法在页面之间分配所选关键帧,然后在每个页面漫画风格的布局上组织关键帧的问题。研究人员采用一种数据驱动的布局方法,从漫画数据中学习布局样式,通过自动从关键帧中提取系统的输入来扩展他们的方法,因此无需任何形式的用户输入,即可实现布局框架的完全自动化。 图 | 该系统的整体设计流程。(a)关键帧提取和风格化;(b)自动多页布局框架(红色、紫色和绿色虚线框表示不同的组);(c)对话气球的生成和放置。(来源:论文)研究人员还设计了一种数据驱动的情绪感知气球生成模型,该模型可以生成不同的气球形状,并根据字幕和音频的情感动态调整字体大小。然后,通过检测谁在讲话以及讲话者嘴巴的位置,将生成的气球放置在正确的位置。该研究所创建的框架并不像大多数漫画生成框架那样,总是使用同一种类型的语音气球,而是生成不同类型的气球,以反映人物话语所传达的情感。为了做到这一点,对于给定一个输入视频片段,研究人员首先尝试通过分析视频获得对应的音频和相应的字幕,然后对字幕和音频进行情感分析,来把握不同的对话台词所传达的情感。之后,模型根据人物所传达的情感,创造出形状和文字大小各异的对话气球。这极大地改善了整体漫画阅读体验,产生了更吸引人的布局,也反映了不同角色之间的对话内容。 图 | 不同情感的对话气球生成过程(Emotion-aware Balloon Generation)(来源:论文)为了实现系统生成的语音气球可以被放置在正在说话的角色附近,该模型首先检测视频中不同的说话者,然后在他们的附近放置与他们所表达的情绪一致的语音气球。 图 | 对话者检测流程(来源:论文)为了允许用户对生成的结果进行某种程度的控制,研究人员构建了一个用户友好的界面,来向用户施加约束,以构建更多个性化的设计,并优化结果。研究表明,该用户界面可以节省用户时间,同时提供更多的创建自由。在从视频中提取关键帧并将其转化为漫画风格的图像后,研究人员设计的系统使用多页布局框架将图像分布在多个页面上,并创建出具有视觉吸引力的布局,以反映图像之间的关系。研究人员表示:“该系统在无需任何人工干预的前提下,给定一个输入视频及其字幕,首先通过分析字幕提取信息关键帧,然后将关键帧图像转化为漫画风格的图像。”用户体验怎么样?研究人员通过一系列实验,评估了他们所设计的系统及各个模块,并选择四部电影(Titanic、《风声》、Friends 和 Up in the Air)和系列片中提取的 16 个长短为 2 至 6 分钟不等的视频片段,使用该系统与当前最先进的漫画生成系统 “Content-Aware Video2Comics” 分别生成漫画,并就漫画质量进行对比分析。 图 | 该系统与一个名为 “Content-Aware Video2Comics” 的系统在漫画生成效果上的比较。(a)图-(d)图是该研究的生成效果;(e)图-(h)图为 “Content-Aware Video2Comics” 系统的生成效果。(来源:论文)对比发现,该系统的漫画生成效果要优于其他系统,不仅能够生成更丰富的气球形状,还可以利用文本摘要来合并一些相关的字幕,以确保单词气球句子长度适中,关键是可以实现全自动多页布局,其布局效果合理、丰富。该研究团队还招募了 40 位用户,让他们观看视频后阅读系统生成的漫画,并围绕漫画的整体效果、对话气球质量、布局质量、故事讲述效果、阅读体验等指标,对系统所生成的漫画与另一种漫画生成系统所制作的漫画进行了对比评价。绝大多数参与这项研究的用户表示,与之前开发的系统相比,他们更喜欢研究人员的模型所制作的版面。 图 | 用户评估结果图,纵轴表示每个问题的平均评分,横轴表示视频编号(图中蓝色条形柱表示 “Content-Aware Video2Comics” 系统的评分,橙色表示该系统的评分)(来源:论文)研究人员表示:“我们的实验表明,与最先进的漫画生成系统相比,我们的系统可以合成更具表现力和吸引力的漫画。”不过,虽然该系统已经被证明取得了可喜的结果,但它仍存在一定的局限。例如,关键帧的选择不够准确,在某些情况下,所选择的关键帧彼此相似,无疑会给生成的漫画带来冗余信息。研究人员表示,一旦系统后续被更加完善,该漫画生成系统即可用来自动创建基于电影、电视剧或其他视频内容的漫画书。在后续的研究中,研究人员还计划开发一种可替代的关键帧选择模块,以此来提高系统生成的漫画布局质量,减少关键帧的冗余。“更重要的是,受到许多现有方法的启发,这些方法可以根据所给定的含有多个句子的故事来生成图像序列,有可能从文本故事中产生漫画书,我们有兴趣将我们的方法扩展到利用文本信息来帮助生成漫画。” 研究人员在论文中总结道。参考资料:https://arxiv.org/abs/2101.11111https://techxplore.com/news/2021-02-automatically-comic-movies-videos.html 赞 (0) 相关推荐 季度销售数据统计与总体分析系统 特点 1.专业统计分析.从产品编号.名称.类别.员工.部门.区域.购买渠道等各个维度统计本季度每个月以及合计的销售数据(销售数量及金额),而且还可以分析各部门.各员工的业绩达标情况. 2.丰富图表呈现 ... 小茶漫画 | 你看!那气球踏着七彩祥云来的! 大家好,我是小茶. 昨晚润润放学发生了一个小插曲. 你们可以想象吗? 润崽在车筐里呜呜呜地, 我一脑门子汗, 可能今天买不到气球 她晚上都睡不好觉. 你和小孩子说 "你要想开点啊,没事的,要 ... Excel全自动工资管理系统,自动计算含专项扣除,直接拿走套用 财务人员平时工作很忙,也要核算各部门的工资,如果是那种公司人多部门也比较多的情况,那工作量是非常大的,短短的几天时间根本完不成,特别麻烦,还有各种税费之类的需要扣除. 还好我从主管那里找来这套Exce ... Youtube推荐中的深度神经网络应用 Overall 从上述链接中可以看到,之前读的文章都是最近两年的.今天则给大家介绍一篇稍微久远点的,2016年的论文,追本溯源,或许能更好的理解推荐算法的变化和设计的初衷. 论文[1]中的Youtub ... 火影,海贼王,七龙珠,还在为漫画书发愁!我用Python一键生成电子漫画书 原创 菜鸟哥 菜鸟学Python 2020-03-10 不过近几年新的问题又出现了:漫画网站广告太多,更重要的是越来越多的作品.章节出于各种原因被下架.限制观看.为了提升观看体验,我通常会把漫画打包下 ... 中国高校经济学权威排名 权威性:本数据来自于教育部第四轮学科评估 公正性:没有收受任何组织和个人的赞助 公开性:本数据的统计逻辑按照A+到C-排列!考虑到部门高校参评只申报了一个学科,故采取降级排名法,例如东北师范大学,虽然 ... 华为集团把python入门知识点整理成漫画书了,让人茅塞顿开 华为集团把python入门知识点整理成漫画书了,让人茅塞顿开 2021年中国高校专业就业趋势分析 从高校专业调研看理工科就业未来 2021年4月14日,央行官方微信发布工作论文,论文表示,重视理工科教育,东南亚国家掉入中等收入陷阱原因之一是文科生太多.未来将更加重视理工科发展.而4月26日,人社部发布2021年第一季度全国招聘大 ... 2021年中国高校四大排行榜均已发布,来看各高校排名! 截至2021年4月,本年度中国四大大学排行榜均已发布,山东高校(shandonggaoxiao)统计出了同时入选3个及以上榜单的中国大学排名情况,以供参考. 中国四大榜 采用软科.武书连.校友会.中评 ... 中国高校里,各行业的黄埔军校 中国高校里,各行业的黄埔军校 2020中国高校薪资排行出炉!好过双一流的高校原来这么多! 导读 ,规划重庆安徽 日前,中国薪酬网发布了<2020中国高校毕业生薪酬指数排名>.此次排名按照工资水平.就业率.人才成长率.薪酬增长率四个要素,排出了TOP100.榜单中也暗含了很多高考 ... 王国维(近代中国著名学者,国学大师) 王国维(1877年-1927年),字伯隅.静安,号观堂.永观,汉族,浙江海宁盐官镇人.清末秀才.我国近现代在文学.美学.史学.哲学.古文字.考古学等各方面成就卓著的学术巨子,国学大师.王国维,近代学者 ... 钱钟书(中国现代作家、文学研究家) 钱钟书(1910年-1998年),江苏无锡人,原名仰先,字哲良,后改名钟书,字默存,号槐聚,曾用笔名中书君,中国现代作家.文学研究家.1929年,考入清华大学外文系.1932年,在清华大学古月堂前结识 ...