从自动化到类人化,智能设计能成为一个合格的设计师吗?

从规则实现开始,再到数据驱动,最后实现真正的需求驱动,智能设计将经历三个发展阶段:自动化、智能化和类人化。人人都拥有一位专属个人设计师的场景似乎并不遥远。

站在web3.0时代的前夜回看设计史,不难发现从第二次工业革命开始,每一次的技术革新都对应着设计需求市场的扩大和设计范式的变化,从工业革命、计算机革命、到信息革命,科技赋能使得设计的门槛不断降低,效率不断提升。设计师从手执画笔到云端协作,通过创意和技术的碰撞释放出巨大的想象力。

第四次工业革命被称为『智能化』时代,人工智能技术早已给设计行业带来了一系列变化,而随着这一周期中技术与产业的持续深度链接,设计的智能化也将是一个必然的演进趋势。

从当前的技术实现可能性来看,我们认为根据智能化的级别,智能设计可以划分为自动化智能化类人化三个主要发展阶段。下面我们依次来看看,在这三个阶段中,智能设计的内容、特点,以及面临的问题。

1.0阶段:自动化设计

智能设计的襁褓期,机器只会执行,但不会创新。

没有在线化、自动化、数据化的基础,就无法实现智能化。正如自动驾驶汽车需要学习大量多样化、来自真实世界的驾驶训练数据集,智能设计的第一个阶段,是需要把设计师人工设计的过程完全自动化,通过自动化的服务提高设计的效率和规模,收集大量设计和用户数据,同时打磨在线化的设计服务流程。

在这一阶段,以最基础的Logo设计为例,机器通过AI技术生成 Logo 原型,帮助用户以较小的成本进行 Logo 设计。设计师的经验被总结成一条条的策略和规则,机器按照设定的算法和步骤,从品牌解析、标签匹配到风格/色彩/元素组合,自动地完成整个设计过程并完成方案交付。只有当用户不满意机器设计结果时,才由人工设计师介入,完成后续的各项任务。

虽然从技术角度来看,1.0阶段还算不上一个真正的AI设计系统,但是从用户视角来看,还是会带来很多惊喜,机器似乎真的具有了某种程度的智能,能够根据输入的简单文字给出相应的设计结果。

1.0阶段的特点是弱数据强规则。机器的设计技能主要是由人明确指定的,而不是机器自己从数据或经验中学到的。在这个阶段,虽然满足了一部分用户的基本设计需求,但存在显而易见的两个问题:

问题一是,设计师的有些经验过于复杂和感性,甚至连设计师自己也无法描述,很多神来之笔更是”只可意会不可言传”。这些经验目前都还无法靠人工总结的方式来形式化,更无法被机器处理。

问题二是,随着策略和规则条目的增加,系统日趋复杂,仅靠人工很难完全理清各个条目之间的复杂关系,系统的可维护性变差。从而造成基于规则的一个重要优势:可解释性,也会逐渐变得有点儿说不清了。

2.0阶段:智能化

在被喂养了足够的数据之后,机器学会从0-1的创造。

2.0阶段的核心问题是智能化,在这一阶段,机器不仅要学会识别和理解文本和图像数据中的语义信息,而且还要学会自主生成一些素材和版式,也就是从0到1的创造

前面说过,智能化的第一步需要解决数据问题,这是一个滚雪球一样不断迭代的过程。1.0阶段积累的设计和用户数据,在2.0智能化阶段作为启动或基础数据,将起到非常关键的作用。而根据1.0阶段跑出来的工作流,人工智能算法在内容检索、素材组织、生成模型等关键流程中发挥重要作用。

1.内容检索。

即用户输入关键词或样例图片后,系统可以从数据库里查找到类似或相关的素材或版式。这是一个相对比较成熟的技术,有许多解决方案,之前主要使用人工或自动标注的方式,现在,嵌入表示的效果很好,逐渐成为主流技术。甚至有人说:Embedding is all you need.

我们可以使用收集到的文字、图片、用户需求等数据资料,分别训练一个各自领域的嵌入表示模型,各自得到一个编码器,然后对于每一个主体,使用其相应领域的编码器,可以得到一个其专有的、稠密的、表示其特征和空间坐标的表征向量。当一切都向量化后,很多问题就变得很直观、很容易处理了。像检索、匹配、推荐等问题都可以通过向量之间的数学运算,或领域之间的变换来实现。而且,这通常比基于关键词的检索方式要更高效、更准确。

如上图所示,具有相似性质的词汇可以映射到相似位置的向量位置上,这样能表示出词汇之间的相似性

2.素材组织

即从所有可能的排列组合中,找出一个或多个最终效果最好的方案来。这里有两个问题需要解决,一个是如何评价结果的好坏,另一个是如何缩小搜索最优解的空间。

如何评价结果的好坏

解决第一个问题的方法可以考虑用Contrastive Learning的方法使用样本库数据训练一个美学评估模型,然后对输入的每张图片都可以给出一个评分,用以判定结果的好坏。这个可以参考一下Appu Shaji 2016年的一项工作。如果结合清华陈雨兰2020年的论文,还有可能在二维的图像美学空间,对图像的美学风格做出定量的描述,进一步增强设计结果的可解释性。

对图像的美学风格的定量描述

如何缩小搜索最优解的空间

解决第二个问题的方法有随机采样、离散化搜索空间、SeqGAN等方法。2016年微软有篇文章提出,先对可选元素聚类,再对聚类的抽样进行组合。当然这些方法可以组合起来灵活使用。

3.生成模型

优秀的设计作品凝结了设计师的经验和智慧,机器可以通过对样本库中样本作品的对比、自监督等学习方法从数据中发现规则,构建自己的经验体系,沉淀为解决各种问题的AI模型。之后,不仅可以对设计好的作品进行评分,还可以在给定需求的情况下,设计创作一些新的布局或版式。

我们知道,设计师成长的过程包括理论学习、作品鉴赏、实战经验三个重要部分。样本库对于机器来说同时涉及前两个过程。另外,样本库里的样本经过原子化拆解后,会得到很多素材和规则,包括图片、文字、配色、字体等,可以进一步丰富素材和规则库的内容。

除了挖掘样本库中的隐藏知识外,一些显性的经验和知识,比如1.0阶段里的策略和规则等,则可以进一步沉淀为设计专业知识图谱。这些知识图谱,可以在检索和组合优化过中发挥重要的作用,大幅提高系统的效率,并且帮助机器避免一些常识性的错误。

The Linked Open Data Cloud上的media&music关联数据集

2.0阶段的特点是强数据弱规则。随着数据的积累,系统的设计能力会越来越强,用户的满意度也会随之越来越高。

但是在这一阶段,机器与用户的交流方式仍以固定格式的表格或选项为主,反馈渠道和方式也相对有限。虽然在设计方面具备了一定程度的创作能力,但本质上仍然是一个提升效率的辅助工具,在很多方面或场景,特别是需要沟通的地方,仍无法完全替代传统设计师的位置。

3.0阶段:类人化

无时不在的AI设计师,从沟通到设计的无缝对接。

随着Web3.0时代到来,我们不难发现,创作者经济也从以前的“集中化”逐渐过渡到“个性化”,创作的形式和载体也因Web3.0的开放性而逐渐打破平面,步入多元。智能设计也将过渡到3.0阶段——类人化,此时可以将智能设计看做是一个私人设计师的概念,借用Personal Computer的命名,可以称作Personal Designer。

设计是有目的的创作行为,最终目的是为了满足人们的某种需求。只有获得用户的认同,引起共鸣的设计,才有可能成为一个好的设计。而要真正理解其真实需求与背后意图,必须保证与用户之间畅通的交流渠道,这一点甚至是在很多人类设计师中都需要耗费诸多精力。

除了Logo、包装、海报、广告等商业场景和真实生活场景,甚至是在元宇宙中,都存在设计需求,可以说设计无处不在,无时不在。因此,理想的设计系统应该7×24小时待命,随时为用户服务。对于普通用户,3.0应该是一个很懂他的专职设计师;而对于设计师,3.0的应该像一个可以随叫随到的得力助手。

在“上载”世界(“来生”)中,24小时服务的客服“天使”

在3.0阶段的智能设计系统应该提供类人的交互方式,采用语音或文字聊天的方式和用户交流。用户只需要按照自己的表达习惯,自由地描述需求或指令,具体量化的过程由系统自主实施。

在前两个阶段,机器为了获得更精确的结果,需要用户做很多枯燥的选择。但是在3.0阶段,用户可以用更轻松愉悦的表达方式来描述需求与评价结果,甚至带有某种程度的娱乐和游戏性质。

近年来,深度学习改进了对话式 AI 的技术水平,降低了构建语言服务时对语言学和基于规则的技术的深度知识的需求,在服务行业中得到了广泛应用。

Nvidia 宣布目前最先进的AI 语音模型之一的BERT (Bidirectional Encoder Representations from Transformers),能用不到一小时的时间训练,AI 推论只要2 毫秒时间,对话式AI 可望能与人类有更即时的互动体验。

除了通过人机对话(语言文字)互动,在设计方面更直观的互动来自于图形本身。Google的“AutoDraw”支持自动绘画,你可以在画板上画草图,AI可以自动分辨出你画的内容,并绘制出对应的精美矢量图。

动图封面

在3.0阶段,也许你画的草图经过“虚拟设计师”的帮助,可以分分钟成为一个可商用的logo,一张精美的海报。

人工智能只有以服务对象为中心,和用户深度沟通,才能真正懂得用户需要什么,进而为其提供个性化的服务或建议。系统在收集越来越多用户的真实需求后,也会变得更加善解人意。

人工智能技术发展至今,已逐步在各垂直行业纵向深耕。在人工智能有效应用的场景中,不再停留在对静态世界的感知,而是以动态的方式参与到人类世界的交互当中。从规则实现开始,再到数据驱动,最后实现真正的需求驱动,智能设计终将进化为一名虚拟设计师,也许不一定是超级的,但一定会是合格的。


参考文献:

1.内田广由纪著,刘观庆、刘星译。简明版面设计。中国建筑工业出版社,2005

2清华大学,陈雨兰,马依慧,贾 珈,计算美学,中国计算机学会通讯,第16卷,第10期,2020年10月

3.美团:http://www.mysecretrainbow.com/ai/25205.html

4.鹿班:http://www.mysecretrainbow.com/ai/252218.html

5.腾讯:http://www.mysecretrainbow.com/ai/25248.html

6.Vinci: https://dl.acm.org/doi/10.1145/3411764.3445117

7.DesignScape: http://www.dgp.toronto.edu/~donovan/design/index.html

8.Color: http://people.csail.mit.edu/jahanian/papers/Jahanian_ColorDesign_ADoMC_EI2013.pdf

9.Layout: https://dl.acm.org/doi/10.1145/2818709

10.Aesthetic: https://developer.nvidia.com/blog/understanding-aesthetics-deep-learning/

11.SeqGAN: https://arxiv.org/pdf/1609.05473.pdf

12.BLT: https://arxiv.org/pdf/2112.05112.pdf

13.DALL-E: https://openai.com/blog/dall-e/

14.ALBERT: https://openreview.net/pdf?

原文:https://zhuanlan.zhihu.com/p/522629074

- Posted in: AI

- Tags:

0 条评论 ,976 次阅读

发表评论

  1. 既然来了,说些什么?

Top