人工智能工具即将改变艺术世界
克里斯·罗德利 (Chris Rodley) 并不认为自己是艺术家或计算机科学家。但当他在推特上发布了一张他使用机器学习算法创建的图像时,该图像将一页恐龙插图与一页花卉图案交叉在一起,许多人认为他两者都是。这张巧妙融合的图像看起来像园艺师对侏罗纪公园的演绎,迅速走红。不久之后,他发现自己被大量要求购买高分辨率副本的消息淹没。
“这是一次非常成功的拖延尝试,”博士罗德利说。悉尼大学数字文化专业的学生。他解释说,他在DeepArt.io上生成了混搭,这是一个由深度神经网络(一种先进的机器学习算法)驱动的在线程序,可以识别和组合一个图像的风格元素并将其应用到另一个图像。无需艺术或编码经验。
Rodley 在 DeepArt 中使用的技术被称为风格迁移,它只是新一波算法辅助艺术中的一种方法。近年来,随着开发人员不断改进它们,以更快的速度创建日益复杂、美丽的视觉和声音混合体和原创作品,此类程序重新兴起。
然而,随着这些算法的复杂性和功能的增长,它们的用户开始将对其输出的更多艺术控制权交给机器。这样做时,他们也可能放弃另一种类型的控制:对创意产品的所有权。其后果可能会改变主流艺术的生产方式、我们消费它的方式以及我们如何评价其背后的艺术家。
算法艺术并不是什么新鲜事,但在其早期,它并没有比其他更人类的艺术形式更重要。已知最早的生成计算机图形由德国数学家、“计算机艺术之父”Georg Nees 在 20 世纪 60 年代中期创建,主要由线条和多边形的黑白墨水图组成。第一个计算机生成的音乐作品是勒贾伦·希勒 (Lejaren Hiller) 和伦纳德·艾萨克森 (Leonard Isaacson) 的《伊利亚克弦乐四重奏组曲》(Illiac Suite for String Quartet),早在 1957 年就问世了。这两部作品都是高度实验性的,面向学术受众。这两种艺术作品都体现了算法中严格、基本的规则的严格性。甚至后来的作品,例如 Brian Eno 1996 年的专辑Generative Music 1 (在软盘上发布)仍然依赖于简单、直接的算法指令。正如伊诺曾经描述的环境音乐一样,最终的结果是“既有趣又可忽略不计”。
算法艺术在过去十年中取得了巨大进步,这在很大程度上要归功于人工神经网络的复兴,这是一种机器学习方法,可以松散地模仿大脑中神经元如何相互激活。神经网络特别擅长在程序员训练它们的材料中提取复杂的、隐藏的模式。神经网络不必像 Nees、Hiller、Isaacson 和 Eno 那样费力地编写将输入转换为艺术输出的每一条规则,而是可以从输入的材料中自动导出规则。
例如,deepjazz ,一个由普林斯顿大学博士创建的程序。学生 Ji-Sung Kim 使用人工神经网络来拾取爵士乐歌曲中的音乐模式,并根据它们生成全新的歌曲。该软件读取 MIDI 文件并尝试在歌曲的音符和和弦中查找模式,就好像它们是未知语言中的单词和短语一样。一旦 Deepjazz 确信它已经学会了歌曲的“语法”,它就会输出遵循该语法规则的随机音乐句子。一位记者甚至训练 Deepjazz 输出其中一场基于《老友记》主题的算法即兴演奏会。结果……令人困惑。
罗德利用来创造花化史前爬行动物的程序也依赖于一种神经算法,特别是Leon Gatys 和他在图宾根大学的同事于2015 年开发的算法,来获取图像中的艺术内容和风格元素。自从他们的论文发布以来,这种风格转移已被用于Facebook和Prisma的照片滤镜以及移动图像,例如病毒视频《2001:毕加索奥德赛》。克里斯汀·斯图尔特 (Kristen Stewart) 在她的短片和导演处女作《来游泳》中也运用了风格转换,重新绘制了一个简短的梦境序列以她所画的印象派绘画风格。(她的名字还出现在一篇机器学习论文上。)
算法艺术也不限于抽象或组合艺术。相同的通用机器学习技术已被用来生成不存在的事物的高分辨率、逼真的图像。就在本周,图形处理单元制造商英伟达发表了一篇论文,记录了研究人员如何做到这一点,并得出了令人难以置信的令人信服的结果。其中,一个拍摄冬季街景的图像并预测在绿树成荫、阳光明媚的夏日它会是什么样子:
这一结果让互联网上的一些人感到恐惧,他们担心这种越来越可信的创作会削弱对媒体的信任。(对于那些寻求安慰的人来说,英伟达还把家猫和大型猫科动物进行了杂交,并且在之前的研究中,制作了假名人的头像。)Gene Kogan 是一位生成艺术家,也是《艺术家机器学习》一书的作者,他使用类似的方法来制作不存在但逼真的地方图像,例如船库和山丘。尽管 Gatys、Nvidia 和 Kogan 各自使用不同种类的神经网络,但这三个系统都在现有作品上进行训练,以提出艺术规则,然后用于创建新图像。
随着算法的艺术产品不断进入主流,我们也开始看到公司和学术机构投入资金和工时来提高其背后生产方法的速度和能力。康奈尔大学和 Adobe 研究人员一直在研究照片风格迁移的复杂版本。他们正在开发的过程中,除其他技巧外,还可以将一张照片的日落光线应用到另一个地点的白天照片上。谷歌也一直致力于“增压风格转移”。那里的研究人员找到了一种方法,让机器学习如何将多种风格组合成一个图像,就像混合颜料一样。Gatys 和他在蒂宾根的同事们也在继续改进他们的系统,包括找到一种方法让用户通过保持某些颜色或仅对图像的特定区域进行样式化来微调输出。
随着人们对这些艺术生成算法的兴趣激增,我们似乎已经接近这项技术的突破点。然而,我们仍然没有考虑到这些工具对于使用它们的创意人员意味着什么的问题。当然,艺术家一直受到他们可用媒体的功能和限制的影响。艺术史也是技术史。预混合颜料、人造色素、印刷机、相机、留声机、CD、数字制作工具、互联网等等都彻底改变了艺术家的创作方式和内容,以及他们的顾客的消费方式和内容。创作者一直在借用、提升、采样和重新混合其他艺术家的作品,并使用工具来增强自己的能力。
不同的是,随着这些高级算法的复杂性和功能的增长,艺术家越来越难以控制机器从他们的输入中生成的内容。尽管用户可以控制人工神经网络训练的数据,但系统从数据中得出的规则可能有点像黑匣子。弄清楚神经网络是如何得出规则的更加困难,即使对于构建神经网络的程序员来说也是如此。这种不透明性使得艺术家很难或不可能修改机器的风格输出。通常,影响它的唯一方法是通过反复试验——在输入阶段,这将数字艺术家的角色转变为算法管理员。
从本质上讲,这种复杂的软件将更多创造性的跑腿工作转移给了机器。因花卉恐龙而闻名的罗德利将制作风格转移作品的过程描述为就像导演试图让演员获得良好的表演一样。“你不用按一个按钮,有些东西看起来就很神奇,”他说。“我已经了解了算法的怪癖和个性特征。” 最近,他说他花了几个小时在 Photoshop 中调整波提切利的《维纳斯的诞生》的颜色,试图说服算法用金毛猎犬的毛皮重新创作这幅画。(最终他得到了虽然毛茸茸但可识别的结果。)
这些项目也可能会改变我们评价其背后的艺术家的方式。随着这些系统的改进以及 Adobe 和 Google 等公司开始将它们融入到客户端产品中,我们可能会看到更多的算法艺术渗透到主流文化中。该党的主张是,这些工具将减轻艺术家(平面设计师、工作室音乐家、电影剪辑师)的一些负担,让他们有更多时间专注于“真正的工作”。但与其他形式的自动化一样,为“实际工作”留出更多时间可能会导致数字经济中艺术家的就业机会减少。
未来,随着算法能够更好地掌握专家艺术家经常花费数年时间学习的基本美学规则,一家公司可以只用一个样式表、一些线框和一些设计师来将两者结合在一起,创建一个完整的广告活动。像罗德利一样,这些争论者甚至可能不需要艺术背景。
这已经开始发生了。阿里巴巴集团旗下的中国购物网站淘宝为其大型购物节日“双十一”制作了横幅广告,通过训练算法来识别成功电子商务广告的设计模式,并根据这些模式生成新的广告。就在几周前,Airbnb 展示了一款内部工具,该工具使用算法艺术技术将粗糙的手绘草图转换为完全设计且功能齐全的网络原型。
乐观主义者可能会认为,创新、情感和意图等模糊的、与生俱来的人类品质将保护艺术家不被算法取代。毫无疑问,至少在不久的将来,这些品质肯定会保护创作过程的某些部分和某些类型的艺术家(尤其是高度重视原创性的美术)。但这并不能让平面设计、歌曲创作或图库摄影等商业领域的艺术家放心,他们可能会发现自己工作的某些方面被次优但便宜得多的算法所取代。
此外,艺术家在保留对其作品的合法所有权的同时,能赋予算法多大的创作控制权也是个未知数。在某些情况下,软件所有者可以利用最终用户许可协议--我们在使用许多数字产品时盲目点击 "我同意"--来主张或放弃所有权,或介于两者之间。
根据 2001 年地区法院的一项裁决(Torah Soft Ltd. 诉 Drosnin 案),当最终用户(此处指艺术家)借助软件制作作品时,如果软件被认为对 "大部分创意 "负有责任,则软件公司可以主张对作品的所有权。
现在判断其他法院是否会遵循或偏离同样的推理还为时过早,但最近在精英计算机图形公司 Mova 与主要电影制片厂迪士尼、福克斯和派拉蒙之间的一个戏剧性且可能具有里程碑意义的案件中,出现了构成“最大份额”的推理。
这些工作室承认在《银河护卫队》和《本杰明·巴顿奇事》等电影中故意使用窃取的 Mova 技术将演员的面部表情转化为逼真的计算机图形。Mova 声称,由于他们的工具在生成面孔方面承担了大部分创造性工作,因此电影中出现的任何类似动话表情的角色都是非法衍生作品(阅读:他们有权获得更多的钱)。工作室反驳说,演员和导演承担了大部分工作,如果法院站在 Mova 一边,这将为数字艺术家树立一个危险的先例。
“如果 [Mova] 的作者所有权理论成为法律,那么 Adobe 或微软将被视为 Photoshop 或 Word 用户通过使用这些程序生成的任何表达作品的作者所有者,”工作室被告的律师凯利·克劳斯 (Kelly Klaus) 写道。
如今,算法艺术社区中普遍存在的开源文化可以保护艺术家免受其中一些担忧。但随着工具转移到私人领域,艺术家可能会发现自己陷入困境,具体取决于司法系统的立场。
将创造力交给软件也可能会改变艺术家的最后一个控制要素:观众如何看待他们的作品。当此类意图问题被置于人工神经网络的黑匣子中时,艺术爱好者可能不得不改变他们对艺术的分析——花大量时间解释风格选择或对创作者的意图进行心理分析。在人类作者身份变得越来越模糊的世界中,也可能存在困惑、尴尬或不信任。
这可能会让艺术消费不再那么关注批评,而更多地关注品味和美学。罗德利解释说,这可能会让艺术评论家感到失望,但他相信这会让艺术变得更容易接近。“它威胁到了当前的艺术模式,但不会威胁到人类的创造力,”他说。“我们应该挑战只听艺术家意见的想法。”
确实,从根本上改变了艺术生产和消费方式的技术都产生了新的、深刻的创造性表达形式。正如雷诺阿所说:“没有管中的色彩,就不会有塞尚、莫奈、毕沙罗,也不会有印象派。”
然而,这些工具可能会牺牲艺术家的利益。随着印刷机的出现,大量复制品出现了。随着 MP3 的出现,盗版也随之而来。随着计算机的出现,人们开始转向数字媒体。Photoshop 带来了不信任。对于这些历史力量来说,算法艺术也不例外。算法所开启的充满艺术潜力的充满活力的世界将因艺术家失去控制的可能性而变得黑暗。