您现在的位置是:首页 > 科技 >正文
别慌,AI 绘画杀不死艺术
发布时间:2022-11-28 17:41:04褚岚眉来源:
AI 绘画一日,人间一年。
上半年走红的 Dall-E 2、Midjourney,下半年风头完全被 Stable Diffusion 盖过。
近期火热的绘图产品,名字里都有「diffusion」,它们均得益于人工智能「扩散」算法。该算法突破了 AI 绘画的应用临界点,更易上手,效果更好。
机器作画已经有半个世纪的历史,而两年之内,AI 绘画忽然成了「进击的巨人」,不仅质量肉眼可见的提升,生成图片的速度也从年初的几个小时缩短到十几秒钟。
AI 绘画技术的大幅度进步,激发了人们对「创意 AI」的兴趣——从美术到诗歌,一系列 AI 工具正在模仿人类的创造力。但没有什么人真正觉得惶恐。
前一阵子,有不少人猜测生物学家颜宁离美归国,是因为 AlphaFold 人工智能系统能够预测蛋白质结构,被抢了饭碗。实际上,能写新闻资讯的软件早就存在,并没有记者为此失业。AI 连写豆腐块的人都无法替代,更不用说能替代顶尖科学家了。
扩散算法是什么?
当下的人工智能模型,使用的都是深度学习神经网络。自学习模型,比如 GPT-3 是其中最著名的模型,它会在大约 45 TB 文本数据的神经网络上「学习」,生成和人类产出相差无几的作品。
Stable Diffusion 是深度学习家族的一部分。具体来说,Stable Diffusion 通过潜在的扩散模型,学习图像和文本之间的联系。它的工作原理是,获取图像数据,并对其添加「噪点」。噪点,也叫噪声,是指数码摄影器材拍摄的图像中,存在的粗糙点,一般受电子干扰产生。
一幅画面被逐步加入噪点,一直到整个画面都变成白噪点。该模型记录这一过程,进行逆转,给 AI 学习。
从 AI 的角度,先看到的是一幅布满噪点的画面,再看到画面一点点变清晰,最后成为画作。AI 学的是整个去噪点的过程,特别是如何处理高斯噪声,最后生成画作。
高斯噪声指的是概率密度函数服从高斯分布(即正态分布)的一类噪声,扩散算法添加高斯噪声,一是为了验证「实际」图像的有效性,因为使用环境里的图像都是带噪点的;一是为了方便学习,只要噪点不符合标准正态分布,就算失效。
Stable Diffusion 的基础数据库叫 LAION-Aesthetics,包含了带图说的图像,还根据「审美风格」进行过滤。其他经训练的人工智能模型也对数据库进行「修正」,来预测人们如何回答「你有多喜欢这幅画」时的打分评级,以便消除一些黄暴内容。
和「前辈」有何差别?
Stable Diffusion 和 Dall-E 2、Midjourney 类似,都要靠「文字描述」生成图像。
不过,Stable Diffusion 是开源的,其基础代码也是公开的。而 Open AI 和 Google 都没有开放自己的人工智能模型。
Stability AI 由 4000 多个英伟达 A100 GPU 组成,在亚马逊云(AWS)中运行。据报道,Stability AI 公司的运营和云支出成本,超过 5000 万美元。
该公司声称可以提供「速度和质量的突破」,内存低于 10 G 的 GPU 也能跑。他们还会提供运行在 AMD、苹果 M1/M2 芯片的版本。
目前,Stable Diffusion 的功能是,可以在几秒内将文本转换为 512×512 像素的图像;图像可以转换、放大、修改和替换;使用 GFP-GAN 建模,允许用户上传模糊的面部图像,进行放大或恢复原貌。
上个月,Stability AI 公司融资 1.01 亿美元。首席执行官 Emad Mostaque 毕业于牛津大学,获数学和计算机科学硕士学位,此前曾在多家对冲基金担任分析师。目前,该公司估值 10 亿美元,除了 Stable Diffusion,还有 Dance Diffusion——可以进行音乐剪辑。
Stability AI 的赚钱计划是,为客户训练「私有」模型和通用基础设施平台。它有一个平台 DreamStudio,个人用户也能访问。现在 DreamStudio 拥有超过 150 万用户,创建了 2 亿张左右的图像。算上所有渠道,Stable Diffusion 用户超过 1000 万。
该公司还高调聘请了 Google 科学家、未来学家 Daniel Jeffries。
这算艺术吗?
随着各种各样的人工智能公布,相关的道德法律问题也在增多。Stable Diffusion 允许生成真人图像,问题就愈发显得「严重」。
Stable Diffusion 已经被用户拿来创作了不少敏感内容,伪造的名人照片满天飞。Getty Images 已经禁止上传 Stable Diffusion 生成的图片,原因是担心知识产权纠纷。
美国众议院众议员 Anna G. Eshooo 最近公开发信,敦促美国国家安全顾问和科学技术政策办公室解决这些「不安全的模型」。
Stability AI 在发布公告中,公布了一份「允许商业和非商业用途的宽松许可证」,实际上就是和用户之间的协议。它指望用户自我规范行为,做「正确的事」,也没什么效力处罚不遵守规则的用户。
除了法律问题,人工智能生成的作品,也饱受怀疑。
反正美国版权局认为这些图像「不是艺术」。今年 2 月,版权局的审查委员会就驳回了由人工智能生成的图片的索赔申请。
审查委员会强调,「人类作者身份是版权保护的先决条件」,并且需要「人类思想与创造性表达之间的关系」。美国联邦法院也在近期的判决中认为人工智能不能算专利「发明人」。
人工智能艺术吸引力很大,虽然法律上不被承认,但市场承认。2018 年,佳士得就以 43.5 万美元的价格出售人工智能绘画作品。而且,绝大多数消费者,都分辨不出 AI 绘画和人类画家的作品。
最具争议的是今年 9 月的科罗拉多州博览会(Colorado State Fair)的美术比赛,人工智能的作品《空间歌剧院(Théâtre D’opéra Spatial)》获得头奖,由 Midjourney 制作,操作者 Jason Allen 说「艺术已经死了,人工智能赢了,人类输了」。
其实倒不用一概而论,对人工智能的创作,既无需乐观过头,也不用夸大悲观。
人工智能的艺术创作,是按人类的「逻辑」产生的,自然比不上人类精英,但超过其中的庸才,当然是绰绰有余了。
标签:
「小帅和小美」,用三分钟毁掉电影下一篇
最后一页
猜你喜欢
最新文章
- 别慌,AI 绘画杀不死艺术
- 0-0=无解,世界杯首场假球?身价12.6亿球队仅8射,前锋担心进球
- 世界杯死亡之组最新形势:德国队8-0=稳出线,日本队或飙升至第1
- 「小帅和小美」,用三分钟毁掉电影
- 第2轮战罢,世界杯E组乱成了一锅粥!西德1-1战平,日本尴尬落败
- 在车里看个球而已,别骂了
- 阿木爷爷、林果儿出圈又出海,中国传统文化怎么爆火海外平台?
- 出线或出局?世界杯今日看点:德国大战西班牙,日本迎出线良机
- 2023 年最吸引人的小城市就是它们
- AI看了70000小时《我的世界》视频学会人类高级技巧
- “不做金融”周鸿祎,半年靠网贷生意赚21亿
- 马斯克特斯拉内部邮件火了:痛恨开会,少说黑话
- 唯品会:高利润,慢增长?
- 苹果“突然”变脸,中企吃了“闭门羹”,央媒的呼吁该重视了
- 根据赛程积分形势,巴西为内马尔制定了复出计划
- 「今日韩足晚报」(2022.11.27)-十连冠!仁川女足笑傲WK联赛
- 「虎啸多哈」2022卡塔尔世界杯韩国队战报-金玟哉恐无缘次战
- 世界杯最佳中场组合大热门出彩 国米双星被迫开启二选一决死战
- NBA!湖人队143-138险胜马刺!詹姆斯39分!施罗德21分!威少11分
- 裁判专家:河南嵩山龙门队被判点球是误判,漏判长春亚泰外援红牌
- 「深度」弗利克亡羊补牢,一粒德式中锋进球指明德国队出路
- 传射建功追平马拉多纳纪录,梅西让阿根廷还活着
- 32年超越时空,世界杯成沉浸式情怀回忆
- 上一个像姆巴佩这么逆天的年轻人,还是贝利……