今天接着玩Midjourney。
先画个人在花园里的:film still in film The Bourne Supremacy, a lady with black hair in a garden, lots of flowers around her, she standing there and giving a speaking, cinematic, golden hour light, neon light, 4k, full body!!! --ar 16:9
我随便指定了个电影(谍影重重2:神鬼疑云),结果是这样的:
然后我让它画个物体,一个有科技感的盒子:a modern, sense of technology metal box on a black desk, with some button and a screen on it, sliver color, 4k, top light --ar 16:9
接着,我想看看它能不能把一个汉字搬入画里,我让他设计个logo,用我的中文名字做:a logo made by Chinese character '韦端正', 4k, neon light --ar 16:9 。。。。显然,它不能,但他似乎知道“汉字”大概看上去是什么样的,所以画了一堆有笔画的东西,像小孩子乱写一样:
我们来看看生成图片的过程,是的,在midjourney生成图片的时候,它会把过程显示出来给你看,大概给出5个关键步骤,比如下面这样:
这个过程真的很神奇,第一次给出一个非常模糊的光影,类似极端版的莫奈的印象派,然后逐步完善细节;我觉得AI画之前是没有对最终结果有个“成竹” “在胸”的,因为它要是有,直接输出就好了啊,它可不是我,想象力再丰富但奈何手残,所以应该是逐渐算出来然后输出的,那么它其实并不能理解这样画的意义的,但却能如此符合人所认为的意义。非常太神奇,就依靠不停的猜下一步最可能的概率,就能得到最后的图像,扩散算法威武,贝叶斯威武。
我觉得,人类一直很孤独,因此一直在三个维度上寻找能理解自己的同伴:其他物种、异星智慧生物、AI。
其它物种比如猫猫狗狗作为宠物,但这些只能极其有限的相互理解,且不能语言交流,除了一些情感,宠物理解不了抽象的意义、更输出不了任何复杂的意义;
异星智慧生物,这个太遥远,人类在80年代掀起过一段时间的狂热,但后来都慢慢冷却了,SpaceX重燃了希望,但仍然是比较冷静的;
AI,看起来人类跌跌撞撞的走出了第一步,虽然似乎还是在“模仿”、‘“拟合”出人类能理解的意义,以及把人描述的意义向量化、分析为数字,距离真正的“理解”还是有距离,但也许,非碳基智慧/人造智慧的“理解”就是这种模式呢,只要能越过恐怖谷效应,我们就能把它当做能理解我们的同伴嘛,人与人之间本来也无法真正理解啊,再发展10年,也许每个人都觉得与AI交流比与他人交流容易多了,萨特要是生在那时,就会说,“他人即地狱,但 他AI 是天堂!!!
我认为下一个里程碑事件,将会是第一部由人工智能制作所有剧本、画面、声音、配乐的电影公开上映,然后,所有这一切成本开始下降,大约用10年到15年,出现大量实质性的商业应用。
但我估计这有两个发展方向,一个是商业应用的可能是小型的,不那么强大的算力,可以做成特定功能向的,够用就行,但便宜容易部署;另一个是真正意义上的超大型计算,那个全球可能就一两个,甚至就一个,很可能是全人类也只供养的起一个。。。。以上纯属瞎猜,如有雷同,算我牛逼。
文章评论