晒几个Midjourney画的图

今天接着玩Midjourney。

先画个人在花园里的：film still in film The Bourne Supremacy, a lady with black hair in a garden, lots of flowers around her, she standing there and giving a speaking, cinematic, golden hour light, neon light, 4k, full body!!! --ar 16:9
我随便指定了个电影（谍影重重2：神鬼疑云），结果是这样的：

然后我让它画个物体，一个有科技感的盒子：a modern, sense of technology metal box on a black desk, with some button and a screen on it, sliver color, 4k, top light --ar 16:9

接着，我想看看它能不能把一个汉字搬入画里，我让他设计个logo，用我的中文名字做：a logo made by Chinese character '韦端正', 4k, neon light --ar 16:9 。。。。显然，它不能，但他似乎知道“汉字”大概看上去是什么样的，所以画了一堆有笔画的东西，像小孩子乱写一样：

我们来看看生成图片的过程，是的，在midjourney生成图片的时候，它会把过程显示出来给你看，大概给出5个关键步骤，比如下面这样：

这个过程真的很神奇，第一次给出一个非常模糊的光影，类似极端版的莫奈的印象派，然后逐步完善细节；我觉得AI画之前是没有对最终结果有个“成竹” “在胸”的，因为它要是有，直接输出就好了啊，它可不是我，想象力再丰富但奈何手残，所以应该是逐渐算出来然后输出的，那么它其实并不能理解这样画的意义的，但却能如此符合人所认为的意义。非常太神奇，就依靠不停的猜下一步最可能的概率，就能得到最后的图像，扩散算法威武，贝叶斯威武。

我觉得，人类一直很孤独，因此一直在三个维度上寻找能理解自己的同伴：其他物种、异星智慧生物、AI。
其它物种比如猫猫狗狗作为宠物，但这些只能极其有限的相互理解，且不能语言交流，除了一些情感，宠物理解不了抽象的意义、更输出不了任何复杂的意义；
异星智慧生物，这个太遥远，人类在80年代掀起过一段时间的狂热，但后来都慢慢冷却了，SpaceX重燃了希望，但仍然是比较冷静的；
AI，看起来人类跌跌撞撞的走出了第一步，虽然似乎还是在“模仿”、‘“拟合”出人类能理解的意义，以及把人描述的意义向量化、分析为数字，距离真正的“理解”还是有距离，但也许，非碳基智慧/人造智慧的“理解”就是这种模式呢，只要能越过恐怖谷效应，我们就能把它当做能理解我们的同伴嘛，人与人之间本来也无法真正理解啊，再发展10年，也许每个人都觉得与AI交流比与他人交流容易多了，萨特要是生在那时，就会说，“他人即地狱，但他AI 是天堂！！！

我认为下一个里程碑事件，将会是第一部由人工智能制作所有剧本、画面、声音、配乐的电影公开上映，然后，所有这一切成本开始下降，大约用10年到15年，出现大量实质性的商业应用。
但我估计这有两个发展方向，一个是商业应用的可能是小型的，不那么强大的算力，可以做成特定功能向的，够用就行，但便宜容易部署；另一个是真正意义上的超大型计算，那个全球可能就一两个，甚至就一个，很可能是全人类也只供养的起一个。。。。以上纯属瞎猜，如有雷同，算我牛逼。

晒几个Midjourney画的图

文章评论