说再见-AI

告别从来都不是容易的事情。特别是当你要告别一群像Thoughtworks同事这样对你产生过影响和塑造的人。但在美好的四年之后,是时候让我迈出这一步,继续我的设计师之旅,进入数字产品领域。

在Thoughtworks,就像其他地方一样,离开公司之前写一封“退出垃圾邮件”的传统。

在Thoughtworks的时候,我有幸阅读了一些精彩的离职“垃圾邮件”,而这些邮件都得到了社区的美好回应,让我领悟到企业环境中文化的重要性。

我自己写这样的东西一天感到非常有压力。但是当时机成熟时,我立刻知道我想要为我的告别留言做什么:用“悲惨世界”风格的音乐短片视频演唱一首叫做“最后一天”的史诗歌曲,我扮演休·杰克曼,借助人工智能助手。

这就是我做的,这就是我是怎么做的:

步骤1:幻觉音乐歌词

助手:ChatGPT

用一个段落写出一首名为"最后一天"的百老汇管弦乐音乐歌曲,歌词主要讲述一个设计师离开现有工作追求新的冒险。提及伟大的文化和鼓舞人心的同事。提及有机会学习和成长。感谢斯图加特办公室社区。同时表示作为一个人他会思念这些人,但作为一个设计师他期待新的冒险和机会。最后邀请大家通过LinkedIn保持联系。

这是我给ChatGPT刺激的歌剧歌词。之前有两个版本的这个刺激,我没有选择,因为输出太长,有点过于陈词滥调。

除此之外,我没有做任何改动,直接将输出传递到步骤2。

Midjourney hallucinations for “a male bald designer singing the main act of an epic musical in a room full of sharpies, pop art, concept art, brush strokes, dramatic lighting”

步骤2:幻想一首史诗般的音乐歌曲

助理:Suno

Suno是一个音乐生成人工智能,我之前已经很快乐地使用过它。通过使用它制作个性化的生日歌曲,它大大提高了我的Meme游戏水平。

Suno有一个自定义提示功能,在这里您可以输入带有注释和舞台指示的特定歌词,音乐风格和歌曲标题信息。对于歌词,我使用了来自ChatGPT的输出。

为了找到适合音乐风格的好提示,我浏览了“音乐”的示例,并结合了我喜欢的示例的提示。最终,我选定了“男声,管弦乐,百老汇,音乐剧,史诗,合唱,电影,乐观”作为我的歌曲标题,“最后一天”。

苏诺确实是一盒巧克力,你永远不知道会得到什么。我尝试了多次才最终找到一首我喜欢的歌曲。和大多数AI助手的输出一样,它和我心中的歌曲完全不同。但这只是和AI助手合作时不得不接受的事实,你可以选择接受它,或者让它把你淹没在噪音和干扰中。

第三步:把我想象为休·杰克曼

助手:中途

我目前在Midjourney中正在大量实验样式引用(- sref)功能,所以我也用它们进行了这个实验。

我只使用了以下三个提示来创建关键视觉,并为我喜欢的图像创建了更多的变体。主要是因为我对这些提示的结果感到满意,而对其他提示的结果真的不喪心痛。

对于前两个我还给了 Midjourney 一张我的照片作为参考。

“图像提示:[链接到我的图像] 一位秃头的男设计师在装满尖头笔、波普艺术、概念艺术、刷子技巧和戏剧性照明的房间里演唱一场史诗音乐剧的主要角色 — sref 32 — 混乱 20 — ar 3:2”

想象提示:舞台上有一支大型管弦乐队,看起来像一个超现实主义的初创办公室,流行艺术,概念艺术,笔触,戏剧性灯光 — sref 32 — 混乱20 — 宽高比 3:2

-sref 32是我在Midjourney子论坛上看到并喜欢的样式参考。-chaos 20似乎是图片变化的一个很好的值(默认情况下,Midjourney为您的提示创建四种变化),-ar 3:2是3:2纵横比的参数(默认值为1:1)。

步骤 4:产生错觉运动

助手:露玛

现在我拥有一组视觉上有趣的图片,有时候甚至非常奇怪。

为了给图像添加动画效果,我选择了Luma,这并不是别的原因,只是因为在Youtube教程中提到过它。用户界面需要改进,我不确定其他人是否像我一样对错误和奇怪的结果感到满意。

我为每张图像使用了相同的提示,是一个男人在唱歌、跳舞,并且每个5秒的视频都延长了另外5秒,使用相同的提示。视频延长增加了怪异和故障的程度,这是我概念的一部分。比如,“我”变成了跳舞的女人,或者“我”从水池里掉下来或跌入水中。

步骤6:创建第一次剪辑

对于视频编辑,我选择了 Canva,这是我使用过的第一个非全面人工智能助手。Canva拥有许多人工智能功能,但我没有使用其中任何一个,因为我已经在脑海中有了非常清晰的想法,知道我希望视频看起来是什么样子。

我把音频剪辑到1:37,并制作了一首延长版的歌曲,我也与我的同事分享了这首歌。

视频编辑非常直截了当,Canva的功能限制确实帮助我专注并保持简单。

为了做好下一步的准备,我不得不将每个长序列(超过5秒)分割成较小的片段,以适应下一个助手的文件大小限制。然后我导出每个片段作为单独的序列。

第7步:梦想通过对嘴部动作进行同步。

助手:皮卡

在模仿口型视频之前,我必须为每个视频序列分离音频和视频,并将它们保存为单独的文件。为此我使用了iMovie。

之后,我将音频和视频文件都上传到Pika,并使用他们的唇同步算法创建了新的唇部同步版本的视频片段。由于助手无法在更模糊和扭曲的镜头中检测到人脸,这个算法并不适用于所有视频片段。

步骤8:最终组装

对于最终装配,我再次使用iMovie将所有内容重新组合在一起。我需要修剪一些与音轨同步的片段。除此之外,没有什么特别的地方。

第九步:写邮件

为了制作一个合适的“退出垃圾邮件”电子邮件,我使用Gmail布局编辑器创建了一个漂亮简洁的HTML电子邮件,包括我的告别词、视频的预览图像及链接、歌词和歌曲的扩展版本。当然,我还添加了一个快速教程。

结果

首先,整个实验非常有趣。人工智能可以非常荒诞,我不止一次被它的幻觉逗得大笑。

我对成果也非常满意,即使视频不像我想象的那样。但人们对视频的积极和多样化反应,尤其是教学视频,让我对我达到的目标充满信心。我感觉自己为给予我很多的社区留下了一份小礼物。

这个过程也帮助我告别了我职业生涯中这个决定性的阶段,并鼓励我继续前进。

一个最后的想法

最终得到的视频,并不是我最初想要的想法。它是数百次让步和妥协的结果。从歌词、歌曲、视觉效果、动画到剪辑开始。

為了製作這個視頻,我深入探討了人工智慧的混亂和奇怪之處,並將其作為概念的一部分。但我之所以能夠相對成功地做到這一點,是因為我知道自己想要什麼。我知道我想要引起觀眾的反應,並且我對他們了解得足夠多,可以做出正確的選擇。

最后,这个过程制造了大量的噪音和垃圾。在这个视频旁边,我们必须想象一大堆幻觉垃圾。这种垃圾非常容易产生,更容易被遗忘。这种垃圾需要真正的能量和资源来产生幻觉。

所以即使可以通过AI助手做出令人难以置信的事情,我们也应该始终问自己是否应该这样做。

2024-09-03 04:11:41 AI中文站翻译自原文