体验地址:https://top.aibase.com/tool/inpaint-wechat
🖼️ 多模态人工智能的兴起,使历史模拟更加生动,通过图像与文本交互生成历史场景。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
大多数情况下,它的性能时好时坏。它不了解你的代码库,经常错误地猜测函数名称。有时它会创建带有细微错误的代码,迫使我花额外的时间分析它的输出。
项目地址:https://top.aibase.com/tool/paint3d