5月29日消息,新加坡国立大学和香港中文大学的研究人员声称已经创造了一种人工智能——称为MinD-Video,可以从大脑信号中重建“高质量”视频。
正如研究人员在一篇论文中介绍称,MinD-Video AI 模型是根据来自 fMRI 读数的公开可用数据和 AI 图像生成器 Stable Diffusion 的增强模型共同训练的。
研究人员称,他们的模型能够完全基于大脑读数生成高质量的 AI 重建视频,平均准确率为85%。
这篇新论文建立在研究人员之前使用人工智能通过仅分析脑电波来重建图像的努力的基础上。
MinD-Video可将大脑信号生成视频效果着实让人惊艳,例如,一段关于一群人走在繁忙街道上的视频被翻译成同样拥挤的场景,生成的视频色彩更鲜艳。
不过效果还有些瑕疵,例如,水母的视频莫名其妙地变成了鱼游泳的片段,而海龟的视频被重新解释为鱼的镜头。
研究人员认为,这些人工智能世代也可以提供神经学见解,例如显示视觉皮层在视觉感知过程中的主导地位。
尽管这项研究令人着迷,但我们距离能够戴上头盔并获得完全准确的人工智能生成的视频流的未来还很遥远。
来源:站长之家