暴晒+ 沥青 + 锡板 = 世界上第一张照片?
听起来有些像是化学实验,但这正是被学界普遍认可的世界上第一张照片——《勒格哈的窗外景色》的诞生方式,尽管具体年份仍有争议,但也即将度过 200 岁的生日。
照片的作者尼埃普斯站在自家二楼的工作室窗边,架好镜头,对准庭院和远处景色,连续曝光几天,才在一块抛光锡板上捕捉到这段模糊而珍贵的影像。
如今将近两个世纪过去,这张照片却意外成了 AI 的「整活素材」。
AI 修复世界上第一张照片,越修越离谱
脑洞大开的 Reddit 网友尝试用 GPT-4o 等生成式 AI 工具「复原」这张历史影像,在网友的捣鼓下,这张老照片,迎来了它意想不到的版本。
比如在这个版本中,《星球大战》的帝国战舰降落在尼埃普斯的家中,整个画面瞬间穿越成了科幻片。
霓虹迷雾弥漫,绿蓝紫光交织的高楼林立,中心人物身披斗篷、站在高台之上,背对镜头,只能说,和 19 世纪的法国乡村风景风马牛不相及。
玩梗的网友沉浸在 AI 修图艺术,已经不知天地为何物了。红瓦屋顶统一配色、烟囱冒着蒸汽,路径弯弯绕绕像糖浆流动,一下子从纪实风变成了动画风。
再看这个版本,飞船没了、光污染也没了,原图开始包含左墙、右屋,以及中央斜坡结构。
相比 GPT-4o,《勒格哈的窗外景色》在 Flux 模型的复原中,被处理成了一座被遗弃的历史遗址,屋顶只剩下零星红瓦,仿佛早已被风雨和时间掏空。
好在,也有神来一笔的时刻,由 OpenAI o3 模型修复的画面力,熟悉的斜屋顶、塔楼、乡村小窗和光照角度,与最初的尼埃普斯作品勉强有些关系。
看到这,你或许会认为 AI 修复这张老照片,狠狠刷了一波存在感,但这股热闹背后,其实也有不少穿帮的细节,最典型的,便是照片中央那块模糊的三角形高亮区域,让 AI 们集体翻车。
这张照片的复原版本早在 1952 年就已面世。伦敦柯达实验室在历史学者赫尔穆特·格恩斯海姆的指导下,用底片对原图略作修饰并公开发布,让大众第一次清晰看见照片原貌。
实际上,当中那块三角形亮斑,并不是建筑结构,而是庭院地面在长时间曝光下,被阳光照射后留下的亮斑。图像左右是庄园的建筑墙面,远处依稀可见的则是一棵树和农田的地平线。
看得出 AI 很努力,但显然不太理解这种 19 世纪的拍照方式。
尼埃普斯用的感光材料,是把沥青混合薰衣草油涂在锡板上,在窗边放上几天(也有一种说法是 8 小时),靠太阳一点点灼印出图像。只有阳光最强的部分,才会在板上留下痕迹。
从实际复原的渲染图来看,上述大多数 AI 修图的版本都与实际建筑结构相差甚远。
复原渲染图 | Paulo Quartilho
1999 年,法国摄影学院 Spéos 的创始人皮埃尔-伊夫·马黑,曾租下当年尼埃普斯用作实验室的房间,并联合法国科研团队进行了实地考证,还为此专门拍了一支纪录片。
有趣的是,他们发现,在 19 世纪末的一次房屋翻修中,为了好腾出空间加装烟囱和壁炉,尼埃普斯的窗户被整体左移了大约 70 厘米,马黑团队也从地板结构中找到了原窗的位置,并将屋内陈设完全还原到当年的状态。
此外,尼埃普斯拍下《勒格哈的窗外景色》时,他并没有「拍底片—翻印正片」这一流程,而是把感光层直接安装在暗箱里,让光线在锡板上留下一次成像。
这就决定了相片天生是倒置影像,需要手动翻转才能像我们习惯那样正立过来。
如今,尼埃普斯居住地被改造成了博物馆,每年 7 月到 8 月开放,现在还有特定的官网可以查询预约时间。游客可以在尼埃普斯故居博物馆中,透过窗口眺望那片熟悉又陌生的庭院景观。
AI 幻觉,正在吞噬真实
早在生成式 AI 爆火之前,AI 修复古画、还原黑白照片的新闻就已经屡见不鲜。只是随着 GPT-4o、Gemini 等多模态大模型的上线,修图这件事变得更快、更普及。
当下的图像修复,底层大多基于扩散模型。
其基本机制是分两步走:先人为往图像中加入高斯噪声,逐步「破坏」图像结构;再在反向过程中通过学习将噪声一步步「复原」,最终生成一张看起来「无损」的图像。
在实际图像修复任务中,AI 只会对损坏区域进行采样和重建,不修改已知区域。这种方式可以确保修复内容风格统一,且兼顾效率与质量。
而有些模型,比如 SPIRE 这样的语义控制框架,则会通过提示词把修复方向「锁定」在用户指定的内容上。ControlNet 等模块负责保持模型的「语义一致性」和「修图边界感」,避免过度发挥。
为了修得更「像」,还会引入了重采样机制。
如果 AI 修出来的内容偏题、风格不符,模型会检测到不合理,(比如语义特征不一致),会将结果「退回上一步」重新修。这个回溯跳跃长度越长,AI 越有可能纠正自己的「幻觉」。
北京理工大学与澳大利亚国立大学今年联合发布了关于 GPT-4o 图像修复能力的实验结果。研究团队采用了一种直觉式方案:将退化图像输入 GPT-4o,提取语义特征并叠加其「修复建议」,生成最终图像。
结果却是,好看是真的,但画面准确度就另当别论了。
GPT-4o 生成的图片视觉冲击力拉满,在 CLIP-IQA 等主观指标上得分很高。但在像素级对比上却掉了链子,PSNR(峰值信噪比)得分甚至低于原图。换句话说,GPT 修得可能「更假了」。
就像《勒格哈的窗外景色》,被 AI 修成一张看起来合理的复原图。你若没留个心眼,很可能就信了。当然,AI 修错一张照片,不稀奇;但可怕的是,修错之后,没人觉得有问题。
倘若 AI 修图是以原图为基础进行补全、美化,属于加工,那么 AI 生成图基于文本或模糊图像直接构造全新图,属于重构甚至伪造,现实中,AI 图像替代真图的情况已屡见不鲜。
去年,Facebook 上广为流传着一张黑白老照片,配文写着:「亨利·福特坐在他第一辆汽车福特四轮车中,摄于 1896 年。」结果对比历史馆藏,这照片完全不对。人物长相不符,车辆设计也错,AI 图中的车还有方向盘、穿模的手,堪称 AI 幻觉的教科书案例。
类似的还有一张号称莱特兄弟首次动力飞行的。画面中两名年轻男子站在一架古董双翼飞机前,表情神情自若。但对照历史档案,这同样是张假照片。
更深一层的担忧在于,这一切并不容易被察觉。