几张AI生成的“无心快照”
中青报·中青网记者 曲俊燕 | 写文
4月,正是春和景明的时节,记载大好春色的相片在交际网络上更迭不停。
一幅近乎完美的画面闯入我的视野:北京标志性矮板楼的窗扇外,绿意盎然的树枝上,两只喜鹊相对,窗框充当了这幅美景的画框。它构图精妙、色彩调和,超出了一张交际网络上的日子共享类图片的遍及水准。作者宣称这一画面是在自家窗外“偶尔拍到”。
双击,点赞。接着滑向谈论区,清一色的感叹和赞誉。我企图在谈论区发现更风趣的信息,直到看到这样一组对话:“美得像AI相同。” “便是AI。”
脑中登时警铃高文,我匆促再次审视那幅画面:窗户把手呈现在了不或许的方位;布景中的高楼虽像北京的“老破小”,房顶却是从未见过的款式。
或许算法猜透了我对夸姣春景的偏好,将这张“相片”归入我的信息流;或许我太乐意信赖这国际上有抓拍才能拔尖的拍摄师……总归,在点赞的0.5秒里,我上当了。跟我一同上圈套的,还有点赞的那1万多人。
隔天再看那张“相片”,它的AI感遽然变得极易辨认。但过万的点赞数,谈论区一片倒的叫好声,好像成了它的某种背书,让人不加考虑地轻信。
高度疑似AI生成的“喜鹊图”。图片来历:交际媒体截图
自从图画国际进入AI年代,作为图片修改,我一直保持着警觉。认为阅图许多,却未曾想,当一张随机的AI图投合了我某个时间的心思需求时,我也有或许被诈骗。
这件小事让我不得不考虑,人们为什么执着于将AI图片做得越来越实在?
大都情况下,对实在的寻求指向必定的目的性。例如,在上述“喜鹊图”事情中,经过对该博主主页内容的调查能够发现,经过生成契合群众预期的AI美景图,一起挑选谈论,制作一种图片由自己亲身拍照的假象,其目的是想获取流量和重视。
灾祸事情是咱们更了解的AI图使用场景。2022年重庆北碚山火时冲锋陷阵的摩托车队,2023年土耳其大地震时抱着小孩的消防员,许多类似的灾祸事情都成了AI混淆视听的重灾区。发图者经过诈骗性的图画,以博眼球获取心思满意,与流言的传达心思类似。
AI图画对拍摄的仿照,让人联想到绘画门户中的“照相写实主义”(photorealism)。照相写实主义盛行于20世纪六七十年代的欧美国家,以相机拍摄图画为蓝本,寻求画面的客观实在再现,代表画家有查克·克洛斯(Chuck Close)、奥黛丽·弗拉克(Audrey Flack)、理查德·埃斯特斯(Richard Estes)等。20世纪90年代,跟着数字成像技能的前进,图画分辨率进步,这一重视记载普通实际国际的艺术风格再度盛行起来。现在,最低劣的AI图也能大致到达照相写实主义画作的传神度。
广场(The Plaza),1995。理查德·埃斯特斯(Richard Estes)著作。其画作根据多张组成的原始相片。图片来历:madmuseum.org
玛丽莲·虚空 [Marilyn (Vanitas)],1977。奥黛丽·弗拉克(Audrey Flack)著作。图片来历:艺术家个人网站
但照相写实主义毕竟仅仅一种美学风格,很难实在仿照拍摄的呈现作用。无论是照相写实主义绘画,仍是后来的CG游戏、电影特效等仿照实际的画面,其实在感都在人们可辨认的范围内。现在,AI生成的相片级图画逾越了这一水准。某种程度上,人们对AI的传神度抱有等待,有一种“我倒要看看能有多真”的嗤之以鼻。一旦AI真的做到了,人又会发生反抗。
最近,交际媒体上鼓起让AI生成“无心快照”(careless snapshot)的盛行趋势,旁边面验证了这种心思。在生图指令中,除了描绘画面外,参加“极端平凡”“毫无构图美感”“画面短少主题”“动态含糊”“实在而紊乱”等词汇进行着重,能够生成一张类似误触手机而拍错的相片。这一次,AI的才能令人张口结舌,由于生成的图画太像那种人类拍完就删掉的废片,有的乃至还仿照了手指挡住一部分镜头的作用。由于含糊,细节愈加不行辨认,也就更难找到凭据。
惊奇背面,仍是有人发现了一些局限性。例如,用ChatGPT-4o生成的“车停在路旁边”这一画面,被指出图中显露的车辆款式和色彩总是类似,道牙石和石板路的款式一看便是来自欧美国家等等。有网友参加我国城市的关键词进行这一风格的测验,略显含糊的画面作用,乍一看气氛的确很像咱们都曾走过的城市大街,但当咱们拿着“显微镜”调查,会发现车牌的色彩不对,楼的外立面呈现不契合修建逻辑的线条,广告招牌上的汉字也不像真字。
ChatGPT-4o生成的“车停在路旁边”的画面。指令关键词包含“极端平凡”“无清晰主体和构图”“像从兜里掏出手机时不小心拍到的”等。
更以假乱真的,是一些含糊的自拍照。画面的日子感十足,好像便是人没拿稳手机发生的实在虚焦作用。假如是在自媒体吸粉、网络约会、亲朋对话等场景中,这样的自拍彻底有或许蒙混过关。
假如这些相片不被作为独自的帖子发出来,仅仅流落在恣意的网络空间中,或许会骗过大大都人的眼睛。有网友将一张AI生成的“无心快照”反喂给AI,让其区分图片是否由AI生成,这次,连AI自己都没认出来。另一方面,这一测验的技能品德问题也令人“细思恐极”:一般,拍错的废片是很少被发到网上的,已然数据样本非常有限,那么,AI是怎么做到如此传神的?
现在,已经有许多手法能够让AI相片真一点、再真一点。普通用户最简略做到的,便是在文字指令上下功夫。据PetaPixel报导,4月初,AI生图东西Midjourney V7发布后,有网友测验在指令中参加相片文件名后缀,如一个典型的佳能相机文件名“IMG_7249.CR2”。无需输入其他文字,Midjourney就会生成随机画面,假如参加详细的画面描绘,用户就会得到一张传神的“相片”。
同理,假如咱们供给胶片相机和胶卷类型的称号,更详细的修图数值,或是关于视点、光线、画幅等的拍摄修辞,就将为生成的“相片”参加更多难以鉴别的风格滤镜。显着,在现在的技能形式下,用AI生成假相片的才能与用户的文字表达才能休戚相关,也需求对拍摄常识有所了解。
AI图画的“假”,好像也不是那么肯定。挪威奥斯陆大学教授丽芙·豪斯肯(Liv Hausken)在2024年的一篇论文中剖析了“视觉虚伪信息年代的人工智能描绘”。她认为,人们常常疏忽了拍摄也有片面认识和视觉修辞,而简略粗犷地将AI生成图画界说为“假图画”,这种针对AI的危机导向型评论不利于艺术、新闻业,也不利于拍摄。换言之,人们对相机拍摄和AI图画实在规范的认知是存在“双标”的,即对传统相机拍摄更信赖,对AI这一“惹是生非”的新技能更严苛。拍摄虽然是相机对实在光线的物理记载,但仍能够经过导演、裁剪、修图等方法来控制,不是肯定实在的图画。一张重度PS的相片,和一张彻底契合实际规则的AI图画,怎么评判谁更真呢?这是一场新旧技能言语之间的交兵。
细心想来,人类依靠写实相片的前史并没有多久。尤其是在近几十年后期修图、滤镜、美颜技能的发展中,咱们已然对经过润饰的实在习认为常。咱们质疑AI图画,对立的中心,或许就在于AI不经过对实际的物理记载这一特色。再失真的美颜,也有相片作为蓝本,而AI经过数据建模得到的人脸,便是“恐惧谷”。
或许对AI图画的真与伪的评论,需求树立在其不同功用和使用目的之上。咱们继续制作如此传神的AI图画,最直观的目的,便是探究技能前进的鸿沟,看看AI终究能够多么趋近人类的观看方法。在这个过程中,人们也能够享用发明的趣味,用传神的形象调配超实际的画面,拓展自我表达的途径,为人生增加更多幻想中的或许性。但在网络交际、新闻信息获取等场景下,咱们仍需在AI图画的围住中树立对实在的判别。仅仅日常的随机一瞥,交际媒体上的轻松阅读,也不要抛弃反抗具有显着诈骗目的的AI图画。
“有图有本相”的年代很时间短,且早已曩昔,现在的网络图画国际已然是传统图画与AI图画的杂糅体。说到底,咱们需求的不仅是区分AI图画的才能,更是在纷繁复杂的信息中重建实在的才能。至少在当下,交际媒体已成为首要信息来历、AI图画技能刚起步就频频地被乱用的布景下,咱们对AI图画“双标”一点,或许也不为过。
这些辨认AI图画的主张,或许能够作为一份参阅:
参阅资料:
https://www.audreyflack.com/photorealism
https://www.madmuseum.org/exhibition/richard-estes
https://petapixel.com/2025/04/07/people-are-using-camera-filenames-to-make-midjourney-more-photorealistic/
https://www.tandfonline.com/doi/full/10.1080/20004214.2024.2340787#abstract
来历:我国青年报客户端