Исследование MIT проверило 1000 изображений Midjourney V7 на 3000 участниках: 92% не смогли правильно определить, является ли изображение фотографией или AI-генерацией.
Граница между фотографией и AI-генерацией стала по-настоящему неразличимой. Новое исследование MIT Media Lab шокирует даже тех, кто слышал о прогрессе генеративных моделей.
Методология исследования
Учёные MIT показали 3000 участникам 1000 пар изображений: 500 реальных фотографий и 500 созданных Midjourney V7 в схожем стиле. Участников просили определить, что есть что.
Результат: средняя точность составила 51,3% — статистически неотличимо от случайного угадывания (50%). При этом 92% участников ошиблись хотя бы раз.
Что делает V7 особенным
Midjourney V7 использует новую архитектуру DiT (Diffusion Transformer) с дополнительным этапом RLHF-тонирования. Ключевые улучшения:
- Когерентность анатомии: руки, пальцы и лица больше не «плывут»
- Физика материалов: ткань, стекло, металл выглядят физически корректно
- Освещение: модель понимает источники света и создаёт согласованные тени
- Метаданные EXIF: V7 генерирует реалистичные метаданные камеры — ещё один слой иллюзии
Что это значит для общества
Исследователи предупреждают: без надёжных инструментов верификации (C2PA, цифровые подписи) медиапространство оказывается в кризисе доверия. Adobe, Getty и Reuters уже внедрили обязательную C2PA-разметку для всех публикуемых изображений.
Комментарии (56)
Комментариев пока нет. Будьте первым!