Генераторы изображений еды с искусственным интеллектом не смогут заменить фуд-фотографов

Рубрики:

С бесконечными кольцами креветок и жесткими башнями из кальмаров попытки ИИ фотографировать еду превращаются в нечто сверхъестественное.

Если вы покупаете что-то по ссылке Eater, Vox Media может получить комиссию. Ознакомьтесь с нашей этической политикой.

На днях я, как это обычно бывает, потратил 10 минут на эксперименты с генератором изображений искусственного интеллекта. В то время я был голоден, и поэтому в конце концов начал придумывать варианты гипотетического обеда: призрачное блюдо с мясными закусками, возвышающееся, как руины древнего города, на фоне заката; кольца жестких на вид кальмаров, сделанных, по-видимому, из люцита или стекла, сложенных искусно криво стопкой; и круг из 12,5 мультяшных, гладких, полупрозрачно-красных креветок под баннером с рукописным текстом, на котором было написано просто «Шимп». Некоторые изображения выглядели как еда; ни один из них не выглядел съедобным.

Как показал мой обеденный эксперимент, чтобы заставить ИИ генерировать качественное изображение, нужно знать, что вы делаете — начиная с хорошо написанных подсказок (помимо просто «тарелки креветок») — решающего шага, который я не предпринял. Иногда результаты бывают потрясающими, как, например, сгенерированные искусственным интеллектом изображения Bon Appétit, недавно заказанные художником Бобби Доэрти для сопровождения статьи о разговоре редактора с ChatGPT, когда тот разрабатывал блюда для гипотетического ресторана New American. Некоторые идеи ИИ в отношении меню вызывали удивление, как это может быть в случае с ресторанами Новой Америки, но яркое, потустороннее искусство Доэрти по-прежнему выглядит достаточно хорошо, чтобы его можно было есть.

Однако может показаться, что среднестатистический образ еды, созданный ИИ, не совсем соответствует действительности. В разных уголках Reddit и Google Images кусочки и листья пиццы странным образом перекрываются или сливаются друг с другом, карри мерцает по краям, у индеек необычные ножки в необычных местах, а другие предполагаемые продукты вообще невозможно идентифицировать. В Adobe Stock пользователи могут монетизировать произведения искусства, созданные искусственным интеллектом, при условии, что у них есть на это права, и помечать свои загрузки как иллюстрации. Большинство фотореалистичных натюрмортов и настольных пейзажей платформы сносны, хотя некоторые отклоняются в сторону гротеска: бесконечное кольцо креветок, все тело и без головы, или его невозможный родственник с головами на обоих концах. Подобные изображения, даже менее абсурдные, часто находятся где-то в зловещей долине — широко обсуждаемом месте, которое занимает важное место во многих разговорах об ИИ.

Тем не менее, пока технологические компании рекламируют приложения ИИ для разработки рецептов и даже обучения методам приготовления пищи, искусственные нейронные сети также проникают в мир пищевой фотографии. Некоторые стоковые фотоагентства, в том числе Shutterstock, сотрудничают с платформами искусственного интеллекта, создавая собственные инструменты для создания изображений. Такие стартапы, как Swipeby и Lunchbox, намерены привлечь рестораны и службы доставки, которым необходимы визуальные эффекты для их онлайн-меню. Конечно, способ создания визуальных эффектов — оплата фуд-фотографам за их работу — уже существует. Помимо этого этического болота, существует более насущная юридическая проблема: некоторые модели ИИ были обучены на творческих работах, часто нелицензированных, взятых из Интернета, и могут реагировать на запросы имитировать конкретных художников. Понятно, что артисты начинают подавать в суд.

Если оставить в стороне все моральные соображения, то, по крайней мере, на данный момент еда по-прежнему выглядит наиболее восхитительно в руках фуд-фотографов, видеооператоров, стилистов по еде и реквизиту. Так в чем же ИИ ошибается? Карл Ф. Макдорман, исследователь взаимодействия человека и машины и заместитель декана Школы информатики, вычислительной техники и инженерии Ладди Университета Индианы, говорит, что существует множество теорий относительно того, что может заставить определенные представления вызывать чувство жуткости или беспокойства по мере их приближения. полная точность. «Зловещая долина часто ассоциируется с пограничными вещами», — говорит Макдорман, — например, когда мы не уверены, живо ли что-то или мертво, животное или неживотное, реальное или компьютерно-анимированное. Это может быть особенно заметно, когда изображение смешивает разрозненные категории или придает предмету черты, которые обычно принадлежат очень разным вещам. Возможно, неудивительно, что ИИ на этом относительно раннем этапе может столкнуться со всем этим.

Новости

Генераторы изображений еды с искусственным интеллектом не смогут заменить фуд-фотографов