Создание идеального изображения в нейросетях давно перестало быть просто развлечением, превратившись в полноценный инструмент для дизайнеров, маркетологов и контент-мейкеров. Казалось бы, что может быть проще: ввёл пару слов, нажал кнопку и получил шедевр? Однако на практике обыватель часто натыкается на пластиковые лица, неестественные позы и свет, который противоречит всем законам физики. Особенно это касается Google Gemini, алгоритмы которого, в отличие от того же Midjourney, тяготеют к более буквальному, но порой слишком “прилизанному” пониманию запроса. Но чтобы не ошибиться и получить действительно живой, добротный кадр, нужно научиться говорить с машиной на языке профессиональной фотографии, а не абстрактных тегов.
Как работает генерация?
Многие считают, что чем длиннее и сложнее запрос, тем качественнее будет результат. Это довольно распространённое заблуждение. Gemini — это языковая модель, и она лучше понимает связный, литературный текст, нежели набор бессвязных слов через запятую. Вместо сухой инструкции “женщина, парк, солнце, красиво”, стоит описать сцену так, как вы бы рассказали о ней другу. К слову, именно контекст и настроение здесь играют первую скрипку. Алгоритму важно понимать не только что изображено, но и как это снято. И здесь на помощь приходит терминология реальных фотографов, ведь, имитируя настройки камеры, мы заставляем ИИ симулировать физические свойства оптики.
Портретная съёмка
С чего начинается работа над портретом? Разумеется, с выбора модели и освещения. Если вы хотите получить реалистичное лицо с порами, морщинками и естественной текстурой кожи, забудьте о словах “perfect” или “smooth”. Они сделают из человека манекен. Львиная доля успеха зависит от указания конкретного типа плёнки или объектива. Попробуйте начать описание с главного героя, но сразу же задайте технические параметры. Например, отличным решением станет запрос:
“Photorealistic close-up portrait of an elderly fisherman with a weathered face, wearing a yellow raincoat, standing on a pier in the rain.”
Но этого мало. Добавьте сюда “shot on Sony A7R IV, 85mm lens, f/1.8 aperture for depth of field”. Это сразу даст понять нейросети, что нужно размыть фон и сфокусироваться на глазах.
Освещение и атмосфера
Свет творит чудеса. Он может превратить скучный кадр в драматичную сцену. Использовать просто слово “lighting” — значит пустить дело на самотёк. Gemini обожает конкретику. Если нужна мягкость и нежность, используйте “golden hour soft lighting” или “diffused window light”. А для более жёстких, мужских портретов или нуарной стилистике подойдёт “dramatic chiaroscuro lighting” или “rembrandt lighting”. Представьте ситуацию: вам нужно снять девушку в неоновом городе. Промт может звучать так:
“Cinematic shot of a cyber-goth girl walking down a rainy Tokyo street at night, illuminated by pink and blue neon signs, wet asphalt reflections, volumetric lighting, shot on Kodak Portra 400 film”.
Зернистость плёнки здесь добавит тот самый антураж, которого так не хватает цифровым изображениям.
Предметная фотография
Сложно ли снять товар так, чтобы его захотелось купить? В реальности — да, в Gemini — довольно просто, если знать нюансы. Здесь главное — чистота и композиция. Не стоит перегружать кадр лишними деталями. Если вы продаёте духи, флакон должен солировать. Пример запроса для коммерческой съёмки может выглядеть следующим образом:
“Professional product photography of a luxury perfume bottle made of dark glass with gold accents, placed on a black marble surface, water droplets on the bottle, studio lighting with rim light, 4k resolution, sharp focus”.
Заметьте, мы указали “rim light” (контровой свет), который отделит объект от фона и придаст ему дорогой вид. А упоминание “black marble” создаёт ощущение премиальности.
В полнй рост: Fashion и стиль
Когда дело доходит до снимков в полный рост, часто всплывают ошибки с пропорциями тела или неестественными позами. Избежать этого поможет описание действия. Модель не должна просто “стоять”. Пусть она “шагает”, “сидит на ступенях” или “поправляет волосы”. Динамика оживляет кадр. Допустим, нам нужна съёмка для модного журнала. Промт будет таким:
“Full body fashion shot of a model wearing a oversized beige trench coat and high boots, walking across a pedestrian crossing in New York, sunny day, motion blur in background, low angle shot, fashion magazine style, high detail texture of fabric”.
Использование “low angle shot” (съёмка с нижнего ракурса) визуально удлинит ноги и добавит модели величия.
Стилизация под плёнку
Почему плёночная фотография снова в моде? Потому что она несовершенна. И именно эти “несовершенства” делают ИИ-картинку похожей на настоящую. Цифровая стерильность часто выдаёт искусственное происхождение. Чтобы обмануть глаз зрителя, стоит добавить в промт названия легендарных фотоплёнок. Fujifilm Velvia даст насыщенные, яркие цвета, идеально подходящие для пейзажей. Kodak Gold подарит тёплые, ностальгические оттенки для семейных сцен. А вот чёрно-белая Ilford HP5 Plus обеспечит глубокий контраст и зернистость. Попробуйте такой вариант:
“Candid lifestyle photography of a group of friends laughing at a dinner party, warm candlelight, wine glasses on the table, shot on Kodak Gold 200, slight film grain, vintage aesthetics”.
Результат вас удивит своей теплотой и “ламповостью”.
Архитектура и интерьер
Съёмка помещений требует особого подхода к геометрии и свету. Здесь важно использовать широкоугольные объективы, чтобы охватить пространство. Однако не стоит перебарщивать с шириной угла, иначе стены начнут “заваливаться”. Оптимальный выбор — 16mm или 24mm. Для создания уютного интерьера подойдёт такой запрос:
“Interior design photography of a modern Scandinavian living room, beige sofa with textured pillows, large panoramic windows with a view of a snowy forest, natural daylight filling the room, symmetrical composition, shot on 24mm lens, architectural digest style”.
Упоминание журнала “Architectural Digest” служит для Gemini своеобразным референсом качества и стиля.
Макросъёмка
Есть в макросъёмке что-то завораживающее. Возможность увидеть невидимые глазу детали приковывает внимание. Главная проблема здесь — глубина резкости. ИИ может размыть не то, что нужно. Поэтому чётко указывайте точку фокуса. Например:
“Macro photography of a human eye iris, extreme close-up, highly detailed texture, vivid blue and green colors, reflection of a window in the pupil, sharp focus on the iris, f/2.8 aperture”.
Это сложный технический запрос, но именно он заставит нейросеть прорисовать каждую прожилку, создавая внушительный эффект присутствия.
Еда и кулинария
Аппетит приходит во время… просмотра качественных фото. Фуд-фотография — это игра текстур. Хрустящая корочка, стекающий соус, пар над чашкой — всё это нужно прописать словами. Избегайте “flat lay” (съёмка сверху), если хотите показать объём блюда. Лучше выберите угол 45 градусов. Вот пример вкусного промта:
“Delicious gourmet burger with melted cheese, bacon and fresh lettuce on a wooden board, steam rising, dark moody background, professional food photography, studio lighting, highly detailed textures, appetizing look, 85mm lens”.
Слова “steam rising” (поднимающийся пар) и “melted cheese” (расплавленный сыр) являются триггерами для создания динамичного и живого изображения.
Пейзажи и природа
Грандиозный вид гор или спокойная гладь озера — классика жанра. Но как сделать пейзаж нескучным? Добавьте погодные условия или время суток. Туман, дождь, рассвет или шторм меняют настроение кардинально. И, конечно же, не забывайте про “золотой час”. Пример запроса для эпичного пейзажа:
“Breathtaking landscape photography of the Dolomites mountains at sunset, pink and orange clouds, dramatic peaks, small alpine lake reflecting the sky, wide angle shot, high resolution, hyper-realistic, national geographic style”.
Здесь мы снова используем отсылку к известному изданию (“National Geographic”), задавая планку качества и реализма.
Ошибки новичков
Чего же не стоит делать? Во-первых, не нужно писать противоречивые вещи. “Солнечная ночь” или “сухой дождь” введут Gemini в ступор, и результат будет галлюциногенным. Во-вторых, не перегружайте промт лишними прилагательными. “Красивый, великолепный, чудесный, потрясающий” — это мусорные слова для нейросети. Они не несут визуальной информации. Лучше заменить их на “эстетичный”, “симметричный” или “минималистичный”. И, наконец, не забывайте про негативные промты (если интерфейс позволяет их вводить или путём описания “без…”). Хотя в стандартном чате Gemini это работает хуже, можно попробовать добавить в конце фразы: “avoid blur, avoid distortion, no bad anatomy”. Это своеобразный спасательный круг, хотя и не панацея.
Стиль и мода будущего
Интересно поэкспериментировать и с футуристическими концептами. Gemini отлично справляется с неоном, металлом и киберпанком. Но чтобы это не выглядело как скриншот из дешёвой видеоигры, нужно добавить “грязи” и реализма. Промт:
“Futuristic street fashion photography, cyberpunk style, model with robotic arm prosthesis wearing transparent plastic raincoat, neon rain, crowded hong kong street background, shallow depth of field, realistic textures, cinematic lighting”.
Сочетание фантастики и реалистичной уличной фотографии даёт очень интересный, неоднозначный результат.
Эмуляция старых камер
Иногда хочется чего-то совсем ретро. Полароид, дагеротип или выцветшее фото 90-х. Это мощный художественный приём. Для имитации любительского снимка используйте:
“Disposable camera photo of a group of teenagers at a skatepark in the 90s, flash photography, slightly overexposed, vintage vibes, film grain, imperfect composition”.
Слова “disposable camera” (одноразовая камера) и “flash photography” (спышка в лоб) сразу убирают лишний пафос и делают картинку живой, как будто из семейного альбома. Это вызывает доверие у зрителя.
Технические тонкости
Разрешение и соотношение сторон тоже имеют значение. Хотя в чате Gemini мы ограничены форматом выдачи, указание “4k”, “8k” или “high resolution” всё же влияет на проработку деталей. Это сигнал для модели уделить внимание мелочам. А вот с соотношением сторон (aspect ratio) в текстовом запросе бывает сложнее, часто приходится обрезать готовое изображение. Тем не менее, указывать “wide angle” или “panoramic” стоит, чтобы ИИ понимал композицию кадра. Также полезно использовать термины, описывающие расстояние до объекта: “extreme close-up” (макро), “medium shot” (по пояс), “long shot” (издали). Это позволяет точно контролировать, что попадёт в кадр, а что останется за его пределами.
Цветовая палитра
Цвет — это мощнейший инструмент управления вниманием. Можно попросить нейросеть использовать конкретную цветовую схему. Например, “teal and orange” — классическая кинематографическая связка, которая делает картинку приятной глазу. Или “pastel color palette” для чего-то более мягкого и воздушного. Пример:
“Minimalist portrait of a woman against a solid pastel pink background, wearing a white dress, soft studio lighting, pastel color palette, high key photography”.
Стиль “high key” (высокий ключ) подразумевает светлое изображение без глубоких теней, что отлично подходит для бьюти-сферы.
Арт-фотография
Иногда хочется отойти от реализма и создать что-то сюрреалистичное. Gemini способен и на это. Но и здесь нужны “якоря” реальности, чтобы зритель мог за что-то зацепиться. Смешивайте несочетаемое.
“Surreal conceptual photography of a giant goldfish floating in the sky above New York city, dreamy atmosphere, clouds, soft morning light, hyper-realistic collage style”.
Ключевое слово здесь — “collage style” или “double exposure” (двойная экспозиция). Это позволяет создавать сложные метафорические образы, которые заставляют задуматься.
Работа с референсами
К слову, Gemini умеет (в некоторых версиях) принимать изображения в качестве референса или описывать их. Но если мы говорим о генерации с нуля, то лучше всего использовать имена известных художников или фотографов в качестве ориентиров стиля. “In the style of Annie Leibovitz” добавит драматизма и групповой композиции, а “in the style of Wes Anderson” сделает кадр симметричным и цветистым. Это работает как шорткод для целого набора визуальных правил. Но будьте осторожны: не стоит слепо копировать, лучше смешивать стили. Например, “Cyberpunk city in the style of Van Gogh”. Зрелище может получиться весьма психоделическим, но уж точно оригинальным.
Практика — ключ к успеху
Ни один готовый промт не даст 100% гарантии шедевра с первой попытки. ИИ — это рулетка. Иногда нужно нажать “сгенерировать” пять раз, чтобы получить тот самый кадр. Иногда нужно поменять одно слово. Это процесс не сложный, но кропотливый, требующий скрупулёзного подхода. Не бойтесь экспериментировать с порядком слов. Выносите самое важное в начало предложения. Меняйте объективы, играйте со светом, “переодевайте” моделей. Gemini — это невероятно мощный инструмент в руках того, кто знает, чего хочет. Главное — иметь чёткое видение в голове и уметь перевести его на язык слов. Удачных вам кадров и пусть ваша виртуальная галерея станет настоящим кладезем вдохновения.