Google представляет Project Genie 3: ИИ, который генерирует виртуальные миры

Google расширяет границы искусственного интеллекта, выводя из исследовательской стадии инструмент, который превращает текстовые описания и изображения в интерактивные виртуальные миры. Новый экспериментальный прототип Project Genie, построенный на базе модели мира Genie 3 от Google DeepMind, стал доступен первым пользователям в США.

Что такое Project Genie

Project Genie - это веб-приложение-прототип, которое позволяет создавать, исследовать и изменять трехмерные миры, генерируемые в реальном времени. В основе лежит модель Genie 3 - новая универсальная world model, способная строить интерактивные среды, которые продолжают развиваться по мере движения пользователя.

Проще говоря, вы описываете мир словами или загружаете картинку, а ИИ превращает это в короткую играбельную сцену, которую можно исследовать так же, как в видеоигре.

Как это работает

Инструмент сочетает в себе несколько технологий Google:

  • Genie 3 - собственно модель мира, генерирующая окружение по описанию.

  • Nano Banana Pro - генератор изображений, создающий предварительный эскиз будущего мира.

  • Gemini - модель семейства ИИ, обеспечивающая общий интеллект и интеграцию.

Процесс выглядит так:

  1. Пользователь вводит текстовый запрос или загружает изображение, описывая желаемую сцену.

  2. Nano Banana Pro генерирует картинку-эскиз, которую при необходимости можно доработать.

  3. Genie 3 превращает этот эскиз в интерактивный мир, который можно исследовать от первого или третьего лица.

Навигация проста: чаще всего используется управление клавишами WASD, стрелками и пробелом для прыжка как в традиционных играх.

Ограничения и текущее состояние

На данный момент Project Genie - это экспериментальный прототип. Он доступен только подписчикам самого дорогого AI-плана Google AI Ultra (для взрослых пользователей из США), и сессии ограничены примерно 60 секундами из-за высоких вычислительных затрат.

Несмотря на впечатляющие возможности, у системы есть ограничения:

  • Сгенерированные миры не всегда выглядят полностью реалистичными. Они ближе к стилизации либо мультяшным версиям, чем к фотореализму.

  • Физика взаимодействия объектов и контроль над персонажами пока работают не всегда гладко.

  • Некоторые продвинутые функции, такие как динамические события и изменения среды по ходу исследования (анонсированные ранее для Genie 3), в этом прототипе пока отсутствуют.

Почему это важно

Сама идея world models выходит за рамки развлечений. Такие системы это ключевой элемент в исследованиях искусственного общего интеллекта (AGI): они учат ИИ моделировать сложные среды, предсказывать, как они будут развиваться, и как действия влияют на них. Это важный шаг к тому, чтобы будущие ИИ-агенты могли совмещать творчество, обучение и планирование в динамических виртуальных средах.

Проект открывает экспериментальный доступ не ради коммерческого продукта, а чтобы собрать опыт реальных пользователей, понять, как люди взаимодействуют с такими мирами, и получить данные для дальнейшего развития технологии.

Источник: Mashable

Комментарии (0)

Войдите, чтобы оставить комментарий

Похожие статьи

AI 1 месяц назад

Luma выпустила новую ИИ-модель для редактирования видео

Компания Luma выпустила новую ИИ-модель Ray3 Modify, которая позволяет редактировать видео и генерировать промежуточные кадры между заданными начальным и конечным изображениями, сохраняя движения, эмоции и внешний вид персонажей.

34 0 1 мин
AI 1 месяц назад

OpenAI запускает GPT-5.2 - ответ на давление Google

OpenAI представила GPT-5.2 - новую улучшенную модель, выпущенную на фоне обострившейся конкуренции с Google и внутреннего "code red". Модель получила улучшения в кодировании, математике, работе с длинным контекстом и ориентирована на профессиональные задачи и разработчиков.

32 0 1 мин
AI 1 неделю назад

Что такое Moltbot и почему о нём все говорят

Moltbot - это вирусный open-source ИИ-ассистент, ранее известный как Clawdbot. Он запускается локально, выполняет задачи по автоматизации и интегрируется с мессенджерами, но требует технических навыков и внимания к безопасности.

146 0 1 мин
AI 4 недели назад

Boston Dynamics создаёт следующее поколение гуманоидных роботов Google DeepMind NDA

Раскрываем, как Boston Dynamics и Google DeepMind объединили усилия, чтобы создать гуманоидного робота следующего поколения Atlas с продвинутым искусственным интеллектом и перспективами промышленного применения.

44 0 1 мин