Google Project Genie 3: интерактивные ИИ-миры в реальном времени

Google расширяет границы искусственного интеллекта, выводя из исследовательской стадии инструмент, который превращает текстовые описания и изображения в интерактивные виртуальные миры. Новый экспериментальный прототип Project Genie, построенный на базе модели мира Genie 3 от Google DeepMind, стал доступен первым пользователям в США.

Что такое Project Genie

Project Genie - это веб-приложение-прототип, которое позволяет создавать, исследовать и изменять трехмерные миры, генерируемые в реальном времени. В основе лежит модель Genie 3 - новая универсальная world model, способная строить интерактивные среды, которые продолжают развиваться по мере движения пользователя.

Проще говоря, вы описываете мир словами или загружаете картинку, а ИИ превращает это в короткую играбельную сцену, которую можно исследовать так же, как в видеоигре.

Как это работает

Инструмент сочетает в себе несколько технологий Google:

Genie 3 - собственно модель мира, генерирующая окружение по описанию.
Nano Banana Pro - генератор изображений, создающий предварительный эскиз будущего мира.
Gemini - модель семейства ИИ, обеспечивающая общий интеллект и интеграцию.

Процесс выглядит так:

Пользователь вводит текстовый запрос или загружает изображение, описывая желаемую сцену.
Nano Banana Pro генерирует картинку-эскиз, которую при необходимости можно доработать.
Genie 3 превращает этот эскиз в интерактивный мир, который можно исследовать от первого или третьего лица.

Навигация проста: чаще всего используется управление клавишами WASD, стрелками и пробелом для прыжка как в традиционных играх.

Ограничения и текущее состояние

На данный момент Project Genie - это экспериментальный прототип. Он доступен только подписчикам самого дорогого AI-плана Google AI Ultra (для взрослых пользователей из США), и сессии ограничены примерно 60 секундами из-за высоких вычислительных затрат.

Несмотря на впечатляющие возможности, у системы есть ограничения:

Сгенерированные миры не всегда выглядят полностью реалистичными. Они ближе к стилизации либо мультяшным версиям, чем к фотореализму.
Физика взаимодействия объектов и контроль над персонажами пока работают не всегда гладко.
Некоторые продвинутые функции, такие как динамические события и изменения среды по ходу исследования (анонсированные ранее для Genie 3), в этом прототипе пока отсутствуют.

Почему это важно

Сама идея world models выходит за рамки развлечений. Такие системы это ключевой элемент в исследованиях искусственного общего интеллекта (AGI): они учат ИИ моделировать сложные среды, предсказывать, как они будут развиваться, и как действия влияют на них. Это важный шаг к тому, чтобы будущие ИИ-агенты могли совмещать творчество, обучение и планирование в динамических виртуальных средах.

Проект открывает экспериментальный доступ не ради коммерческого продукта, а чтобы собрать опыт реальных пользователей, понять, как люди взаимодействуют с такими мирами, и получить данные для дальнейшего развития технологии.

Источник: Mashable

Google представляет Project Genie 3: ИИ, который генерирует виртуальные миры

Что такое Project Genie

Как это работает

Ограничения и текущее состояние

Почему это важно

Похожие статьи

Google выпустила офлайн-приложение для диктовки на iOS

Nano Banana: понятный гайд от Goolge по созданию и улучшению изображений

Как искусственный интеллект меняет правила игры для стартапов

Google Chrome получил защиту от кражи сессионных cookie