Google расширяет границы искусственного интеллекта, выводя из исследовательской стадии инструмент, который превращает текстовые описания и изображения в интерактивные виртуальные миры. Новый экспериментальный прототип Project Genie, построенный на базе модели мира Genie 3 от Google DeepMind, стал доступен первым пользователям в США.
Что такое Project Genie
Project Genie - это веб-приложение-прототип, которое позволяет создавать, исследовать и изменять трехмерные миры, генерируемые в реальном времени. В основе лежит модель Genie 3 - новая универсальная world model, способная строить интерактивные среды, которые продолжают развиваться по мере движения пользователя.
Проще говоря, вы описываете мир словами или загружаете картинку, а ИИ превращает это в короткую играбельную сцену, которую можно исследовать так же, как в видеоигре.
Как это работает
Инструмент сочетает в себе несколько технологий Google:
Genie 3 - собственно модель мира, генерирующая окружение по описанию.
Nano Banana Pro - генератор изображений, создающий предварительный эскиз будущего мира.
Gemini - модель семейства ИИ, обеспечивающая общий интеллект и интеграцию.
Процесс выглядит так:
Пользователь вводит текстовый запрос или загружает изображение, описывая желаемую сцену.
Nano Banana Pro генерирует картинку-эскиз, которую при необходимости можно доработать.
Genie 3 превращает этот эскиз в интерактивный мир, который можно исследовать от первого или третьего лица.
Навигация проста: чаще всего используется управление клавишами WASD, стрелками и пробелом для прыжка как в традиционных играх.
Ограничения и текущее состояние
На данный момент Project Genie - это экспериментальный прототип. Он доступен только подписчикам самого дорогого AI-плана Google AI Ultra (для взрослых пользователей из США), и сессии ограничены примерно 60 секундами из-за высоких вычислительных затрат.
Несмотря на впечатляющие возможности, у системы есть ограничения:
Сгенерированные миры не всегда выглядят полностью реалистичными. Они ближе к стилизации либо мультяшным версиям, чем к фотореализму.
Физика взаимодействия объектов и контроль над персонажами пока работают не всегда гладко.
Некоторые продвинутые функции, такие как динамические события и изменения среды по ходу исследования (анонсированные ранее для Genie 3), в этом прототипе пока отсутствуют.
Почему это важно
Сама идея world models выходит за рамки развлечений. Такие системы это ключевой элемент в исследованиях искусственного общего интеллекта (AGI): они учат ИИ моделировать сложные среды, предсказывать, как они будут развиваться, и как действия влияют на них. Это важный шаг к тому, чтобы будущие ИИ-агенты могли совмещать творчество, обучение и планирование в динамических виртуальных средах.
Проект открывает экспериментальный доступ не ради коммерческого продукта, а чтобы собрать опыт реальных пользователей, понять, как люди взаимодействуют с такими мирами, и получить данные для дальнейшего развития технологии.
Источник: Mashable