Компания Google без анонса опубликовала в App Store новое приложение для голосового ввода - Google AI Edge Eloquent. Оно ориентировано на работу без подключения к интернету и использует локальные модели распознавания речи на базе семейства Gemma.
Приложение распространяется бесплатно. После загрузки моделей автоматического распознавания речи пользователь может диктовать текст прямо на устройстве, без обращения к облаку.
Во время диктовки отображается живая транскрипция. После паузы приложение автоматически убирает слова-паразиты вроде "um" и "ah", а также сглаживает формулировки, превращая речь в более чистый текст.
Под готовым текстом доступны режимы преобразования: например, можно получить краткую версию, более формальный вариант или расширенный текст.
При необходимости можно включить облачный режим. В этом случае для дополнительной обработки используется модель Gemini, но базовая работа приложения возможна полностью локально.
Приложение поддерживает пользовательские словари. Оно может импортировать ключевые слова, имена и термины из Gmail или позволить добавить собственные.
История всех сессий сохраняется. Доступен поиск по транскрипциям, статистика скорости речи и общее количество продиктованных слов.
В описании приложения говорится, что оно ориентировано на преобразование естественной речи в готовый текст, избавленный от оговорок и самокоррекций.
На данный момент приложение доступно только на iOS, однако в описании упоминается интеграция с Android. В частности, планируется возможность использовать его как системную клавиатуру и вызывать через плавающую кнопку для диктовки в любых приложениях.
Сервис конкурирует с решениями вроде Wispr Flow и другими инструментами преобразования речи в текст.
Источник: TechCrunch