Новый метод обучения ИИ снижает энергопотребление и сетевые нагрузки

Исследователи из Stevens Institute of Technology предложили алгоритм, который повышает эффективность обучения больших языковых моделей, одновременно снижая энергопотребление и объем передаваемых данных.

Метод направлен на улучшение обмена данными между участниками распределенного обучения. Это позволяет повысить производительность моделей и уменьшить затраты как на вычисления, так и на коммуникацию между узлами.

Подход особенно важен для сценариев, где централизованный сбор данных затруднен из-за требований к приватности или организационных ограничений. В таких условиях распределенное обучение становится основным вариантом, но оно традиционно сопровождается высокими издержками на передачу данных и синхронизацию моделей.

Предложенный алгоритм уменьшает эти издержки, что делает адаптацию крупных моделей более доступной для организаций с ограниченными ресурсами.

Разработка также ориентирована на более равномерное внедрение ИИ в разных областях, включая здравоохранение, образование и межорганизационное сотрудничество, где обмен данными между участниками ограничен.

В основе работы лежит метод тонкой настройки больших языковых моделей в федеративной среде с учетом неоднородности данных. Для этого используется техника переносимой разреженности, которая позволяет уменьшить объем передаваемой информации без потери качества обучения.

Исследование оформлено в работе "Mitigating Non-IID Drift in Zeroth-Order Federated LLM Fine-Tuning with Transferable Sparsity", опубликованной в 2026 году.

Источник: TechExplore

Похожие статьи

Рекомендательные технологии Подробнее
AI 4 месяца назад

Google представляет Project Genie 3: ИИ, который генерирует виртуальные миры

Google запустила Project Genie 3: экспериментальный ИИ-инструмент, который превращает текстовые запросы и изображения в интерактивные трехмерные миры. Новый прототип доступен подписчикам Google AI Ultra в США, а технология основана на модели Genie 3 от DeepMind.

Технологии и IT-новости 4 месяца назад

Илон Маск объединяет SpaceX и xAI, чтобы строить дата-центры в космосе

Илон Маск завершил объединение SpaceX и своего ИИ-стартапа xAI, создав крупнейшую частную технологическую компанию с целью развития орбитальных дата-центров для искусственного интеллекта. Слияние оценивается в 1,25 трлн долларов и может предшествовать IPO SpaceX в 2026 году.

AI 4 месяца назад

Anthropic встроила интерактивные рабочие приложения прямо в Claude

Anthropic расширила возможности чат-ИИ Claude, встроив в него интерактивные интерфейсы рабочих приложений. Теперь пользователи с платной подпиской могут запускать Slack, Figma, Asana, Canva и другие инструменты прямо внутри диалога.