Поиск по публикациям и новостям

Лаборатория исследований искусственного интеллекта Yandex Research совместно с научно-технологическими вузами НИУ ВШЭ, MIT, KAUST и ISTA разработала метод быстрого сжатия больших языковых моделей (LLM) без потери качества. Как подчеркнули разработчики, теперь для работы с моделями достаточно смартфона или ноутбука — и не нужно использовать дорогие серверы и мощные GPU.

Сгенерировано нейросетью Dall-E
Сгенерировано нейросетью Dall-E

Метод позволяет быстро тестировать и внедрять новые решения на основе нейросетей, экономить время и деньги на разработку. Это делает LLM доступнее не только для крупных, но и для небольших компаний, некоммерческих лабораторий и институтов, индивидуальных разработчиков и исследователей.

В Яндексе пояснили:

Ранее для запуска языковой модели на смартфоне или ноутбуке требовалось провести её квантизацию на дорогостоящем сервере, что занимало от нескольких часов до нескольких недель. Теперь квантизацию можно выполнить прямо на телефоне или ноутбуке за считанные минуты.

Новый метод квантизации называется HIGGS (от англ. Hadamard Incoherence with Gaussian MSE-optimal GridS). Метод HIGGS уже доступен разработчикам и исследователям на Hugging Face и GitHub.

HIGGS позволяет уменьшить размер модели, сохранив её качество, и запустить на более доступных устройствах. Например, с помощью этого метода можно сжимать даже такие большие модели, как DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров, которые до сих пор удавалось квантовать только самыми простыми методами со значительной потерей в качестве.

Метод уже проверили на популярных моделях Llama 3 и Qwen2.5. Эксперименты показали, что HIGGS — это лучший способ квантизации по соотношению качества к размеру модели среди всех существующих методов квантизации без использования данных, в том числе NF4 (4-bit NormalFloat) и HQQ (Half-Quadratic Quantization).

Источники
Yandex Research

Сейчас на главной

26 апр. 2025 г., 11:48:24
Firebird Conf 2025: профессиональная конференция разработчиков СУБД в Москве

29 мая 2025 года в московском LOFT HALL состоится третья ежегодная конференция Firebird Conf 2025 для разработчиков и администраторов систем управления базами данных (СУБД). Мероприятие пройдет с 9:00 до 21:00 и соберет ведущих экспертов отрасли.

25 апр. 2025 г., 14:40:30
«Рег.ру» предлагает облако для запуска приложений на базе «1С»

Решение позволяет компаниям быстро развернуть и масштабировать «1С» в облаке с высокой производительностью.

25 апр. 2025 г., 13:42:45
«МойОфис» представил новую экосистему бизнес-приложений

«МойОфис Экосистема» – это комплекс офисных приложений, предназначенный для организаций от 1 000 сотрудников до сотен тысяч.

25 апр. 2025 г., 13:23:58
Контроллер ePRO24 Omni

Компания «Электрорешения», официальный представитель бренда EKF в России, запускает усовершенствованную версию контроллера ePRO24 — ePRO24 Omni. Этот контроллер позволяет дистанционно управлять бытовыми и промышленными устройствами, интегрируя их в систему умного дома EKF Connect Home и промышленную IIoT-платформу EKF Connect Industry. Также, он служит шлюзом передачи данных для оборудования с интерфейсом Modbus RTU.

25 апр. 2025 г., 13:12:52
Исследование OCS: в региональных проектах ИТ-интеграторов доля российских решений достигает 80%

Аналитики OCS отметили, что для своих региональных проектов ИТ-интеграторы используют 70–80% решений отечественных брендов. На федеральном уровне доля российских продуктов составляет от 50 до 60%. Популярность локальных решений в регионах во многом связана со структурой спроса: значительная часть заказов формируется государственными учреждениями и предприятиями с госучастием. Кроме того, многие промышленные и инфраструктурные заказчики попадают под требования КИИ и потому ориентированы на отечественные технологии.

25 апр. 2025 г., 13:11:59
Сервис киберзащиты МТС Membrana стал доступен для сотрудников компаний

Оператор МТС объявил о запуске услуги приватной мобильной связи Membrana для корпоративных пользователей. Мобильное приложение Membrana В2В защищает от действий киберпреступников сотрудников компаний, их цифровой след и приватность, даёт возможность создавать дополнительные номера, отслеживать утечки данных, и так далее.

25 апр. 2025 г., 12:24:26
Телекоммуникационное оборудование и облачные платформы бренда EKF

«Электрорешения», официальный представитель бренда EKF в России, продемонстрировала линейку телекоммуникационного оборудования TERACOM на выставке Securika Moscow 2025. Посетители смогли ознакомиться с облачными решениями: EKF Connect Home — мобильное приложение для умного дома и EKF Connect Industry — IIoT-платформа для мониторинга, управления и анализа данных систем автоматизации.

24 апр. 2025 г., 15:58:31
Яндекс открыл доступ к нейросетям для анализа изображений

Yandex B2B Tech, корпоративное направление Яндекса, запустило на фирменной ML-платформе визуально-генеративные модели (VLM) с открытым исходным кодом, которые одновременно анализируют изображения и текст. С помощью VLM-моделей, таких как Deepseek VL2 Tiny и Gemma3 27B, компании смогут составлять описания товаров по фотографиям и быстро находить нужную информацию по документам.

24 апр. 2025 г., 15:35:22
Состоялся первый релиз российской среды разработки OpenIDE

«Группа Астра» совместно с компаниями Axiom JDK и Haulmont выпустили первую версию независимой российской среды разработки OpenIDE. Это бесплатный открытый инструмент без проприетарных компонентов, который предназначен для профессиональных Java-программистов и готов к применению в реальных проектах.

24 апр. 2025 г., 13:17:05
Видеоролики и баннеры: Яндекс запустил рекламу на умных телевизорах

Для продвижения брендов в «Яндекс Директе» стали доступны новые инструменты. Рекламодатели могут запускать рекламные кампании в видеоконтенте, который пользователи смотрят с умных телевизоров.

23 апр. 2025 г., 16:47:26
МТС запускает сервис для совместной работы, записи и обмена видео

Новое решение МТС Web Services (MWS) для работы распределенных команд получило название TeamStream. Сервис на 35% сокращает время на переписку и звонки, заменяя их видеосообщениями.

23 апр. 2025 г., 15:10:58
Облачный провайдер ActiveCloud подключился к российскому сервису аутентификации Multifactor

В портфеле SaaS-услуг ActiveCloud стал доступен сервис многофакторной аутентификации Multifactor. Решение обеспечит защиту от киберугроз и усилит корпоративную систему безопасности клиентов, дополняя облачные сервисы от ActiveCloud.