«DeepSeek V4» выходит на неделе с триллионом параметров

пост на 2 мин

DeepSeek V4, новая версия крупномасштабной языковой модели, готовится к публичному анонсу. По официальным данным, модель содержит 1 трлн параметров, из которых при генерации активны 32 млрд по схеме Mixture‑of‑Experts. Для локального запуска заявлена конфигурация из двух видеокарт RTX 4090, а контекстный окно увеличено до 1 млн токенов — по сравнению с 128 тыс. у версии V3. Точность генерации оценивается в 97 %, а скорость работы превзошла предшественницу в 1,8 раза.

Главный упор в V4 сделан на работу с программным кодом: модель способна писать, отлаживать и комментировать код на нескольких языках. Кроме того, реализована мультимодальность — поддержка текста, изображений и, по предварительным сведениям, видеоматериалов. Оптимизация проведена под процессоры Huawei и Cambricon, без особого приоритета для графических ускорителей Nvidia.

По словам аналитиков, расширенный контекстный объём и высокая точность делают DeepSeek V4 конкурентоспособной альтернативой западным решениям, особенно в сферах разработки программного обеспечения и генерации визуального контента. Увеличение активных параметров при сохранении умерённого потребления ресурсов может снизить барьер входа для компаний, желающих развернуть модель локально. При этом оптимизация под китайские чипы открывает возможности для более широкой дистрибуции в азиатском регионе, где уже обсуждается запуск продукта‑конкурента Cursor.

3000 ₽ в месяц на покупки 🤑

Оформите карту ВТБ по нашей ссылке – оплатите одну или несколько покупок и получите максимальное вознаграждение!

В соцсетях реакция разделилась: часть пользователей отмечает значительный прирост возможностей при работе с большими объёмами кода, другие выражают скепсис относительно реальной производительности на обычных рабочих станциях. Общий тон обсуждения остаётся позитивным, подчёркивая потенциал модели в повышении эффективности разработки и создания мультимедийных материалов.

Данный новостной текст создан искусственным интеллектом AiGENDA. Используйте AiGENDA на нашем сайте, чтобы быстро получать актуальную информацию, улучшать профессиональные навыки, осваивать новые технологии и находить идеи для проектов. Возможности AiGENDA позволяют экономить время и расширять горизонты знаний.

Комментариев нет

Добавить комментарий