Ключевые моменты
Llama 3.3 70B: Основное внимание уделяется эффективности и следованию инструкциям, эта модель имеет 70 миллиардов параметров и стремится к производительности, сравнимой с гораздо более крупными моделями, при значительно меньших вычислительных требованиях. Она оптимизирована для таких задач, как многоязычные чат-боты, поддержка кодирования и создание контента.
Llama 3.2 90B: Часть релиза Llama 3.2, эта модель представила мультимодальные возможности, позволяющие обрабатывать как текстовые, так и графические входные данные. Она предназначена для сложных задач, включающих понимание изображений, визуальные рассуждения и анализ документов.
Llama 3.1 405B: Самая большая модель с 405 миллиардами параметров, предназначенная для требовательных задач, таких как синтез данных и дистилляция моделей. Она превосходна в областях, требующих обширных знаний и сложных рассуждений, но имеет высокие вычислительные требования.
Если вы хотите оценить Llama 3.3 70b на своих собственных задачах — при регистрации Novita AI предоставляет кредит в $0.5 для начала!
Серия больших языковых моделей (LLM) Llama от Meta быстро развивается, и каждая итерация приносит новые возможности и улучшения. В этой статье представлено техническое сравнение трех заметных моделей из семейства Llama: Llama 3.3 70B, Llama 3.2 90B и Llama 3.1 405B. Сравнение призвано помочь разработчикам делать осознанный выбор, исходя из их конкретных потребностей и ограничений ресурсов, с акцентом на архитектуру, производительность и практические применения.
Основные характеристики моделей
Для начала сравнения сначала разберёмся с фундаментальными характеристиками каждой модели.
Llama 3.3 70b
- Дата выпуска: 6 декабря 2024 г.
- Масштаб модели:
- Ключевые особенности:
- Модель, настроенная на инструкции, только для текста
- Использует Grouped-Query Attention (GQA) для повышения эффективности
- Поддерживает английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский языки
Llama 3.2 90b
- Дата выпуска: 25 сентября 2024 г.
- Другие модели Llama 3.2:
- meta-llama/llama-3.2-1B
- meta-llama/llama-3.2-3B
- meta-llama/llama-3.2-11B
- meta-llama/llama-3.2-90B
- Ключевые особенности:
- Мультимодальная модель, поддерживает как текстовые, так и графические входные данные
- Поддерживает английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский языки
Llama 3.1 405b
- Дата выпуска: 23 июля 2024 г.
- Другие модели Llama 3.1:
- Ключевые особенности:
- Поддерживает 8 языков
- Контекстное окно размером 128K токенов
Сравнение моделей

В целом эти три версии модели Llama различаются по размеру модели, архитектурному проектированию и точности квантования, но все сохраняют одинаковый размер контекста. Llama 3.1 405B имеет наибольшее количество параметров, в то время как Llama 3.3 70B оптимизирована с точки зрения архитектуры и квантования для большей эффективности.
Сравнение скорости
Если вы хотите протестировать самостоятельно, вы можете начать бесплатную пробную версию на сайте Novita AI.

Сравнение скорости



источник: artificialanalysis
Сравнение стоимости

источник: artificialanalysis
В целом, Llama 3.2 90B (Vision) показывает наилучшие результаты по общему времени ответа и задержке, в то время как Llama 3.3 70B – по скорости вывода. Llama 3.1 405B показывает низкие результаты по всем трём метрикам. Это указывает на то, что при выборе модели необходимо взвешивать эти показатели в зависимости от конкретных сценариев применения и требований. А с точки зрения цены, llama 3.3 70b более экономически эффективна.
Сравнение бенчмарков
Теперь, когда мы установили базовые характеристики каждой модели, давайте углубимся в их производительность в различных бенчмарках. Это сравнение поможет проиллюстрировать их сильные стороны в разных областях.
| Benchmark Metrics | Llama 3.3 70B | Llama 3.2 90B (vision) | Llama 3.1 405B |
|---|---|---|---|
| MMLU | 86 | 84 | 88.6 |
| HumanEval | 88.4 | 80 | 89 |
| MATH | 77 | 65 | 73.8 |
| GPQA Diamond | 50.5 | 42 | 49 |
Резюме:
- Llama 3.3 70B: Лучшие навыки в математике и вопросах-ответах
- Llama 3.2 90B (Vision): поддерживает мультимодальное зрение, подходит для визуальных задач
- Llama 3.1 405B: Лучшие способности к многозадачному пониманию и генерации кода
При выборе модели эти показатели и возможности необходимо взвешивать в зависимости от конкретных сценариев применения и требований. Если вы хотите узнать больше о бенчмарках llama3.3, вы можете ознакомиться со следующей статьёй:
Если вы хотите увидеть больше сравнений llama 3.3 с другими моделями, вы можете прочитать эти статьи:
- Qwen 2.5 72b против Llama 3.3 70b: какая модель подходит вашим потребностям?
- Llama 3.1 70b против Llama 3.3 70b: лучшая производительность, более высокая цена
- Откройте для себя возможности моделей Llama 3
Применения и сценарии использования
Llama 3.3 70B:
- Многоязычные чат-боты и ассистенты
- Помощь в кодировании и генерация кода
- Синтез данных
- Создание многоязычного контента и локализация
- Приложения на основе знаний, такие как ответы на вопросы
Llama 3.2 90B:
- Понимание и рассуждение на основе изображений
- Понимание на уровне документов, включая диаграммы и графики
- Создание подписей к изображениям
- Задачи визуального привязывания
- Перевод в реальном времени с визуальными входами
Llama 3.1 405B:
- Крупномасштабный синтез данных
- Дистилляция модели для улучшения меньших моделей
- Продвинутые исследования и эксперименты
- Отраслевые решения, требующие высокой производительности для сложных задач
Доступность и развёртывание через Novita AI
Шаг 1: Войдите в систему и получите доступ к библиотеке моделей
Войдите в свою учётную запись и нажмите кнопку Model Library.

начать бесплатную пробную версию
Шаг 2: Выберите свою модель
Просмотрите доступные варианты и выберите модель, которая соответствует вашим потребностям.

Шаг 3: Начните бесплатную пробную версию
Начните бесплатную пробную версию, чтобы изучить возможности выбранной модели.

Шаг 4: Получите свой API-ключ
Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу Settings и скопируйте API-ключ, как показано на изображении.

Шаг 5: Установите API
Установите API с помощью пакетного менеджера, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Это пример использования API chat completions для пользователей Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Get the Novita AI API Key by referring to: https://novita.ai/docs/get-started/quickstart.html#_2-manage-api-key.
api_key="<YOUR Novita AI API Key>",
)
model = "meta-llama/llama-3.3-70b-instruct"
stream = True # or False
max_tokens = 512
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "")
else:
print(chat_completion_res.choices[0].message.content)
При регистрации Novita AI предоставляет кредит в $0.5 для начала!
Если бесплатные кредиты закончились, вы можете платить и продолжать использование.
Заключение
Серия Llama предлагает ряд моделей, адаптированных под разные потребности:
- Llama 3.3 (70B) сочетает производительность с доступностью для разнообразных приложений.
- Llama 3.2 (90B) представляет мощные мультимодальные возможности для обработки как изображений, так и текстовых данных.
- Llama 3.1 (405B) отлично справляется со сложными задачами, но требует значительных ресурсов.
Выбор правильной модели зависит от конкретных потребностей проекта, вычислительных ресурсов и необходимости мультимодальных возможностей.
Часто задаваемые вопросы
Ключевые различия между Llama 3, 3.1, 3.2 и 3.3
Llama 3 (Оригинальная): Модели 8B и 70B, контекстное окно 8k, ориентирована на текстовые задачи (только английский). Модель 8B конкурировала с ChatGPT 3.5 Turbo.
Llama 3.1: Расширенный контекст до 128k, добавлено 8 языков, вызов функций и модель 405B. Улучшены 8B/70B через дистилляцию от 405B.
Llama 3.2: Представлены модели зрения (11B, 90B) и лёгкие текстовые модели (1B, 3B). Модели зрения обрабатывают одно изображение за раз; лёгкие модели предназначены для работы на устройствах.
Llama 3.3: Модель 70B, ориентированная на следование инструкциям, многоязычную поддержку и безопасность. Сравнима с 405B, но использует меньше ресурсов, с обучением RLHF и контекстным окном 128k.
Почему важна модель Llama 3.1 405B?
Это крупнейшая открытая фундаментальная модель, предлагающая непревзойдённую гибкость для таких задач, как синтез данных и дистилляция моделей. Обучена на 15 триллионах токенов с использованием 16 000 GPU H100, что помогло разработать меньшие модели (8B и 70B) через дистилляцию.
Роль лёгких моделей Llama 3.2 (1B и 3B)
Предназначены для мобильных и периферийных устройств, эти модели поддерживают контекстное окно 128k и оптимизированы для оборудования Qualcomm, MediaTek и Arm. Они отлично справляются с задачами суммаризации, следования инструкциям и переписывания текста на устройстве.
Novita AI — это универсальная облачная платформа, которая расширяет ваши AI-амбиции. Интегрированные API, serverless, GPU-инстансы — экономически эффективные инструменты, которые вам нужны. Устраните инфраструктуру, начните бесплатно и воплотите своё AI-видение в реальность.
