Ключевые особенности
Сильные стороны Llama 3.3 70B:
Более высокая скорость обработки текста, идеально подходит для масштабной генерации текста
Специализируется на обработке текстовых инструкций и многоязычной поддержке
Оптимальна для чат-ботов, генерации кода, создания контента и текстовых задач
Сильные стороны Llama 3.2 90B:
Мультимодальные возможности: поддержка как изображений, так и текста
Превосходно справляется с пониманием изображений, анализом диаграмм и созданием подписей к изображениям
Оптимизирована для мобильных и периферийных устройств
Если вы хотите оценить Llama 3.3 70B на своих задачах — после регистрации Novita AI предоставляет кредит $0.5 для начала работы!
Семейство больших языковых моделей Llama от Meta быстро развивается: появляются частые обновления и новые версии. Две заметные модели — Llama 3.3 70B и Llama 3.2 90B. Эта статья рассматривает технические аспекты, производительность и практическое применение каждой модели, предлагая сравнение, которое поможет разработчикам выбрать подходящий инструмент для своих задач.
Основные сведения о моделях
Чтобы начать сравнение, сначала разберёмся с фундаментальными характеристиками каждой модели.
Llama 3.3 70B
- Дата выпуска: 6 декабря 2024 г.
- Масштаб модели:
- Ключевые особенности:
- Текстовая модель, настроенная на инструкции
- Использует Grouped-Query Attention (GQA) для повышения эффективности
- Поддерживает английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский языки
Llama 3.2 90B
- Дата выпуска: 25 сентября 2024 г.
- Масштаб модели:
- meta-llama/llama-3.1-1B
- meta-llama/llama-3.1-3B
- meta-llama/llama-3.1-11B
- meta-llama/llama-3.1-90B
- Ключевые особенности:
- Мультимодальная модель, поддерживает как текст, так и изображения
- Поддерживает английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский языки
Сравнение моделей

Резюмируя: Llama 3.2 90B имеет больший размер модели и поддерживает мультимодальность, что делает её более универсальной для задач, связанных со зрением. Llama 3.3 70B, хотя и меньше, предлагает определённые варианты точности квантования. Обе модели имеют одинаковый размер контекстного окна, что обеспечивает стабильную производительность при обработке больших текстовых входных данных.
Сравнение скорости
Если хотите протестировать сами, можете начать бесплатный пробный период на сайте Novita AI.

Начать бесплатный пробный период
Сравнение скорости



Источник: artificialanalysis
Сравнение стоимости

Источник: artificialanalysis
Llama 3.3 70B имеет явное преимущество в скорости вывода, что делает её подходящей для задач, требующих быстрой генерации больших объёмов текста. Llama 3.2 90B (Vision) показывает немного лучшие результаты по общему времени ответа и задержке, что подходит для приложений, где важны быстрый ответ и низкая задержка. Хотя Llama 3.2 90B (Vision) обладает более сильными мультимодальными возможностями, она не так быстра, как Llama 3.3 70B, при обработке чистого текста. С точки зрения цены, llama 3.3 70b более экономически эффективна.
Сравнение бенчмарков
Теперь, когда мы рассмотрели основные характеристики каждой модели, давайте углубимся в их производительность по различным бенчмаркам. Это сравнение поможет проиллюстрировать их сильные стороны в разных областях.
| Метрики бенчмарка | Llama 3.3 70B | Llama 3.2 90B (vision) |
|---|---|---|
| MMLU | 86 | 84 |
| HumanEval | 86 | 80 |
| MATH | 76 | 65 |
| GPQA Diamond | 49 | 42 |
Llama 3.3 70B превосходит Llama 3.2 90B во всех тестах, особенно выделяясь в тестах HumanEval и MATH. Несмотря на большее количество параметров и мультимодальные возможности, Llama 3.2 90B не справляется с чисто текстовыми задачами так же хорошо, как Llama 3.3 70B.
Если вы хотите узнать больше о бенчмарках llama 3.3, вы можете ознакомиться со следующей статьёй:
Если вы хотите увидеть больше сравнений llama 3.3 с другими моделями, вы можете посмотреть эти статьи:
- Qwen 2.5 72b vs Llama 3.3 70b: Which Model Suits Your Needs?
- Llama 3.1 70b vs. Llama 3.3 70b: Better Performance, Higher Price
- Is Llama 3.3 70B Really Comparable to Llama 3.1 405B?
Применение и варианты использования
Llama 3.3 70B:
- Многоязычные чат-боты и ассистенты
- Помощь в написании кода и генерация кода
- Генерация синтетических данных
- Создание многоязычного контента и локализация
- Приложения, основанные на знаниях, такие как ответы на вопросы
Llama 3.2 90B:
- Понимание и рассуждение на основе изображений
- Понимание документов, включая диаграммы и графики
- Создание подписей к изображениям
- Задачи визуальной привязки (visual grounding)
- Перевод в реальном времени с визуальным вводом
Доступность и развёртывание через Novita AI
Шаг 1: Войдите в систему и откройте библиотеку моделей
Войдите в свою учётную запись и нажмите кнопку Model Library.

Шаг 2: Выберите модель
Просмотрите доступные варианты и выберите модель, которая подходит для ваших задач.

Шаг 3: Начните бесплатный пробный период
Запустите бесплатный пробный период, чтобы изучить возможности выбранной модели.

Шаг 4: Получите API-ключ
Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу «Settings», чтобы скопировать API-ключ, как показано на изображении.

Шаг 5: Установите API
Установите API с помощью менеджера пакетов, подходящего для вашего языка программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с помощью вашего API-ключа, чтобы начать взаимодействие с LLM от Novita AI. Ниже приведён пример использования chat completions API для пользователей Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Get the Novita AI API Key by referring to: https://novita.ai/docs/get-started/quickstart.html#_2-manage-api-key.
api_key="<YOUR Novita AI API Key>",
)
model = "meta-llama/llama-3.3-70b-instruct"
stream = True # or False
max_tokens = 512
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "")
else:
print(chat_completion_res.choices[0].message.content)
После регистрации Novita AI предоставляет кредит $0.5 для начала работы!
Если бесплатные кредиты закончатся, вы можете оплатить и продолжить использование.
Обе модели — Llama 3.3 70B и Llama 3.2 90B — предлагают уникальные преимущества для разных сценариев использования. Llama 3.3 превосходит в текстовых задачах, требующих сильной многоязычной поддержки и следования инструкциям, с акцентом на эффективность, тогда как Llama 3.2 сияет в мультимодальных приложениях, связанных с пониманием изображений.
Часто задаваемые вопросы
Чем Llama 3.3 отличается от Llama 3.2?
Llama 3.3 оптимизирована для текстовых задач, превосходно справляясь с многоязычностью, тогда как Llama 3.2 является мультимодальной, работая как с изображениями, так и с текстом.
Может ли Llama 3.3 работать на стандартном оборудовании разработчика?**
Да, она рассчитана на обычные GPU и рабочие станции для разработчиков.
Novita AI — это универсальная облачная платформа, которая расширяет ваши AI-амбиции. Интегрированные API, бессерверные вычисления, GPU Instance — экономичные инструменты, которые вам нужны. Устраните инфраструктурные затраты, начните бесплатно и воплотите своё AI-видение в реальность.
