Модели Llama 3.2 теперь доступны на Novita AI

Модели Llama 3.2 теперь доступны на Novita AI

Познакомьтесь с новым поколением разработки ИИ с последней интеграцией моделей Meta Llama 3.2 на платформе Novita AI. Наша платформа теперь предлагает полный набор моделей, разработанных для удовлетворения разнообразных потребностей разработчиков, сохраняя при этом экономическую эффективность и превосходную производительность.

Что нового в Llama 3.2

|||||||

|---|---|---|---|---|---| ||Llama 2.0 (7B, 13B, 70B)|Llama 3.0 (8B, 70B)|Llama 3.1 (8B, 70B, 405B)|Llama 3.2 Multimodal (11B & 90B)|Llama 3.2 Lightweight Text Only (1B & 3B)| |Дата выпуска|18 июля 2023|18 апреля 2024|23 июля 2024|25 сентября 2024|25 сентября 2024| |Окно контекста|4K|8K|128K|128K|128K| |Размер словаря|32K|128K|128K|128K|128K| |Официальная поддержка языков|Только английский|Только английский|8 языков|8 языков|8 языков| |Вызов инструментов|Нет|Нет|Да|Да|Да| |Дата обрезки знаний|Сентябрь 2022|Март 2023 (8B), декабрь 2023 (70B)|Декабрь 2023|Декабрь 2023|Декабрь 2023|

1) Мультимодальный ввод в моделях 11B и 90B

8 Иллюстрация композиционного подхода к добавлению мультимодальных возможностей в Llama 3

Источник: Meta

  • Понимание изображений: распознает объекты, сцены и рисунки, а также обладает возможностями OCR.
  • Создание подписей и ответы на вопросы: генерирует подписи и отвечает на вопросы на основе визуального контента.
  • Визуальное рассуждение: анализирует уравнения, диаграммы и документы для улучшенного визуального анализа.

2) Меньшие размеры в текстовых моделях 1B и 3B

  • Новые варианты использования SLM (малых языковых моделей):
    • Суммирование на устройстве
    • Написание и перевод
    • Ответы на вопросы на нескольких языках

Доступные модели Llama 3.2 на Novita AI

Скриншот модели Llama 3.2 на Novita AI

Novita AI с гордостью предлагает три мощных варианта Llama 3.2, каждый из которых оптимизирован для разных случаев использования:

Llama 3.2 1B Instruct: Ваш путь к эффективному ИИ

Преобразите свой рабочий процесс разработки с нашей самой доступной моделью, которая имеет впечатляющее окно контекста в 131 000 токенов. Всего за $0.02/M токенов эта модель обеспечивает исключительную ценность для быстрого прототипирования и легковесных приложений. Попробуйте Llama 3.2 1B Instruct сейчас

Llama 3.2 3B Instruct: Мощность встречает производительность

Откройте расширенные возможности рассуждения с нашей моделью среднего уровня, предлагающей длину контекста в 32 768 токенов. При конкурентоспособной цене $0.03/M входных токенов и $0.05/M выходных токенов она идеально подходит для среднемасштабных приложений, требующих надежной производительности. Попробуйте Llama 3.2 3B Instruct сейчас

Llama 3.2 11B Vision Instruct: Мультимодальное превосходство

Познакомьтесь с современной мультимодальной обработкой с нашей продвинутой моделью зрения. Поддерживая длину контекста в 131 000 токенов по цене $0.06/M токенов, она отлично справляется с сложными визуально-лингвистическими задачами. Попробуйте Llama 3.2 11B Vision Instruct сейчас

Продвижение мультимодального ИИ на основе открытого исходного кода

Применение модели Llama 3.2

Мультимодальные модели Llama 3.2 с 11 и 90 миллиардами параметров обеспечивают мощные мультимодальные возможности для обработки изображений и текста. В сочетании с платформой Novita AI это открывает такие значимые реальные применения, как:

Варианты использования мультимодальных моделей

  • Интерактивные агенты: Разрабатывайте агентов ИИ, способных реагировать как на текстовые, так и на графические входные данные, обеспечивая улучшенный пользовательский опыт.
  • Создание подписей к изображениям: Создавайте качественные описания изображений для использования в электронной коммерции, создании контента и цифровой доступности.
  • Визуальный поиск: Позвольте пользователям выполнять поиск по изображениям, повышая эффективность поиска в электронной коммерции и розничной торговле.
  • Интеллектуальный анализ документов: Анализируйте документы, содержащие как текст, так и визуальные элементы, например юридические контракты и финансовые отчеты.

Отраслевые приложения

Конечные точки Llama 3.2 от Novita AI открывают новые возможности в различных отраслях:

  • Здравоохранение: Улучшите анализ медицинских изображений для повышения точности диагностики и ухода за пациентами.
  • Розничная торговля и электронная коммерция: Преобразите покупательский опыт с помощью поиска по изображениям и тексту, а также персонализированных рекомендаций.
  • Финансы и юриспруденция: Оптимизируйте рабочие процессы, анализируя графический и текстовый контент, улучшая проверку контрактов и аудит.
  • Образование и обучение: Разрабатывайте интерактивные образовательные инструменты, обрабатывающие как текст, так и визуальные материалы для повышения вовлеченности.

Начало работы: ваш путь с Novita AI

Шаг 1: Выберите свою модель

Llama 3.2 1b playground

Выбирайте в зависимости от ваших конкретных требований:

Или используйте наш Python SDK для быстрой интеграции моделей Llama в ваши приложения:

Шаг 2: Интегрируйте и разверните

Следуйте нашему простому процессу интеграции:

  1. Зарегистрируйте аккаунт Novita AI.
  2. Ознакомьтесь с нашей полной документацией LLM API.
  3. Реализуйте вызовы API на вашем предпочитаемом языке программирования.
  4. Тщательно протестируйте в вашей среде разработки.

Пример с Python SDK

from openai import OpenAI

client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Your API Key",
)

model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True  # or Falsemax_tokens = 65500system_content = "Be a helpful assistant"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(model=model,messages=[
        {"role": "system","content": system_content,
        },
        {"role": "user","content": "Hi there!",
        }
    ],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
)
if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Пример с JavaScript SDK

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "Your API Key",
});
const stream = true; // or false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Be a helpful assistant",
      },
      {
        role: "user",
        content: "Hi there!",
      },
    ],
    model: "meta-llama/llama-3.2-3b-instruct",
    stream,
    response_format: { type: "text" },
    max_tokens: 16384,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();
  

Пример с Curl

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Your API Key" \
  -d @- << 'EOF'
{
    "model": "meta-llama/llama-3.2-3b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "Be a helpful assistant"
        },
        {
            "role": "user",
            "content": "Hi there!"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 16384,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF
  

Шаг 3: Оптимизируйте и масштабируйте

Максимизируйте вашу реализацию:

  • Отслеживайте использование токенов и расходы.
  • Уточняйте ваши промпты для повышения эффективности.
  • Масштабируйте приложение в зависимости от потребностей производительности.
  • Используйте возможности расширенной длины контекста.

Готовы преобразить разработку ИИ?

Посетите Novita AI уже сегодня, чтобы начать создавать с помощью Llama 3.2. Наша команда готова поддержать ваш путь от экспериментов до промышленного развертывания, гарантируя, что вы получите максимум от этих мощных моделей.

Оригинал опубликован на Novita AI

Novita AI — это универсальная облачная платформа, которая расширяет ваши ИИ-амбиции. Интегрированные API, бессерверные вычисления, GPU Instance — экономичные инструменты, которые вам нужны. Избавьтесь от инфраструктуры, начните бесплатно и воплотите своё ИИ-видение в реальность.

Рекомендуемое чтение

  1. Llama 3.2 vs GPT-4o: Как выбрать правильную ИИ-модель
  2. Как получить доступ к Llama 3.2: Оптимизация процесса разработки ИИ
  3. Llama 3.2 Vision: Раскрытие силы мультимодального ИИ с открытым исходным кодом