Présentation de Dolly 2.0 : libérer tout le potentiel des modèles de langage open source

Présentation de Dolly 2.0 : libérer tout le potentiel des modèles de langage open source

Introduction

Databricks a dévoilé un véritable changement de jeu dans le monde de l’intelligence artificielle — Dolly 2.0, le premier grand modèle de langage (LLM) open source, capable de suivre des instructions, et disponible pour un usage commercial. Mais qu’est-ce qui rend Dolly 2.0 si révolutionnaire, et comment les organisations peuvent-elles exploiter ses capacités pour stimuler l’innovation ? Ce guide complet explore la puissance technique, les atouts convaincants et les diverses applications de ce puissant modèle d’IA, tout en examinant comment l’API LLM peut surmonter ses limites.

Qu’est-ce que Dolly 2.0 ?

Dolly 2.0 est la dernière avancée dans le domaine des grands modèles de langage (LLM) développée par Databricks. S’appuyant sur le succès de son modèle antérieur Dolly 1.0, Dolly 2.0 est le premier LLM open source, capable de suivre des instructions, et disponible pour un usage commercial.

Détails techniques de Dolly 2.0

Dolly 2.0 est un modèle de 12 milliards de paramètres, affiné sur un nouvel ensemble de données appelé databricks-dolly-15k. Cet ensemble de données a été méticuleusement créé par plus de 5 000 employés de Databricks, qui ont généré 15 000 paires question-réponse de haute qualité, spécialement conçues pour entraîner un LLM à suivre des instructions. Contrairement aux ensembles de données précédents, databricks-dolly-15k est entièrement sous licence pour un usage commercial (licence Creative Commons).

Ce nouvel ensemble de données, nommé databricks-dolly-15k, contient 15 000 paires question-réponse de haute qualité, spécialement conçues pour l’adaptation aux instructions des grands modèles de langage. L’ensemble de données a été collecté grâce à la participation de plus de 5 000 employés de Databricks en mars et avril 2023, qui ont été incités par un concours à générer une large gamme de questions et de réponses couvrant des tâches telles que les questions-réponses ouvertes, les questions-réponses à livre fermé, l’extraction et le résumé d’informations, le brainstorming, la classification et l’écriture créative.

Dépassant leur objectif initial de 10 000, Databricks a utilisé la gamification pour collecter rapidement cet ensemble de données conséquent, qui est crucialement sous licence pour un usage commercial (licence Creative Commons), contrairement aux ensembles de données d’instructions précédents.

Pourquoi Databricks a-t-il rendu Dolly 2.0 viable commercialement ?

Le parcours de Databricks pour créer un LLM à instructions viable commercialement a été motivé par la demande des clients. Lors de la sortie de Dolly 1.0, la principale question était de savoir s’il pouvait être utilisé à des fins commerciales — mais l’ensemble de données sous-jacent avait des conditions d’utilisation qui l’interdisaient. Pour résoudre ce problème, Databricks a sollicité la foule pour le nouvel ensemble de données databricks-dolly-15k, en tirant parti de plus de 5 000 employés enthousiastes pour générer des paires question-réponse originales et de haute qualité.

Le résultat est Dolly 2.0 — un LLM open source puissant que toute organisation peut utiliser, modifier et enrichir pour créer des assistants et des applications d’IA spécialisés. Databricks estime que cette approche ouverte et communautaire du développement de l’IA est essentielle pour garantir que l’IA profite à tous, et pas seulement à quelques grandes entreprises technologiques.

Les points forts de Dolly 2.0

Capacités de réglage fin personnalisable

Contrairement aux grands modèles de langage (LLM) gérés comme ChatGPT, Dolly 2.0 offre aux utilisateurs un contrôle total sur le processus de réglage fin. Au lieu d’être limités par des frais par jeton ou par enregistrement imposés par les fournisseurs de services gérés, les utilisateurs peuvent affiner les modèles open source pré-entraînés de Dolly 2.0 selon leurs besoins spécifiques sans frais supplémentaires. Point crucial, les utilisateurs de Dolly 2.0 ont également un accès complet aux métriques d’évaluation et une compréhension claire du comportement du modèle, ce qui permet aux data scientists de se sentir plus à l’aise et en confiance lorsqu’ils travaillent avec cette technologie.

Infrastructure évolutive et adaptable

Dolly 2.0 offre aux utilisateurs la liberté de déployer les modèles sur leur infrastructure cloud ou sur site préférée, offrant ainsi la flexibilité de choisir l’environnement de déploiement le mieux adapté à leurs besoins. Lorsque le besoin d’une latence améliorée ou d’un débit accru se fait sentir, les utilisateurs peuvent facilement augmenter ou étendre leur infrastructure à la demande en provisionnant des ressources cloud supplémentaires. Cette capacité à évoluer dynamiquement est particulièrement précieuse pour les organisations ayant des charges de travail variables. Ce niveau de flexibilité de l’infrastructure n’est généralement pas disponible avec les LLM gérés, où les utilisateurs sont limités aux capacités de mise à l’échelle du fournisseur.

Traitement sécurisé et confidentiel des données

Pour les secteurs ayant des exigences strictes en matière de confidentialité des données, comme la finance et la santé, Dolly 2.0 présente une alternative plus sécurisée aux LLM gérés hébergés en externe. Lors du réglage fin des modèles Dolly 2.0, les utilisateurs peuvent le faire sans exposer leurs données confidentielles à des fournisseurs tiers. De plus, l’inférence peut être effectuée entièrement sur les propres serveurs sécurisés de l’utilisateur, garantissant que les informations sensibles ne quittent jamais leur environnement contrôlé. Cela contraste avec les services gérés comme ChatGPT, où les utilisateurs doivent faire confiance au fournisseur de services pour maintenir la posture de sécurité des données nécessaire et se conformer aux réglementations applicables.

Utilisation commerciale sans restriction

La licence Apache 2.0 de Dolly 2.0 accorde aux utilisateurs la liberté d’utiliser les modèles à des fins commerciales sans restrictions. Cette licence ouverte et permissive permet aux organisations de vendre librement des produits ou de déployer des services exploitant les modèles Dolly 2.0, sans avoir à payer de redevances ni à naviguer dans des accords de licence complexes. Cette flexibilité n’est pas toujours présente avec d’autres modèles de langage open source, qui peuvent avoir des conditions d’utilisation plus restrictives ou nécessiter des frais de licence pour certaines applications commerciales.

Applications commerciales de Dolly 2.0

Assistants IA personnalisables

Étant donné que Dolly 2.0 est un modèle de langage open source, viable commercialement et capable de suivre des instructions, les organisations peuvent l’exploiter pour construire des assistants IA adaptés à leurs besoins spécifiques. Au lieu de se limiter à des chatbots ou assistants génériques, les entreprises peuvent affiner et personnaliser Dolly 2.0 pour fournir un soutien spécifique à leur domaine à leurs employés et clients.

Par exemple, une société de services financiers pourrait prendre Dolly 2.0 et l’entraîner davantage sur ses politiques internes, ses informations produits et ses données de service client. Cela lui permettrait de déployer un assistant IA hautement personnalisé capable de gérer un large éventail de demandes clients, de la gestion de compte aux conseils en investissement, tout en restant conforme aux normes de l’entreprise.

Création de contenu et idéation

Les capacités étendues de suivi d’instructions de Dolly 2.0 le rendent bien adapté aux tâches de création de contenu et d’idéation. Les entreprises dans des domaines comme le marketing, la publicité et les médias pourraient utiliser Dolly 2.0 pour générer des premières ébauches d’articles, de publications sur les réseaux sociaux, de briefs créatifs, etc. La capacité du modèle à résumer des informations et à brainstormer de nouvelles idées pourrait accélérer considérablement le processus de production de contenu.

Une agence de marketing, par exemple, pourrait exploiter Dolly 2.0 pour prototyper rapidement des concepts de campagne, rédiger des exemples de contenus pour les réseaux sociaux, et même produire des éléments créatifs initiaux comme des slogans et des accroches. Les humains pourraient ensuite affiner et polir les sorties du modèle pour répondre à leurs besoins spécifiques de marque et de messagerie.

Analyse automatisée des données

Les organisations disposant de grands ensembles de données, comme les sociétés d’études de marché ou les équipes de business intelligence, pourraient employer Dolly 2.0 pour automatiser certaines tâches d’analyse de données et de reporting. La compétence du modèle à extraire des informations clés d’un texte, à répondre à des questions ciblées et à résumer des insights pourrait aider à générer des premières conclusions analytiques que les humains pourront ensuite valider et approfondir.

Cela pourrait réduire le temps et les efforts nécessaires pour transformer des données brutes en informations exploitables, permettant aux analystes de se concentrer davantage sur l’interprétation de haut niveau et les recommandations stratégiques plutôt que sur le traitement des données de bas niveau.

La nature open source et commercialement favorable de Dolly 2.0 ouvre un large éventail de cas d’utilisation potentiels dans tous les secteurs, permettant aux organisations de créer des solutions IA personnalisées qui répondent à leurs besoins et priorités uniques. Comme Databricks l’a souligné, cette approche vise à garantir que les avantages des modèles de langage avancés soient accessibles à une communauté plus large, et pas seulement à quelques grandes entreprises technologiques.

Comment démarrer avec Dolly 2.0 ?

Si vous souhaitez commencer à utiliser Dolly 2.0 sans entraîner le modèle, voici les instructions :

  1. Le modèle pré-entraîné Dolly 2.0 est disponible sur Hugging Face sous le nom databricks/dolly-v2-12b.

2. Pour utiliser le modèle avec la bibliothèque Transformers sur une machine équipée de GPU A100 :

from transformers import pipeline
import torch

instruct_pipeline = pipeline(model=“databricks/dolly-v2-12b”, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map=“auto”)

Vous pouvez ensuite utiliser instruct_pipeline pour générer des réponses aux instructions.

3. Pour d’autres instances GPU :

(1) GPU A10 :

  • Les modèles à 6,9B et 2,8B paramètres devraient fonctionner tels quels.
  • Pour le modèle à 12B paramètres, vous devez charger et exécuter le modèle en utilisant des poids 8 bits, ce qui peut légèrement affecter les résultats.

(2) GPU V100 :

  • Définissez torch_dtype=torch.float16 dans la commande pipeline() au lieu de torch.bfloat16.
  • Le modèle à 12B paramètres peut ne pas bien fonctionner en 8 bits sur les V100.

Les points clés sont que le modèle pré-entraîné Dolly 2.0 est disponible sur Hugging Face et que vous pouvez utiliser la bibliothèque Transformers pour charger et utiliser le modèle pour la génération de réponses. Cependant, la configuration spécifique peut devoir être ajustée en fonction du matériel GPU dont vous disposez. Pour plus d’informations, vous pouvez consulter databrickslabs/dolly sur Github.

Limites et inconvénients de Dolly 2.0

Bien que Dolly 2.0 représente une avancée significative dans le domaine des modèles de langage open source, viables commercialement et capables de suivre des instructions, il n’est pas sans limites.

Limites linguistiques

Un inconvénient majeur est le manque de formation étendue du modèle dans d’autres langues que l’anglais. Ni Dolly 2.0 ni son ossature Pythia sous-jacente n’ont été largement entraînés sur des ensembles de données non anglophones. Cela signifie que les applications nécessitant des capacités multilingues devraient probablement entreprendre des efforts de réglage fin substantiels pour capturer les nuances des autres langues, ce qui pourrait ne pas être une stratégie viable compte tenu des innombrables caractéristiques linguistiques à prendre en compte.

Contraintes contextuelles

Une autre limitation est la fenêtre de tokens relativement étroite de Dolly 2.0, soit 2 048 tokens. C’est nettement moins que les tailles de contexte prises en charge par de nombreux modèles de langage gérés, qui peuvent atteindre 32 000 tokens ou plus. Pour les cas d’utilisation impliquant de grandes entrées, comme le résumé de documents longs, Dolly 2.0 peut nécessiter des stratégies de segmentation et pourrait potentiellement produire des résultats sous-optimaux en raison du contexte limité qu’il peut traiter à la fois.

Problèmes de passage à l’échelle

De plus, les modèles Dolly 2.0 actuels n’atteignent pas encore la gamme des 100 milliards de paramètres, ce que certaines applications pourraient nécessiter pour rivaliser avec les capacités de modèles comme ChatGPT. Cette contrainte de taille pourrait limiter les performances de Dolly 2.0 dans certains scénarios à enjeux élevés ou critiques où les modèles de langage les plus puissants sont nécessaires.

Limitations en cours

Databricks a également reconnu que, en tant que modèle orienté recherche en cours de développement actif, Dolly 2.0 peut présenter diverses autres limitations. Il s’agit notamment de difficultés à gérer des instructions complexes, des questions-réponses ouvertes, un formatage approprié des tâches d’écriture, la génération de code, les opérations mathématiques et le maintien d’un sens de l’humour ou d’un style d’écriture cohérent. Bien que ces lacunes soient susceptibles d’être résolues par d’autres itérations et améliorations, elles représentent des contraintes actuelles dont les utilisateurs doivent être conscients lorsqu’ils envisagent Dolly 2.0 pour leurs applications spécifiques.

Surmonter les limites de Dolly 2.0

Bien que les modèles open source comme Dolly 2.0 représentent des avancées importantes, ils présentent encore des limitations significatives qui peuvent restreindre leur applicabilité dans le monde réel. Pour surmonter ces limitations, Novita AI propose une API LLM complète conçue pour offrir aux organisations la flexibilité et les capacités nécessaires pour construire des solutions d’IA véritablement personnalisées.

Variété de modèles et personnalisation

Au cœur de notre API LLM se trouve la possibilité de choisir parmi une variété de grands modèles de langage, et non pas seulement une option pré-entraînée unique. Cela signifie que vous pouvez sélectionner le modèle qui correspond le mieux à votre cas d’utilisation spécifique, qu’il s’agisse d’une variante multilingue pour des applications mondiales, d’un modèle à plus haut paramétrage pour des tâches critiques, ou d’une version spécialisée ajustée à un domaine pour des besoins spécifiques à un secteur.

Mais la sélection du modèle n’est que le début. Notre API vous permet également de modifier systématiquement le ton, la personnalité et le comportement du LLM choisi grâce à l’utilisation de prompts soigneusement conçus. En affinant les schémas de réponse du modèle, vous pouvez vous assurer que votre assistant IA adopte exactement la voix, l’empathie et l’expertise nécessaires pour interagir efficacement avec vos utilisateurs ou clients.

Contrôles avancés des paramètres

En plus de la personnalisation du modèle et des prompts, notre API LLM met des contrôles granulaires entre vos mains. Vous pouvez ajuster des paramètres clés comme la température, top_p, presence_penalty et le nombre maximum de tokens pour optimiser les sorties du modèle en fonction des exigences spécifiques de votre application. Ce niveau d’adaptation vous permet de trouver l’équilibre parfait entre créativité, cohérence et concision.

Intégration transparente de personnages

Pour améliorer encore l’expérience utilisateur, notre API LLM prend en charge l’intégration de personnages personnalisés capables de converser avec vos utilisateurs finaux. Ces personnages peuvent être conçus pour correspondre à votre marque, votre secteur ou votre public cible, contribuant ainsi à créer une interaction plus immersive et personnalisée. En combinant la puissance des grands modèles de langage avec la familiarité d’un personnage auquel on peut s’identifier, vous pouvez construire des assistants IA qui résonnent véritablement avec votre public.

Conclusion

Bien que Dolly 2.0 offre une alternative open source prometteuse aux modèles de langage à instructions commercialement restreints, il n’est pas sans limites. Les organisations doivent évaluer soigneusement les capacités et les contraintes de Dolly 2.0 dans le contexte de leurs cas d’utilisation et exigences spécifiques avant de l’adopter. Pour surmonter les limites de Dolly 2.0 et d’autres modèles de langage open source, l’API LLM complète de Novita AI peut offrir une solution puissante.

Novita AI, la plateforme tout-en-un pour une créativité sans limites qui vous donne accès à plus de 100 API. De la génération d’images au traitement du langage, en passant par l’amélioration audio et la manipulation vidéo, avec un paiement à l’utilisation économique, elle vous libère des contraintes de maintenance des GPU tout en vous permettant de créer vos propres produits. Essayez-le gratuitement.