Embeddings

Embeddings sont des représentations vectorielles de texte qui capturent la signification sémantique des paragraphes par leur position dans un espace vectoriel de haute dimension. L’API Embeddings de Mistral fournit des embeddings pour le texte et le code, que vous pouvez utiliser pour des tâches de traitement automatique du langage naturel (NLP).

Les embeddings peuvent alimenter des systèmes de récupération pour la génération augmentée par récupération (RAG), le regroupement de données non structurées, la classification de documents, la recherche sémantique de code, l’analyse de code, la détection de doublons et la recherche dans des sources de texte ou de code bruts.

Si vous souhaitez une fonctionnalité gérée qui ingère, vectorise et recherche des documents pour vous, utilisez Bibliothèques. Si vous souhaitez rechercher des sources connectées comme Google Drive ou SharePoint, utilisez Connecteurs.

Services

Nous proposons deux modèles d’embeddings :

Embeddings de texte : intégrez une large variété de texte avec un modèle d’embedding polyvalent.
Embeddings de code : intégrez des bases de données de code et des dépôts pour la récupération de code.

Nous abordons les bases de l’API embeddings, y compris la manière de mesurer la distance entre les embeddings de texte, et explorons deux cas d’usage principaux : le regroupement et la classification.

Plus

Pour un exemple rapide et une introduction sur l’utilisation des embeddings pour le RAG, consultez guide de démarrage RAG.