Embeddings

Les embeddings sont des représentations vectorielles de texte qui capturent le sens sémantique de paragraphes par leur position dans un espace vectoriel de haute dimension. L'API Embeddings de Mistral AI propose des embeddings de pointe pour le texte et le code, utilisables pour de nombreuses tâches de traitement du langage naturel (NLP).

embedding_graph

Parmi la vaste gamme de cas d'usage pour les embeddings, on trouve les systèmes de récupération alimentant la génération augmentée par récupération, le clustering de données non organisées, la classification de volumes importants de documents, la recherche sémantique de code pour explorer bases de données et repositories, l'analytique de code, la détection de doublons, et divers types de recherche lors du traitement de multiples sources de texte ou de code brut.

Services

Services

Nous proposons deux embeddings de pointe :

  • Text Embeddings : Pour l'embedding d'une grande variété de textes, un modèle d'embedding général et performant.
  • Code Embeddings : Spécialement conçu pour le code, parfait pour l'embedding de bases de données de code, de repositories, et pour alimenter des assistants de codage avec une récupération de pointe.

Nous couvrirons les fondamentaux de l'API embeddings, notamment comment mesurer la distance entre embeddings de texte, et explorerons deux cas d'usage principaux : le clustering et la classification.

Plus

Plus

Pour un exemple rapide et une introduction sur l'utilisation des embeddings pour le RAG (Retrieval-Augmented Generation), consultez notre RAG Quickstart.