Limites de débit et niveaux d’utilisation
Lorsque vous utilisez l’API Mistral, vos requêtes sont soumises à des limites de débit. Ces limites nous permettent de garantir une utilisation équitable, d’équilibrer la charge et de prévenir les abus.
Les limites de débit sont définies au niveau de l’Organisation ; elles s’appliquent à tous les espaces de travail de votre organisation.
Consultez Admin›Limites ↗ pour voir les limites en vigueur et le niveau d’utilisation de votre espace de travail.
Fonctionnement des limites de débit
Trois types de limites sont appliqués :
- Requêtes par seconde (RPS) : nombre maximal de requêtes API simultanées.
- Jetons par minute : limite de débit concernant le traitement de jetons (entrée et sortie cumulées).
- Jetons par mois : plafond global de consommation.
Formules et niveaux
Les niveaux de limite de débit dépendent de votre formule Studio :
Experiment plan (gratuit)
Le niveau gratuit de l’API est réservé à l’évaluation et au prototypage uniquement. Ce niveau propose des limites de débit restreintes. Pour augmenter vos limites, passez à la formule Scale.
Scale plan (paiement à l’usage)
La formule Scale donne accès au niveau 1 et supérieurs. Passez à l’offre supérieure depuis Admin›Abonnements ↗.
Niveaux d’utilisation
Une fois sur la formule Scale, les passages de niveau se font automatiquement en fonction de votre facturation cumulée :
| Facturation cumulée | Niveau | Passage |
|---|---|---|
| 0 $ / 0 € (Experiment plan) | Gratuit | Limites restreintes pour évaluation et prototypage |
| 0 $ / 0 € (Scale plan) | Niveau 1 | Automatique lors du changement de formule |
| > 20 $ / 20 € | Niveau 2 | Automatique |
| > 100 $ / 100 € | Niveau 3 | Automatique |
| > 500 $ / 500 € | Niveau 4 | Automatique |
| > 2 000 $ / 2 000 € | Limites supérieures | Contactez support |
La facturation cumulée correspond au montant total de toutes vos factures, ce n’est pas un montant mensuel.
Demander des limites plus élevées
Pour demander une augmentation au-delà du niveau 4, vous devez d’abord atteindre le niveau 4 et avoir atteint le seuil de facturation requis (> 2 000 $ / 2 000 €). Contactez ensuite support en précisant :
- Votre objectif de requêtes par seconde
- Le modèle que vous souhaitez utiliser
- Une estimation du volume de jetons requis par minute et par mois