Limitations connues

Cette page documente les limitations actuelles de la plateforme Mistral. Nous travaillons activement à les résoudre. Consultez les changelogs pour les mises à jour.

Fenêtre de contexte

Fenêtre de contexte

ModèleLongueur de contexte maximale
Mistral Large 3256k tokens
Mistral Medium 3.5256k tokens
Mistral Medium 3.1128k tokens
Mistral Small 4256k tokens
Codestral128k tokens
Devstral 2256k tokens
Magistral Medium 1.2128k tokens
Ministral 3 (3B / 8B / 14B)256k tokens
Mistral Nemo 12B128k tokens

Pour la liste complète et à jour, consultez les fiches modèles.

  • Les requêtes dépassant la fenêtre de contexte du modèle renvoient une erreur 400 Bad Request.
  • Le décompte de tokens inclut les tokens d'entrée et de sortie. Planifiez votre max_tokens en conséquence.
Limites de taux

Limites de taux

Les limites de taux varient selon le niveau d'abonnement et le modèle. Lorsqu'elles sont dépassées, l'API renvoie 429 Too Many Requests.

  • Les requêtes par seconde et les tokens par minute sont appliqués de manière indépendante.
  • Les limites s'appliquent par organisation.
  • Vous pouvez consulter vos limites actuelles dans la page Limites.
  • Le traitement par batch n'est pas comptabilisé dans les limites de taux en temps réel.
Astuce

Consultez l'en-tête de réponse X-RateLimit-Remaining pour surveiller votre utilisation avant d'atteindre la limite.

Téléchargement de fichiers

Téléchargement de fichiers

  • Taille maximale de fichier : 512 Mo
  • Formats supportés pour l'OCR : PDF, PNG, JPG, JPEG, TIFF, BMP, GIF, WEBP
  • Les fichiers téléchargés sont conservés pendant 30 jours sauf suppression anticipée.
Traitement par batch

Traitement par batch

  • Taille maximale du fichier batch : 512 Mo.
  • Nombre maximal de requêtes par batch : 100 000.
  • Les jobs batch sont traités de manière asynchrone ; le temps de complétion dépend de la profondeur de la file d'attente et de la complexité des requêtes.
  • Les résultats de batch sont disponibles au téléchargement pendant 24 heures après la complétion.
Streaming

Streaming

  • Les connexions en streaming expirent après 10 minutes d'inactivité.
  • stream_options.include_usage doit être explicitement défini pour recevoir l'utilisation des tokens dans les événements de stream.
  • Certaines bibliothèques HTTP clientes peuvent mettre en mémoire tampon les réponses streamées ; assurez-vous que l'encodage de transfert fragmenté est géré correctement.
Appels de fonction

Appels de fonction

  • Nombre maximal d'outils par requête : 128.
  • Les descriptions d'outils sont incluses dans le décompte de tokens. Les descriptions longues réduisent le contexte disponible pour les messages.
  • Les appels de fonction parallèles sont supportés mais peuvent renvoyer les appels dans n'importe quel ordre.
  • tool_choice: "any" force un appel d'outil mais ne garantit pas quel outil sera sélectionné.
Mode JSON

Mode JSON

  • Lorsque response_format: {"type": "json_object"} est défini, le modèle renvoie toujours du JSON valide.
  • Vous devez inclure "JSON" dans le prompt système ou utilisateur. Sinon, le modèle peut produire un flux infini d'espaces blancs.
  • Le mode JSON ne garantit pas l'adhésion à un schéma spécifique. Utilisez les appels de fonction pour des sorties structurées.
Vision

Vision

  • Taille maximale d'image : 20 Mo par image.
  • Formats supportés : PNG, JPG, JPEG, GIF, WEBP.
  • Le nombre maximal d'images par requête dépend du modèle et du budget total de tokens.
  • Les images sont redimensionnées en interne ; les très petites images peuvent perdre en détail.
Transcription audio

Transcription audio

  • Formats supportés : WAV, MP3, FLAC, OGG, WEBM.
  • Durée audio maximale : 60 minutes.
  • Taille maximale de fichier : 500 Mo.
  • La transcription est optimisée pour la parole claire ; un bruit de fond important réduit la précision.
Disponibilité régionale

Disponibilité régionale

  • L'API Mistral est servie depuis des centres de données européens par défaut.
  • Certains modèles peuvent ne pas être disponibles dans toutes les régions. Consultez la page des modèles pour les détails.