Limitations connues
Cette page documente les limitations actuelles de la plateforme Mistral. Nous travaillons activement à les résoudre. Consultez les changelogs pour les mises à jour.
Fenêtre de contexte
Fenêtre de contexte
| Modèle | Longueur de contexte maximale |
|---|---|
| Mistral Large 3 | 256k tokens |
| Mistral Medium 3.5 | 256k tokens |
| Mistral Medium 3.1 | 128k tokens |
| Mistral Small 4 | 256k tokens |
| Codestral | 128k tokens |
| Devstral 2 | 256k tokens |
| Magistral Medium 1.2 | 128k tokens |
| Ministral 3 (3B / 8B / 14B) | 256k tokens |
| Mistral Nemo 12B | 128k tokens |
Pour la liste complète et à jour, consultez les fiches modèles.
- Les requêtes dépassant la fenêtre de contexte du modèle renvoient une erreur
400 Bad Request. - Le décompte de tokens inclut les tokens d'entrée et de sortie. Planifiez votre
max_tokensen conséquence.
Limites de taux
Limites de taux
Les limites de taux varient selon le niveau d'abonnement et le modèle. Lorsqu'elles sont dépassées, l'API renvoie 429 Too Many Requests.
- Les requêtes par seconde et les tokens par minute sont appliqués de manière indépendante.
- Les limites s'appliquent par organisation.
- Vous pouvez consulter vos limites actuelles dans la page Limites.
- Le traitement par batch n'est pas comptabilisé dans les limites de taux en temps réel.
Astuce
Consultez l'en-tête de réponse X-RateLimit-Remaining pour surveiller votre utilisation avant d'atteindre la limite.
Téléchargement de fichiers
Téléchargement de fichiers
- Taille maximale de fichier : 512 Mo
- Formats supportés pour l'OCR : PDF, PNG, JPG, JPEG, TIFF, BMP, GIF, WEBP
- Les fichiers téléchargés sont conservés pendant 30 jours sauf suppression anticipée.
Traitement par batch
Traitement par batch
- Taille maximale du fichier batch : 512 Mo.
- Nombre maximal de requêtes par batch : 100 000.
- Les jobs batch sont traités de manière asynchrone ; le temps de complétion dépend de la profondeur de la file d'attente et de la complexité des requêtes.
- Les résultats de batch sont disponibles au téléchargement pendant 24 heures après la complétion.
Streaming
Streaming
- Les connexions en streaming expirent après 10 minutes d'inactivité.
stream_options.include_usagedoit être explicitement défini pour recevoir l'utilisation des tokens dans les événements de stream.- Certaines bibliothèques HTTP clientes peuvent mettre en mémoire tampon les réponses streamées ; assurez-vous que l'encodage de transfert fragmenté est géré correctement.
Appels de fonction
Appels de fonction
- Nombre maximal d'outils par requête : 128.
- Les descriptions d'outils sont incluses dans le décompte de tokens. Les descriptions longues réduisent le contexte disponible pour les messages.
- Les appels de fonction parallèles sont supportés mais peuvent renvoyer les appels dans n'importe quel ordre.
tool_choice: "any"force un appel d'outil mais ne garantit pas quel outil sera sélectionné.
Mode JSON
Mode JSON
- Lorsque
response_format: {"type": "json_object"}est défini, le modèle renvoie toujours du JSON valide. - Vous devez inclure "JSON" dans le prompt système ou utilisateur. Sinon, le modèle peut produire un flux infini d'espaces blancs.
- Le mode JSON ne garantit pas l'adhésion à un schéma spécifique. Utilisez les appels de fonction pour des sorties structurées.
Vision
Vision
- Taille maximale d'image : 20 Mo par image.
- Formats supportés : PNG, JPG, JPEG, GIF, WEBP.
- Le nombre maximal d'images par requête dépend du modèle et du budget total de tokens.
- Les images sont redimensionnées en interne ; les très petites images peuvent perdre en détail.
Transcription audio
Transcription audio
- Formats supportés : WAV, MP3, FLAC, OGG, WEBM.
- Durée audio maximale : 60 minutes.
- Taille maximale de fichier : 500 Mo.
- La transcription est optimisée pour la parole claire ; un bruit de fond important réduit la précision.
Disponibilité régionale
Disponibilité régionale
- L'API Mistral est servie depuis des centres de données européens par défaut.
- Certains modèles peuvent ne pas être disponibles dans toutes les régions. Consultez la page des modèles pour les détails.