Déploiement

Exécutez les modèles Mistral via des services cloud gérés ou Mistral Compute. Les modèles open-weight (Apache 2.0) peuvent être déployés sur du matériel compatible. Les modèles commerciaux sont disponibles via les intégrations cloud providers ou Mistral Compute.

Dans cette section

Déploiements cloud : Accédez aux modèles Mistral via Azure AI, Amazon Bedrock, Google Cloud Vertex AI, Snowflake Cortex, IBM watsonx et Outscale.
Déploiement local : Exécutez les modèles open-weight sur votre propre infrastructure en utilisant vLLM, TensorRT-LLM, TGI, SkyPilot, Cerebrium ou Cloudflare Workers AI. Prend en charge les configurations allant des setups mono-GPU (RTX 4090) aux clusters multi-nœuds (4+ H100s pour les modèles plus volumineux).