Amazon Bedrock
Les modèles ouverts et commerciaux de Mistral AI peuvent être déployés sur la plateforme cloud Amazon Bedrock sous forme d'endpoints entièrement gérés. Amazon Bedrock est un service serverless, vous n'avez donc aucune infrastructure à gérer.
À ce jour, les modèles suivants sont disponibles :
- Mistral Large 3 (25.12)
- Ministral 3 3B, 8B, 14B (25.12)
- Mistral Large (24.07, 24.02)
- Mistral Small (24.02)
- Mixtral 8x7B
- Mistral 7B
- Pixtral Large (25.02)
Premiers pas
Premiers pas
Les sections suivantes décrivent les étapes pour déployer et interroger un modèle Mistral sur la plateforme Amazon Bedrock.
Les éléments suivants sont requis :
- Accès à un compte AWS dans une région qui prend en charge le service Amazon Bedrock et offre l'accès au modèle de votre choix : consultez la documentation Amazon Bedrock pour la disponibilité des modèles par région.
- Un principal IAM AWS (utilisateur, rôle) avec les permissions suffisantes, voir la documentation AWS pour plus de détails.
- Un environnement de code local configuré avec les composants SDK AWS pertinents, à savoir :
- l'AWS CLI : voir la documentation AWS pour la procédure d'installation.
- la bibliothèque Python
boto3: voir la documentation AWS pour la procédure d'installation.
Demander l'accès au modèle
Demander l'accès au modèle
Suivez les instructions de la documentation AWS pour débloquer l'accès au modèle Mistral de votre choix.
Interroger le modèle
Interroger le modèle
Les modèles Amazon Bedrock sont accessibles via l'API Converse.
Avant d'exécuter les exemples ci-dessous, assurez-vous de :
- Configurer correctement les informations d'authentification pour votre environnement de développement. La documentation AWS fournit une explication détaillée des étapes requises.
- Créer un environnement virtuel Python avec le package
boto3(version >=1.34.131). - Définir les variables d'environnement suivantes :
AWS_REGION: La région où le modèle est déployé (par exempleus-west-2),AWS_BEDROCK_MODEL_ID: L'identifiant du modèle (par exemplemistral.mistral-large-2407-v1:0).
import boto3
import os
region = os.environ.get("AWS_REGION")
model_id = os.environ.get("AWS_BEDROCK_MODEL_ID")
bedrock_client = boto3.client(service_name='bedrock-runtime', region_name=region)
user_msg = "Who is the best French painter? Answer in one short sentence."
messages = [{"role": "user", "content": [{"text": user_msg}]}]
temperature = 0.0
max_tokens = 1024
params = {"modelId": model_id,
"messages": messages,
"inferenceConfig": {"temperature": temperature,
"maxTokens": max_tokens}}
resp = bedrock_client.converse(**params)
print(resp["output"]["message"]["content"][0]["text"])Aller plus loin
Aller plus loin
Pour plus de détails et d'exemples, consultez les ressources suivantes :