Amazon Bedrock

Les modèles ouverts et commerciaux de Mistral AI peuvent être déployés sur la plateforme cloud Amazon Bedrock sous forme d'endpoints entièrement gérés. Amazon Bedrock est un service serverless, vous n'avez donc aucune infrastructure à gérer.

À ce jour, les modèles suivants sont disponibles :

Mistral Large 3 (25.12)
Ministral 3 3B, 8B, 14B (25.12)
Mistral Large (24.07, 24.02)
Mistral Small (24.02)
Mixtral 8x7B
Mistral 7B
Pixtral Large (25.02)

Premiers pas

Les sections suivantes décrivent les étapes pour déployer et interroger un modèle Mistral sur la plateforme Amazon Bedrock.

Les éléments suivants sont requis :

Accès à un compte AWS dans une région qui prend en charge le service Amazon Bedrock et offre l'accès au modèle de votre choix : consultez la documentation Amazon Bedrock pour la disponibilité des modèles par région.
Un principal IAM AWS (utilisateur, rôle) avec les permissions suffisantes, voir la documentation AWS pour plus de détails.
Un environnement de code local configuré avec les composants SDK AWS pertinents, à savoir :
- l'AWS CLI : voir la documentation AWS pour la procédure d'installation.
- la bibliothèque Python boto3 : voir la documentation AWS pour la procédure d'installation.

Demander l'accès au modèle

Suivez les instructions de la documentation AWS pour débloquer l'accès au modèle Mistral de votre choix.

Interroger le modèle

Les modèles Amazon Bedrock sont accessibles via l'API Converse.

Avant d'exécuter les exemples ci-dessous, assurez-vous de :

Configurer correctement les informations d'authentification pour votre environnement de développement. La documentation AWS fournit une explication détaillée des étapes requises.
Créer un environnement virtuel Python avec le package boto3 (version >= 1.34.131).
Définir les variables d'environnement suivantes :
- AWS_REGION : La région où le modèle est déployé (par exemple us-west-2),
- AWS_BEDROCK_MODEL_ID : L'identifiant du modèle (par exemple mistral.mistral-large-2407-v1:0).

import boto3
import os

region = os.environ.get("AWS_REGION")
model_id = os.environ.get("AWS_BEDROCK_MODEL_ID")

bedrock_client = boto3.client(service_name='bedrock-runtime', region_name=region)

user_msg = "Who is the best French painter? Answer in one short sentence."
messages = [{"role": "user", "content": [{"text": user_msg}]}]
temperature = 0.0
max_tokens = 1024

params = {"modelId": model_id,
          "messages": messages,
          "inferenceConfig": {"temperature": temperature,
                              "maxTokens": max_tokens}}

resp = bedrock_client.converse(**params)

print(resp["output"]["message"]["content"][0]["text"])

import boto3
import os

region = os.environ.get("AWS_REGION")
model_id = os.environ.get("AWS_BEDROCK_MODEL_ID")

bedrock_client = boto3.client(service_name='bedrock-runtime', region_name=region)

user_msg = "Who is the best French painter? Answer in one short sentence."
messages = [{"role": "user", "content": [{"text": user_msg}]}]
temperature = 0.0
max_tokens = 1024

params = {"modelId": model_id,
          "messages": messages,
          "inferenceConfig": {"temperature": temperature,
                              "maxTokens": max_tokens}}

resp = bedrock_client.converse(**params)

print(resp["output"]["message"]["content"][0]["text"])

Aller plus loin

Pour plus de détails et d'exemples, consultez les ressources suivantes :