L'ID de l'agent à utiliser pour cette complétion.













Endpoints Agents dépréciés
(obsolète) API de complétion Agents












Exemples
Exemples réels de code
Complétion Agents
POST /v1/agents/completions
agent_id
frequency_penalty
Valeur par défaut : 0
Le paramètre frequency_penalty pénalise la répétition de mots en fonction de leur fréquence dans le texte généré. Une pénalité de fréquence élevée décourage le modèle de répéter des mots déjà apparus fréquemment dans la sortie, favorisant ainsi la diversité et réduisant les répétitions.
max_tokens
Le nombre maximal de tokens à générer dans la complétion. Le nombre de tokens de votre prompt additionné à max_tokens ne peut excéder la longueur de contexte du modèle.
Le ou les prompts pour lesquels générer des complétions, encodés sous forme de liste de dictionnaires avec les clés role et content.
metadata
n
Nombre de complétions à renvoyer pour chaque requête ; les tokens d'entrée ne sont facturés qu'une seule fois.
parallel_tool_calls
Valeur par défaut : true
prediction
Permet de spécifier une complétion attendue, optimisant les temps de réponse en exploitant un contenu connu ou prévisible.
presence_penalty
Valeur par défaut : 0
Le presence_penalty détermine dans quelle mesure le modèle pénalise la répétition de mots ou d'expressions. Une valeur élevée encourage le modèle à utiliser un vocabulaire plus varié, ce qui rend la sortie plus diversifiée et créative.
prompt_cache_key
Une clé de cache permettant la mise en cache des invites. Lorsque fournie, l’API tentera de réutiliser les tokens précédemment calculés pour les requêtes partageant le même préfixe (par exemple, des conversations multi-tours ou des requêtes avec un prompt système similaire). Les tokens en cache sont facturés à 10 % du tarif standard des tokens en entrée.
prompt_mode
Options disponibles pour l'argument prompt_mode sur le point de terminaison de chat completion. Les valeurs représentent l'intention de haut niveau. L'assignation aux SP réels est gérée en interne. Le prompt système peut inclure la date limite des connaissances, les capacités du modèle, le ton à utiliser, les directives de sécurité, etc.
random_seed
La graine à utiliser pour l'échantillonnage aléatoire. Si définie, différents appels généreront des résultats déterministes.
reasoning_effort
Contrôle le niveau d'effort de raisonnement pour les modèles de raisonnement. "high" active des traces de raisonnement complètes, "none" désactive l'effort de raisonnement.
response_format
Spécifie le format que le modèle doit produire en sortie. Par défaut, il utilise \{ "type": "text" \}. Définir \{ "type": "json_object" \} active le mode JSON, qui garantit que le message généré par le modèle est au format JSON. Lors de l'utilisation du mode JSON, vous DEVEZ également demander au modèle de produire du JSON via un message système ou utilisateur. Définir \{ "type": "json_schema" \} active le mode schéma JSON, qui garantit que le message généré par le modèle est au format JSON et suit le schéma que vous fournissez.
stop
Arrête la génération si ce token est détecté. Ou si l'un de ces tokens est détecté lorsqu'un tableau est fourni
stream
Valeur par défaut : false
Indique s'il faut diffuser la progression partielle en continu. Si activé, les tokens seront envoyés sous forme d'événements serveur (server-side events) contenant uniquement des données au fur et à mesure de leur disponibilité, le flux se terminant par un message data: [DONE]. Sinon, le serveur maintiendra la requête ouverte jusqu'au timeout ou jusqu'à la complétion, la réponse contenant le résultat complet au format JSON.
tool_choice
200
Réponse réussie
Playground
Testez les endpoints en direct
import { Mistral } from "@mistralai/mistralai";
const mistral = new Mistral({
apiKey: "MISTRAL_API_KEY",
});
async function run() {
const result = await mistral.agents.complete({
messages: [
{
content: "Who is the best French painter? Answer in one short sentence.",
role: "user",
},
],
agentId: "<id>",
});
console.log(result);
}
run();
import { Mistral } from "@mistralai/mistralai";
const mistral = new Mistral({
apiKey: "MISTRAL_API_KEY",
});
async function run() {
const result = await mistral.agents.complete({
messages: [
{
content: "Who is the best French painter? Answer in one short sentence.",
role: "user",
},
],
agentId: "<id>",
});
console.log(result);
}
run();
from mistralai.client import Mistral
import os
with Mistral(
api_key=os.getenv("MISTRAL_API_KEY", ""),
) as mistral:
res = mistral.agents.complete(messages=[
{
"role": "user",
"content": "Who is the best French painter? Answer in one short sentence.",
},
], agent_id="<id>", stream=False, response_format={
"type": "text",
})
# Handle response
print(res)
from mistralai.client import Mistral
import os
with Mistral(
api_key=os.getenv("MISTRAL_API_KEY", ""),
) as mistral:
res = mistral.agents.complete(messages=[
{
"role": "user",
"content": "Who is the best French painter? Answer in one short sentence.",
},
], agent_id="<id>", stream=False, response_format={
"type": "text",
})
# Handle response
print(res)
curl https://api.mistral.ai/v1/agents/completions \
-X POST \
-H 'Authorization: Bearer YOUR_APIKEY_HERE' \
-H 'Content-Type: application/json' \
-d '{
"agent_id": "ipsum eiusmod",
"messages": [
{
"content": "consequat do"
}
]
}'curl https://api.mistral.ai/v1/agents/completions \
-X POST \
-H 'Authorization: Bearer YOUR_APIKEY_HERE' \
-H 'Content-Type: application/json' \
-d '{
"agent_id": "ipsum eiusmod",
"messages": [
{
"content": "consequat do"
}
]
}'200
{
"id": "cf79f7daaee244b1a0ae5c7b1444424a",
"object": "chat.completion",
"model": "mistral-medium-latest",
"usage": {
"prompt_tokens": 24,
"completion_tokens": 27,
"total_tokens": 51,
"prompt_audio_seconds": {}
},
"created": 1759500534,
"choices": [
{
"index": 0,
"message": {
"content": "Arrr, the scallywag Claude Monet be the finest French painter to ever splash colors on a canvas, savvy?",
"tool_calls": null,
"prefix": false,
"role": "assistant"
},
"finish_reason": "stop"
}
]
}{
"id": "cf79f7daaee244b1a0ae5c7b1444424a",
"object": "chat.completion",
"model": "mistral-medium-latest",
"usage": {
"prompt_tokens": 24,
"completion_tokens": 27,
"total_tokens": 51,
"prompt_audio_seconds": {}
},
"created": 1759500534,
"choices": [
{
"index": 0,
"message": {
"content": "Arrr, the scallywag Claude Monet be the finest French painter to ever splash colors on a canvas, savvy?",
"tool_calls": null,
"prefix": false,
"role": "assistant"
},
"finish_reason": "stop"
}
]
}