Retour au blog

Où sont vraiment passés les 32 341 $ de la Partie 2

Compagnon de détail financier de la Partie 2 de la trilogie SHORA. Pour les lecteurs curieux de la décomposition ligne par ligne des dépenses AWS qui ont produit le taux de navigation de 9 % sur 10,5 millions de pages produit.

Télécharger le PDF
Traduction IA Cet article a été traduit de l'anglais par IA. Lire l'original en anglais.
Source : requêtes AWS Cost Explorer contre le compte AWS de production de SHORA.
Date de requête : 2026-05-14.
Fenêtre : 2025-08-01 → 2026-05-14 (la durée complète de l'expérience, des sondes d'architecture jusqu'à l'arrêt).

Chiffres clés

MétriqueValeur
Dépense AWS32 341,37 $
Fenêtre calendaireaoût 2025 → mai 2026 (10 mois ; 7 de combustion intense)
Mois de picfévrier 2026 — 20 518,40 $
Jour de pic2026-02-12 — 5 407,37 $ (5 163,47 $ sur Claude Opus 4.6 seul)
Modèle d'inférence principalClaude Opus 4.6 — 15 589,38 $ (48,2 % du total)
Région principaleeu-west-3 (Paris) — 22 538,41 $ (69,7 %)

Le LLM a consommé 65,8 % du budget. Claude Opus 4.6 + Opus 4.5 + Sonnet 4.5 + Haiku 4.5 + 3.5 Haiku + Opus 4 + 3 Sonnet, sur l'ensemble des modèles Claude de Bedrock, totalisent 21 289,92 $ sur les 32 341,37 $. L'argument architectural de la Partie 2 — que le coût d'une couche de mesure par agent LLM est dominé par le modèle de langage lui-même — se reflète directement dans la facture.

1. Courbe de combustion mensuelle

La courbe de dépense a une forme qui explique comment l'expérience est passée de la sonde au pic puis à l'aveu. Février 2026 est le point d'inflexion : il porte 64 % de la dépense totale en un seul mois, après quoi la courbe retombe vers zéro.

MoisDépense AWS
2025-0837,32 $
2025-0925,87 $
2025-10480,54 $
2025-11791,10 $
2025-12584,88 $
2026-014 643,30 $
2026-0220 518,40 $
2026-033 825,63 $
2026-041 418,87 $
2026-0515,46 $
TOTAL32 341,37 $

2. Ventilation par service — fenêtre complète

ServiceCoûtPart
Claude Opus 4.6 (Amazon Bedrock)15 589,38 $48,2 %
Claude Opus 4.5 (Amazon Bedrock)5 220,53 $16,1 %
EC2 — calcul (la flotte parcours + extraction)3 832,46 $11,9 %
Amazon Bedrock (baseline / débit)2 163,34 $6,7 %
EC2 — réseau, EBS, NAT1 985,20 $6,1 %
Amazon DynamoDB1 418,00 $4,4 %
Amazon RDS Postgres (validateur + audit)1 242,14 $3,8 %
Autres modèles Bedrock (Sonnet 4.5, Haiku 4.5, Opus 4, etc.)479,91 $1,5 %
Amazon S3, VPC, WAF, KMS, CloudWatch, ECR, Route 53, Secrets410,41 $1,3 %
TOTAL32 341,37 $100,0 %

Le titre « deux tiers sur le LLM »

CoucheCoûtPart
Inférence Claude (tous modèles)21 289,92 $65,8 %
Orchestration Bedrock (baseline / débit)2 163,34 $6,7 %
Flotte de calcul (EC2 + EC2-Other)5 817,66 $18,0 %
Données + stockage (DDB + RDS + S3)2 826,25 $8,7 %
Réseau, sécurité, observabilité, registre244,20 $0,8 %

3. Ventilation par région

~70 % de la dépense AWS est restée en eu-west-3 (Paris), et nous avons utilisé les points d'accès publics EU de Bedrock Claude. La part us-east-1 était portée par des runs expérimentaux contre des modèles Bedrock disponibles seulement dans les régions US à l'époque (Moonshot Kimi K2.5, etc.).

RégionCoûtPart
eu-west-3 (Paris)22 538,41 $69,7 %
us-east-1 (Virginie du Nord)8 837,93 $27,3 %
us-east-2 (Ohio)906,11 $2,8 %
global (Route 53, KMS, etc.)58,92 $0,2 %

4. Courbe quotidienne de février 2026 — le mois de pic

La forme jour par jour de l'expérience atteignant son plafond. Trois phases visibles :

  • 1–11 fév. — montée en charge. Flotte d'extraction en préchauffage. Opus 4.5 dominant par report de janvier. Le coût quotidien grimpe de 144 $ à 1 258 $.
  • 12 fév. — jour de pic. 5 407,37 $ en 24 heures, dont 5 163,47 $ (95,5 %) sur Claude Opus 4.6 seul. Le jour où Claude Opus 4.6 est sorti à deux fois le prix alors que la flotte de parcours tournait à plein régime : 20 à 40 navigateurs Camoufox concurrents exécutant la boucle extraire-puis-parcourir contre les sites des 1 056 enseignes.
  • 12–20 fév. — plateau de combustion soutenue. 446 $ à 2 478 $ par jour pendant que l'équipe confirmait le taux de navigation de 9 % contre le golden set.
  • 21–28 fév. — arrêt progressif. Sous 300 $/jour dès le 22 fév. La décision de retirer la boucle de l'agent.
JourTotalOpus 4.6Opus 4.5EC2BedrockDDB
2026-02-01144,54 $0,00 $119,92 $5,64 $0,00 $1,19 $
2026-02-02226,12 $0,00 $198,41 $5,64 $0,00 $1,55 $
2026-02-03318,89 $0,00 $290,17 $5,64 $0,00 $2,73 $
2026-02-04293,60 $0,00 $265,08 $5,62 $0,00 $2,73 $
2026-02-05195,07 $4,23 $163,45 $5,64 $0,00 $1,07 $
2026-02-06295,67 $97,54 $141,56 $27,93 $0,00 $1,24 $
2026-02-07408,68 $206,63 $129,06 $44,43 $0,00 $0,94 $
2026-02-08284,53 $181,24 $28,37 $44,43 $0,00 $4,10 $
2026-02-09175,37 $58,64 $22,58 $61,39 $0,00 $4,48 $
2026-02-101 258,04 $1 020,67 $112,56 $82,70 $0,00 $8,33 $
2026-02-111 258,13 $1 089,73 $26,23 $82,52 $25,73 $2,77 $
2026-02-125 407,37 $5 163,47 $9,52 $83,45 $116,00 $4,05 $
2026-02-13446,76 $166,01 $20,82 $84,35 $140,25 $2,58 $
2026-02-14525,93 $225,07 $10,17 $84,35 $117,69 $46,23 $
2026-02-151 019,83 $595,05 $20,03 $84,35 $167,94 $115,06 $
2026-02-162 084,72 $1 569,84 $113,47 $84,35 $128,81 $152,74 $
2026-02-172 478,44 $2 013,50 $47,17 $84,35 $161,35 $135,25 $
2026-02-181 076,66 $596,75 $5,05 $84,35 $190,77 $166,79 $
2026-02-19693,41 $217,56 $0,44 $84,35 $191,42 $166,53 $
2026-02-20540,92 $209,77 $3,56 $57,64 $128,05 $109,39 $
2026-02-21410,98 $260,55 $5,11 $20,30 $77,13 $16,96 $
2026-02-22200,59 $112,55 $0,00 $6,78 $48,55 $2,21 $
2026-02-23104,22 $36,99 $0,00 $6,78 $27,81 $2,21 $
2026-02-24128,53 $89,18 $0,00 $6,78 $0,00 $2,21 $
2026-02-2581,40 $42,03 $0,00 $6,78 $0,00 $2,21 $
2026-02-2683,73 $44,33 $0,00 $6,77 $0,00 $2,21 $
2026-02-27266,93 $210,00 $0,00 $6,73 $16,93 $2,51 $
2026-02-28109,37 $49,64 $0,00 $6,78 $19,97 $2,21 $

5. Économie des tokens Bedrock

La tranche la plus instructive pour un lecteur technique : comment la facture Bedrock se décompose en tokens d'entrée vs sortie vs écriture-cache vs lecture-cache. La forme confirme que la stratégie de mise en cache de prompts de l'agent fonctionnait — 52,7 % de la dépense Bedrock totale portait sur les écritures + lectures de cache, ce qui signifie que l'orchestrateur réutilisait correctement le contexte à travers les itérations de la boucle extraire-puis-parcourir plutôt que de le re-payer à chaque appel.

Les tokens de sortie ne représentaient que 12,1 % de la dépense Bedrock. Le moteur de coût était la lecture des pages (tokens d'entrée + cache), pas l'écriture des réponses. C'est la signature de coût d'un extracteur lourd en vision et en contexte, pas d'un agent bavard. L'optimisation intuitive (« réduire la verbosité de sortie ») aurait déplacé la facture de quelques pourcents au plus. Le coût structurel était le volume de contexte que le modèle devait ingérer pour répondre tout court.

Catégorie de tokensCoûtPart de Bedrock
Tokens d'entrée (non cachés, toutes régions/modèles)8 247,84 $35,2 %
Tokens d'écriture-cache (toutes variantes)7 326,65 $31,2 %
Tokens de lecture-cache (toutes variantes)5 048,80 $21,5 %
Tokens de sortie (toutes régions/modèles)2 829,89 $12,1 %

6. Économie unitaire

MétriqueValeur
Dépense AWS totale / pages produit instrumentées32 341 $ / 10,5 M ≈ 0,0031 $ par page produit étudiée
Dépense AWS totale / parcours d'achat tentés32 341 $ / 10,5 M ≈ 0,0031 $ par parcours tenté (un parcours par produit)
Dépense AWS totale / parcours navigués avec succès32 341 $ / (10,5 M × 9 %) ≈ 0,034 $ par parcours navigué avec succès
Inférence Claude Opus 4.6 / page produit15 589 $ / 10,5 M ≈ 0,00149 $ par page produit

Le tueur économique, c'est le taux de navigation de 9 %. Le coût par tentative de 0,0031 $ est compétitif en surface, mais le coût par parcours réussi (0,034 $) est ce que le comptable de l'acheteur compare aux alternatives. À 80 % de taux de navigation (la barre que SHORA s'était fixée au départ), le coût par parcours réussi aurait été de 0,0039 $ — compétitif avec le BPO et d'un ordre de grandeur sous la tarification entreprise des acteurs établis dans des catégories adjacentes. À 9 %, le coût par parcours réussi est de 0,034 $, soit un ordre de grandeur pire que la barre.

7. Ce que cette preuve soutient — et ne soutient pas

Soutient

  • La facture LLM est la facture. 20 810 $ sur l'ensemble des modèles Claude (Opus 4.6 + Opus 4.5 + Sonnet 4.5 + Haiku 4.5 + 3.5 Haiku + Opus 4 + 3 Sonnet) = 64,4 % de la dépense AWS. L'argument architectural de la Partie 2 — qu'une couche de mesure par agent LLM est dominée par le coût du modèle de langage lui-même — se reflète directement dans la ventilation.
  • La couche d'infrastructure était de niveau production. ~70 % de la dépense AWS est restée en région EU pour la conformité de résidence des données, la mise en cache de prompts fonctionnant comme prévu (52,7 % de la dépense Bedrock en lectures + écritures de cache), les flottes d'orchestrateur de parcours et d'extraction ont tourné de façon fiable pendant sept mois sans incident opérationnel majeur.
  • La décision de pivot est datée. Jour de pic le 12 fév., descente le 22 fév. Aucun révisionnisme.

Ne soutient pas

  • L'affirmation que l'agent LLM a échoué à cause du choix de modèle. Plusieurs modèles Claude ont été essayés ; les plus petits (Sonnet 4.5, Haiku 4.5, 3.5 Haiku) ont contribué 392,55 $ au total et n'ont pas franchi la barre non plus.
  • L'affirmation que l'agent LLM a échoué par budget insuffisant. Le jour de pic a dépensé 5 407 $ — à ce rythme, scaler 10× aurait coûté ~320 K$ et le plafond structurel serait resté visible au même 9 %.
  • L'affirmation que l'agent LLM a échoué à cause des défenses anti-bot. Le taux de contournement de Camoufox était de ~92 %. Les 91 % d'échec de navigation sont de couche applicative, comme documenté dans le compagnon technique et dans la Partie 2 §« Pourquoi l'architecture a buté sur un plafond ».

Partie 2 de la trilogie SHORA : 32 341 $ de dépenses AWS, 10,5 millions de pages produit, 9 % de fiabilité. Compagnon technique : compagnon technique de la Partie 2.