Où sont vraiment passés les 32 341 $ de la Partie 2
Compagnon de détail financier de la Partie 2 de la trilogie SHORA. Pour les lecteurs curieux de la décomposition ligne par ligne des dépenses AWS qui ont produit le taux de navigation de 9 % sur 10,5 millions de pages produit.
Télécharger le PDFChiffres clés
| Métrique | Valeur |
|---|---|
| Dépense AWS | 32 341,37 $ |
| Fenêtre calendaire | août 2025 → mai 2026 (10 mois ; 7 de combustion intense) |
| Mois de pic | février 2026 — 20 518,40 $ |
| Jour de pic | 2026-02-12 — 5 407,37 $ (5 163,47 $ sur Claude Opus 4.6 seul) |
| Modèle d'inférence principal | Claude Opus 4.6 — 15 589,38 $ (48,2 % du total) |
| Région principale | eu-west-3 (Paris) — 22 538,41 $ (69,7 %) |
Le LLM a consommé 65,8 % du budget. Claude Opus 4.6 + Opus 4.5 + Sonnet 4.5 + Haiku 4.5 + 3.5 Haiku + Opus 4 + 3 Sonnet, sur l'ensemble des modèles Claude de Bedrock, totalisent 21 289,92 $ sur les 32 341,37 $. L'argument architectural de la Partie 2 — que le coût d'une couche de mesure par agent LLM est dominé par le modèle de langage lui-même — se reflète directement dans la facture.
1. Courbe de combustion mensuelle
La courbe de dépense a une forme qui explique comment l'expérience est passée de la sonde au pic puis à l'aveu. Février 2026 est le point d'inflexion : il porte 64 % de la dépense totale en un seul mois, après quoi la courbe retombe vers zéro.
| Mois | Dépense AWS |
|---|---|
| 2025-08 | 37,32 $ |
| 2025-09 | 25,87 $ |
| 2025-10 | 480,54 $ |
| 2025-11 | 791,10 $ |
| 2025-12 | 584,88 $ |
| 2026-01 | 4 643,30 $ |
| 2026-02 | 20 518,40 $ |
| 2026-03 | 3 825,63 $ |
| 2026-04 | 1 418,87 $ |
| 2026-05 | 15,46 $ |
| TOTAL | 32 341,37 $ |
2. Ventilation par service — fenêtre complète
| Service | Coût | Part |
|---|---|---|
| Claude Opus 4.6 (Amazon Bedrock) | 15 589,38 $ | 48,2 % |
| Claude Opus 4.5 (Amazon Bedrock) | 5 220,53 $ | 16,1 % |
| EC2 — calcul (la flotte parcours + extraction) | 3 832,46 $ | 11,9 % |
| Amazon Bedrock (baseline / débit) | 2 163,34 $ | 6,7 % |
| EC2 — réseau, EBS, NAT | 1 985,20 $ | 6,1 % |
| Amazon DynamoDB | 1 418,00 $ | 4,4 % |
| Amazon RDS Postgres (validateur + audit) | 1 242,14 $ | 3,8 % |
| Autres modèles Bedrock (Sonnet 4.5, Haiku 4.5, Opus 4, etc.) | 479,91 $ | 1,5 % |
| Amazon S3, VPC, WAF, KMS, CloudWatch, ECR, Route 53, Secrets | 410,41 $ | 1,3 % |
| TOTAL | 32 341,37 $ | 100,0 % |
Le titre « deux tiers sur le LLM »
| Couche | Coût | Part |
|---|---|---|
| Inférence Claude (tous modèles) | 21 289,92 $ | 65,8 % |
| Orchestration Bedrock (baseline / débit) | 2 163,34 $ | 6,7 % |
| Flotte de calcul (EC2 + EC2-Other) | 5 817,66 $ | 18,0 % |
| Données + stockage (DDB + RDS + S3) | 2 826,25 $ | 8,7 % |
| Réseau, sécurité, observabilité, registre | 244,20 $ | 0,8 % |
3. Ventilation par région
~70 % de la dépense AWS est restée en eu-west-3 (Paris), et nous avons utilisé les points d'accès publics EU de Bedrock Claude. La part us-east-1 était portée par des runs expérimentaux contre des modèles Bedrock disponibles seulement dans les régions US à l'époque (Moonshot Kimi K2.5, etc.).
| Région | Coût | Part |
|---|---|---|
| eu-west-3 (Paris) | 22 538,41 $ | 69,7 % |
| us-east-1 (Virginie du Nord) | 8 837,93 $ | 27,3 % |
| us-east-2 (Ohio) | 906,11 $ | 2,8 % |
| global (Route 53, KMS, etc.) | 58,92 $ | 0,2 % |
4. Courbe quotidienne de février 2026 — le mois de pic
La forme jour par jour de l'expérience atteignant son plafond. Trois phases visibles :
- 1–11 fév. — montée en charge. Flotte d'extraction en préchauffage. Opus 4.5 dominant par report de janvier. Le coût quotidien grimpe de 144 $ à 1 258 $.
- 12 fév. — jour de pic. 5 407,37 $ en 24 heures, dont 5 163,47 $ (95,5 %) sur Claude Opus 4.6 seul. Le jour où Claude Opus 4.6 est sorti à deux fois le prix alors que la flotte de parcours tournait à plein régime : 20 à 40 navigateurs Camoufox concurrents exécutant la boucle extraire-puis-parcourir contre les sites des 1 056 enseignes.
- 12–20 fév. — plateau de combustion soutenue. 446 $ à 2 478 $ par jour pendant que l'équipe confirmait le taux de navigation de 9 % contre le golden set.
- 21–28 fév. — arrêt progressif. Sous 300 $/jour dès le 22 fév. La décision de retirer la boucle de l'agent.
| Jour | Total | Opus 4.6 | Opus 4.5 | EC2 | Bedrock | DDB |
|---|---|---|---|---|---|---|
| 2026-02-01 | 144,54 $ | 0,00 $ | 119,92 $ | 5,64 $ | 0,00 $ | 1,19 $ |
| 2026-02-02 | 226,12 $ | 0,00 $ | 198,41 $ | 5,64 $ | 0,00 $ | 1,55 $ |
| 2026-02-03 | 318,89 $ | 0,00 $ | 290,17 $ | 5,64 $ | 0,00 $ | 2,73 $ |
| 2026-02-04 | 293,60 $ | 0,00 $ | 265,08 $ | 5,62 $ | 0,00 $ | 2,73 $ |
| 2026-02-05 | 195,07 $ | 4,23 $ | 163,45 $ | 5,64 $ | 0,00 $ | 1,07 $ |
| 2026-02-06 | 295,67 $ | 97,54 $ | 141,56 $ | 27,93 $ | 0,00 $ | 1,24 $ |
| 2026-02-07 | 408,68 $ | 206,63 $ | 129,06 $ | 44,43 $ | 0,00 $ | 0,94 $ |
| 2026-02-08 | 284,53 $ | 181,24 $ | 28,37 $ | 44,43 $ | 0,00 $ | 4,10 $ |
| 2026-02-09 | 175,37 $ | 58,64 $ | 22,58 $ | 61,39 $ | 0,00 $ | 4,48 $ |
| 2026-02-10 | 1 258,04 $ | 1 020,67 $ | 112,56 $ | 82,70 $ | 0,00 $ | 8,33 $ |
| 2026-02-11 | 1 258,13 $ | 1 089,73 $ | 26,23 $ | 82,52 $ | 25,73 $ | 2,77 $ |
| 2026-02-12 | 5 407,37 $ | 5 163,47 $ | 9,52 $ | 83,45 $ | 116,00 $ | 4,05 $ |
| 2026-02-13 | 446,76 $ | 166,01 $ | 20,82 $ | 84,35 $ | 140,25 $ | 2,58 $ |
| 2026-02-14 | 525,93 $ | 225,07 $ | 10,17 $ | 84,35 $ | 117,69 $ | 46,23 $ |
| 2026-02-15 | 1 019,83 $ | 595,05 $ | 20,03 $ | 84,35 $ | 167,94 $ | 115,06 $ |
| 2026-02-16 | 2 084,72 $ | 1 569,84 $ | 113,47 $ | 84,35 $ | 128,81 $ | 152,74 $ |
| 2026-02-17 | 2 478,44 $ | 2 013,50 $ | 47,17 $ | 84,35 $ | 161,35 $ | 135,25 $ |
| 2026-02-18 | 1 076,66 $ | 596,75 $ | 5,05 $ | 84,35 $ | 190,77 $ | 166,79 $ |
| 2026-02-19 | 693,41 $ | 217,56 $ | 0,44 $ | 84,35 $ | 191,42 $ | 166,53 $ |
| 2026-02-20 | 540,92 $ | 209,77 $ | 3,56 $ | 57,64 $ | 128,05 $ | 109,39 $ |
| 2026-02-21 | 410,98 $ | 260,55 $ | 5,11 $ | 20,30 $ | 77,13 $ | 16,96 $ |
| 2026-02-22 | 200,59 $ | 112,55 $ | 0,00 $ | 6,78 $ | 48,55 $ | 2,21 $ |
| 2026-02-23 | 104,22 $ | 36,99 $ | 0,00 $ | 6,78 $ | 27,81 $ | 2,21 $ |
| 2026-02-24 | 128,53 $ | 89,18 $ | 0,00 $ | 6,78 $ | 0,00 $ | 2,21 $ |
| 2026-02-25 | 81,40 $ | 42,03 $ | 0,00 $ | 6,78 $ | 0,00 $ | 2,21 $ |
| 2026-02-26 | 83,73 $ | 44,33 $ | 0,00 $ | 6,77 $ | 0,00 $ | 2,21 $ |
| 2026-02-27 | 266,93 $ | 210,00 $ | 0,00 $ | 6,73 $ | 16,93 $ | 2,51 $ |
| 2026-02-28 | 109,37 $ | 49,64 $ | 0,00 $ | 6,78 $ | 19,97 $ | 2,21 $ |
5. Économie des tokens Bedrock
La tranche la plus instructive pour un lecteur technique : comment la facture Bedrock se décompose en tokens d'entrée vs sortie vs écriture-cache vs lecture-cache. La forme confirme que la stratégie de mise en cache de prompts de l'agent fonctionnait — 52,7 % de la dépense Bedrock totale portait sur les écritures + lectures de cache, ce qui signifie que l'orchestrateur réutilisait correctement le contexte à travers les itérations de la boucle extraire-puis-parcourir plutôt que de le re-payer à chaque appel.
Les tokens de sortie ne représentaient que 12,1 % de la dépense Bedrock. Le moteur de coût était la lecture des pages (tokens d'entrée + cache), pas l'écriture des réponses. C'est la signature de coût d'un extracteur lourd en vision et en contexte, pas d'un agent bavard. L'optimisation intuitive (« réduire la verbosité de sortie ») aurait déplacé la facture de quelques pourcents au plus. Le coût structurel était le volume de contexte que le modèle devait ingérer pour répondre tout court.
| Catégorie de tokens | Coût | Part de Bedrock |
|---|---|---|
| Tokens d'entrée (non cachés, toutes régions/modèles) | 8 247,84 $ | 35,2 % |
| Tokens d'écriture-cache (toutes variantes) | 7 326,65 $ | 31,2 % |
| Tokens de lecture-cache (toutes variantes) | 5 048,80 $ | 21,5 % |
| Tokens de sortie (toutes régions/modèles) | 2 829,89 $ | 12,1 % |
6. Économie unitaire
| Métrique | Valeur |
|---|---|
| Dépense AWS totale / pages produit instrumentées | 32 341 $ / 10,5 M ≈ 0,0031 $ par page produit étudiée |
| Dépense AWS totale / parcours d'achat tentés | 32 341 $ / 10,5 M ≈ 0,0031 $ par parcours tenté (un parcours par produit) |
| Dépense AWS totale / parcours navigués avec succès | 32 341 $ / (10,5 M × 9 %) ≈ 0,034 $ par parcours navigué avec succès |
| Inférence Claude Opus 4.6 / page produit | 15 589 $ / 10,5 M ≈ 0,00149 $ par page produit |
Le tueur économique, c'est le taux de navigation de 9 %. Le coût par tentative de 0,0031 $ est compétitif en surface, mais le coût par parcours réussi (0,034 $) est ce que le comptable de l'acheteur compare aux alternatives. À 80 % de taux de navigation (la barre que SHORA s'était fixée au départ), le coût par parcours réussi aurait été de 0,0039 $ — compétitif avec le BPO et d'un ordre de grandeur sous la tarification entreprise des acteurs établis dans des catégories adjacentes. À 9 %, le coût par parcours réussi est de 0,034 $, soit un ordre de grandeur pire que la barre.
7. Ce que cette preuve soutient — et ne soutient pas
Soutient
- La facture LLM est la facture. 20 810 $ sur l'ensemble des modèles Claude (Opus 4.6 + Opus 4.5 + Sonnet 4.5 + Haiku 4.5 + 3.5 Haiku + Opus 4 + 3 Sonnet) = 64,4 % de la dépense AWS. L'argument architectural de la Partie 2 — qu'une couche de mesure par agent LLM est dominée par le coût du modèle de langage lui-même — se reflète directement dans la ventilation.
- La couche d'infrastructure était de niveau production. ~70 % de la dépense AWS est restée en région EU pour la conformité de résidence des données, la mise en cache de prompts fonctionnant comme prévu (52,7 % de la dépense Bedrock en lectures + écritures de cache), les flottes d'orchestrateur de parcours et d'extraction ont tourné de façon fiable pendant sept mois sans incident opérationnel majeur.
- La décision de pivot est datée. Jour de pic le 12 fév., descente le 22 fév. Aucun révisionnisme.
Ne soutient pas
- L'affirmation que l'agent LLM a échoué à cause du choix de modèle. Plusieurs modèles Claude ont été essayés ; les plus petits (Sonnet 4.5, Haiku 4.5, 3.5 Haiku) ont contribué 392,55 $ au total et n'ont pas franchi la barre non plus.
- L'affirmation que l'agent LLM a échoué par budget insuffisant. Le jour de pic a dépensé 5 407 $ — à ce rythme, scaler 10× aurait coûté ~320 K$ et le plafond structurel serait resté visible au même 9 %.
- L'affirmation que l'agent LLM a échoué à cause des défenses anti-bot. Le taux de contournement de Camoufox était de ~92 %. Les 91 % d'échec de navigation sont de couche applicative, comme documenté dans le compagnon technique et dans la Partie 2 §« Pourquoi l'architecture a buté sur un plafond ».
Partie 2 de la trilogie SHORA : 32 341 $ de dépenses AWS, 10,5 millions de pages produit, 9 % de fiabilité. Compagnon technique : compagnon technique de la Partie 2.