---
title: "Groq lève 650 millions de dollars pour devenir un cloud d'inférence IA après l'accord Nvidia"
slug: groq-leve-650-millions-de-dollars-pour-devenir-un-cloud-dinference-ia-apres-laccord-nvidia
category: fintech
description: "Groq lève 650 millions de dollars et pivote vers l'inférence dans le cloud, six mois après l'accord de licence de 20 milliards conclu avec Nvidia."
keywords: [groq levee de fonds, inference intelligence artificielle, accord nvidia groq, cloud ia, cerebras introduction bourse, centres de donnees ia, puces ia, marche inference 2026]
tags: [groq, intelligence-artificielle, inference-ia, nvidia, centres-de-donnees, levee-de-fonds, cerebras, semi-conducteurs, cloud, capital-risque]
canonical: "https://www.france-epargne.fr/news/groq-leve-650-millions-de-dollars-pour-devenir-un-cloud-dinference-ia-apres-laccord-nvidia"
author: "Emmanuel d'Ibelin"
publishedAt: "2026-06-22T23:07:46.843Z"
updatedAt: "2026-06-22T23:07:46.857Z"
readingTimeMinutes: 5
---
# Groq lève 650 millions de dollars pour devenir un cloud d'inférence IA après l'accord Nvidia

> Six mois après l'accord de licence de 20 milliards de dollars conclu avec Nvidia, Groq a confirmé le 22 juin une levée de 650 millions de dollars. La société pivote vers l'inférence dans le cloud, un marché que ses dirigeants jugent bien plus vaste que l'entraînement des modèles.

Groq a confirmé lundi 22 juin une levée de **650 millions de dollars**, destinée à financer sa mutation en fournisseur de calcul pour l'**inférence**, la phase où les modèles d'intelligence artificielle produisent leurs réponses. Cette opération referme un épisode singulier ouvert fin 2025, lorsque Nvidia avait absorbé la technologie et les dirigeants de la jeune pousse sans procéder à un rachat classique.

Le tour de table a été mené par les fonds **Disruptive** et **Infinitum**, déjà présents au capital, avec la participation d'actionnaires existants. La société interne baptise cette nouvelle étape Groq 2.0 et s'est dotée d'une équipe de direction remaniée: Adam Winter en qualité de directeur général, Matt Eng au poste de directeur financier et Alan Rice comme directeur des opérations. Sinclair Schuller (technologie) et Rakesh Malhotra (produit) rejoindront l'entreprise en juillet, sous la présidence d'Alex Davis.

## De l'accord Nvidia au virage cloud

En décembre 2025, Nvidia avait signé une licence non exclusive sur la propriété intellectuelle de Groq pour environ **20 milliards de dollars**, sa plus grosse opération à ce jour. L'accord portait sur le LPU (language processing unit), une architecture conçue pour traiter l'inférence en contournant le goulot d'étranglement de la bande passante mémoire qui limite les cartes graphiques. Groq affirme que cette puce consomme jusqu'à dix fois moins d'énergie qu'un processeur graphique pour ce type de charge.

Le prix représentait 2,9 fois la valorisation de 6,9 milliards de dollars obtenue par Groq lors de son tour de série E, bouclé trois mois plus tôt. Le fondateur Jonathan Ross, considéré comme le créateur du TPU de Google, ainsi que le président Sunny Madra et une partie des équipes ont rejoint Nvidia. Plusieurs analystes ont décrit le montage comme une acquisition déguisée: une opération équivalente sur le plan commercial à un rachat, mais maintenue sous les seuils qui auraient déclenché un examen des autorités de concurrence.

Privée de son fondateur, la structure restante a choisi de ne plus chercher à concevoir des puces en propre, mais à les exploiter. GroqCloud héberge désormais des applications gourmandes en inférence pour des développeurs et des entreprises.

## Les chiffres avancés par la société

Groq met en avant une activité déjà installée: **treize centres de données** répartis en Amérique du Nord, en Europe, au Moyen-Orient et en Asie-Pacifique, plus de cinq millions de développeurs servis et des milliers de milliards de jetons (tokens) traités chaque semaine. L'entreprise vise une capacité de 200 mégawatts à la fin de 2027.

Le pari repose sur une conviction: l'inférence pèsera plus lourd que l'entraînement. La direction estime que la demande de calcul liée à l'inférence sera quinze à vingt fois supérieure à celle de l'entraînement des modèles, à mesure que les usages se multiplient au quotidien. Lors de la conférence GTC 2026, le patron de Nvidia Jensen Huang avait lui-même avancé que le décodage de type LPU pourrait représenter le quart du calcul d'une grappe de serveurs dédiée à l'IA.

> «Groq dispose de la combinaison rare entre une technologie différenciée, une expertise opérationnelle et une échelle mondiale nécessaires pour saisir cette opportunité», a déclaré John Yetimoglu, du fonds Infinitum.

## Un marché convoité et encombré

La concurrence sur l'inférence spécialisée s'intensifie. **Cerebras** a réalisé en mai 2026 la plus grosse introduction en bourse technologique de l'année, levant 5,5 milliards de dollars. **SambaNova**, soutenu par Intel, met en avant des puces de nouvelle génération refroidies par air et revendique entre 600 et 700 jetons par seconde, contre environ 250 pour un processeur graphique. Tous ces acteurs affrontent aussi les hyperscalers, à savoir Amazon Web Services, Google Cloud et Microsoft Azure, qui investissent massivement dans leurs propres infrastructures.

Le modèle économique soulève des interrogations. Construire et alimenter des centres de données engloutit du capital, et la rentabilité dépend d'un flux régulier de clients. L'investisseur Joe Hasselmann a comparé la trajectoire de Groq à celle de CoreWeave, dont la dépendance à Nvidia a longtemps nourri les débats sur la solidité de son modèle, soulignant le besoin d'une clientèle diversifiée pour tenir dans la durée.

## Ce que cela révèle pour les investisseurs

L'opération illustre une bascule plus large des marchés privés de l'IA. Après une phase centrée sur la puissance d'entraînement, les capitaux se déplacent vers l'exploitation des modèles, jugée plus proche des revenus récurrents. Le fait que des actionnaires historiques rechargent l'entreprise plutôt que de chercher de nouveaux fonds traduit aussi un marché du financement plus sélectif, où les tours menés par des investisseurs déjà engagés deviennent fréquents.

Pour l'épargnant français, l'exposition reste majoritairement indirecte. Elle passe par les fournisseurs de puces cotés, par les hyperscalers présents dans de nombreux fonds indiciels, ou par des supports thématiques investis dans les infrastructures numériques. La concentration des valorisations autour de quelques noms appelle toutefois à la prudence: la promesse de l'inférence reste à confirmer par des résultats, dans un secteur où les écarts entre acteurs peuvent se creuser rapidement.

## Ce qu'il faut surveiller

Trois points mériteront l'attention dans les prochains trimestres: la capacité de Groq à élargir sa base de clients au-delà des développeurs individuels, le rythme réel de montée en puissance vers l'objectif de 200 mégawatts, et la trajectoire de prix de l'inférence, qui conditionne les marges de l'ensemble du secteur. La consolidation amorcée avec l'accord Nvidia et l'introduction de Cerebras laisse présager d'autres mouvements de rapprochement.