Pile, je gagne, face, je gagne : pourquoi les géants américains du cloud tirent profit des stratégies d’IA de DeepSeek et d’autres entreprises chinoises

La concurrence sur le marché mondial de l’IA favorise les entreprises américaines qui dominent le cloud.

Par Cecilia Rikap.
Original : Heads I Win, Tails I Win: Why US Cloud Giants Benefit from DeepSeek and Other Chinese Companies’ AI Strategies, 2025.06.26

Résumé

  • Au lieu de devenir des leaders mondiaux, l’économie politique mondiale et locale a conduit les grandes entreprises technologiques chinoises et les start-ups spécialisées dans l’IA en Chine à rester des suiveurs rapides — utilisant des produits ou des services peu après leur introduction — dans le domaine de l’IA, tirant profit des prouesses des États-Unis en matière d’IA.
  • Le jeu qui en résulte, dans lequel la Chine suit de près les États-Unis sans toutefois remettre en cause leur suprématie, permet aux géants américains de la technologie de s’opposer aux mesures antitrust et de plaider en faveur d’un soutien de l’État pour stimuler l’innovation dans la chaîne de valeur de l’IA, en présentant la possibilité que les entreprises chinoises prennent l’avantage comme une menace nationale.
  • Parmi les géants américains de la technologie, Amazon, Microsoft et Google sont particulièrement favorisés, car la concurrence chinoise pour des modèles tels que DeepSeek R1 pousse OpenAI et d’autres start-ups occidentales spécialisées dans l’IA à accélérer le développement de modèles d’IA, ce qui augmente la consommation des services informatiques proposés par les clouds de ces géants. Cela limite également les ressources dont disposent les start-ups spécialisées dans l’IA pour surmonter leur dépendance au cloud.
  • Comme même DeepSeek vend sur leurs clouds, l’intensification de la concurrence pour les modèles d’IA et l’accélération du développement et de l’adoption de l’IA qui en résulte renforcent le contrôle d’Amazon, de Microsoft et de Google sur l’ensemble de la chaîne de valeur de l’IA via le cloud.
  • Ce scénario détourne les initiatives du gouvernement chinois visant à faire de la Chine le leader mondial de l’IA d’ici 2030. Il entrave également l’efficacité de la politique antitrust et d’innovation des États-Unis en renforçant un modèle d’innovation dominé par Amazon, Microsoft et Google, qui occupent une position centrale, entourés d’une périphérie turbulente d’entreprises innovantes dans des segments spécifiques de la chaîne de valeur de l’IA, alors que seuls ces trois géants peuvent superviser et produire tous les segments de cette chaîne.

Introduction

La valeur boursière de Nvidia a chuté de 600 milliards de dollars le 26 janvier 2025. Cela représente deux fois le PIB du Portugal et presque celui de l’Argentine. L’activité du leader mondial de la conception de puces pour l’IA a été ébranlée parce que le week-end précédent, une application d’IA générative concurrente de ChatGPT, développée par une société de recherche chinoise jusqu’alors inconnue sous le nom de DeepSeek, était devenue l’application gratuite la plus téléchargée aux États-Unis. La capitalisation boursière de Nvidia n’a pas été la seule à s’effondrer ce lundi-là en raison de la percée chinoise ; Amazon, Alphabet (la société mère de Google), Microsoft et Meta ont subi des pertes importantes, bien que moins spectaculaires, entraînant une chute totale d’un billion de dollars en une seule journée.

Il s’agissait d’une réaction excessive du marché, partiellement corrigée au cours des jours suivants, qui ne s’explique pas par la supériorité du modèle R1 de DeepSeek par rapport aux modèles existants. En réalité, ce modèle ne diffère pas significativement des autres modèles d’IA générative de pointe, en particulier ChatGPT d’OpenAI. Mais le simple fait qu’un modèle chinois soit considéré comme aussi performant que le précurseur et les autres modèles américains est uneévolution majeure. C’est également une raison géopolitique suffisamment forte pour ébranler la valeur boursière des plus grandes entreprises mondiales en termes de capitalisation boursière, en particulier celle de Nvidia.

DeepSeek a utilisé une méthode d’entraînement qui extrait l’apprentissage d’autres modèles, réduisant ainsi le nombre de cycles d’entraînement et donc la puissance de traitement nécessaire à l’entraînement. Le fait de nécessiter moins de processeurs IA par modèle signifie que Nvidia vendra potentiellement moins de puces IA.

L’épisode DeepSeek peut être interprété de plusieurs façons. La première est que la Chine a rattrapé les États-Unis, confirmant ainsi sa place de deuxième superpuissance technologique. En effet, la Chine défie le leadership américain dans le domaine des technologies numériques. Selon un rapport de Feifan Research, la moitié des 1 500 entreprises actives dans le domaine de l’IA dans le monde étaient basées en Chine en juin 2024.[1] Et, bien que les brevets ne soient pas le principal mécanisme d’appropriation des connaissances dans ce secteur, les grandes entreprises technologiques chinoises sont en tête en termes de nombre de brevets dans le domaine de l’IA générative.[2]

Une autre interprétation est qu’il n’y a pas de menace sérieuse pour le leadership américain, car le modèle n’est pas aussi performant que ChatGPT. Les États-Unis dominent le marché mondial de l’IA générative avec une part de 40 % et sont également le leader incontesté en termes de nombre de modèles d’IA de pointe, y compris les plus grands en nombre de paramètres.[3] Cette position dominante ne devrait pas être remise en cause, car une entreprise chinoise a lancé un modèle équivalent aux meilleurs produits américains, deux ans après que les entreprises américaines aient été les premières à commercialiser ce type de produit.

Une troisième interprétation, celle que nous retenons ici, est que les grandes entreprises technologiques chinoises et les start-ups spécialisées dans l’IA ne cherchent pas à dépasser les États-Unis. Plutôt que de viser le leadership mondial, elles semblent privilégier une imitation rapide, reproduisant rapidement les innovations américaines en les adaptant, sans nécessairement chercher à les surpasser. Si cette interprétation est correcte, le discours promu par les grandes entreprises technologiques américaines, selon lequel le rattrapage de la Chine dans le domaine des technologies numériques constitue la véritable menace pour l’économie américaine et non leur propre concentration de pouvoir – un thème récurrent depuis au moins l’audition des grandes entreprises technologiques américaines devant le Congrès en 2020 – s’avérerait exagéré. Quelle que soit la proximité apparente des rivaux chinois, le contexte politique mondial et national et l’organisation sectorielle les incitent à préférer la copie plutôt que de prendre les risques liés à l’exploration de nouvelles frontières.

De plus, selon ce point de vue, l’émergence d’entreprises telles que DeepSeek, qui concurrencent les start-ups occidentales spécialisées dans l’IA, favorise en réalité Amazon, Microsoft et Google. Comme je l’ai déjà montré pour Common Wealth 1Dynamics of Corporate Governance Beyond Ownership in AI, ces trois géants américains contrôlent la chaîne de valeur de l’IA depuis leurs clouds.[4] Leur pouvoir ne s’exerce pas seulement sur ceux qui proposent des applications basées sur l’IA fonctionnant sur leurs serveurs, mais aussi sur ceux qui conçoivent et développent des modèles de pointe, tels que Open AI, Mistral et Anthropic. Même si ces entreprises n’ont jamais été officiellement rachetées, comme Google l’a fait avec DeepMind, elles dépendent toutes des géants du cloud, à la fois en tant qu’investisseurs et fournisseurs d’infrastructures et d’autres technologies.

Pour Amazon, Microsoft et Google, les modèles de DeepSeek sont donc une bonne nouvelle pour au moins trois raisons interdépendantes. Premièrement, en validant l’hypothèse selon laquelle la Chine se rapproche des États-Unis, ils contribuent à convaincre les régulateurs qu’ils ont besoin des Big Tech américaines pour lutter contre la Chine et qu’ils ne doivent donc pas tenter de limiter leur pouvoir.

Deuxièmement, DeepSeek signifie une concurrence accrue entre les entreprises qui développent principalement des modèles d’IA. Cela pousse les start-ups occidentales spécialisées dans l’IA à développer des modèles encore plus avancés, ce qui leur permet de rester concentrées sur ce segment de la chaîne de valeur de l’IA sans tenter de surmonter leur dépendance vis-à-vis des clouds des Big Tech pour la formation, puis l’exécution et la vente de leurs modèles sous forme de services informatiques.

Troisièmement, la sortie de DeepSeek élargit le marché de l’IA en favorisant l’adoption de l’IA par les particuliers et les entreprises et en poussant les start-ups occidentales spécialisées dans l’IA à accélérer leur rythme. Cela favorise encore davantage les géants du cloud, car plus d’IA signifie plus de consommation de leurs centres de données pour le stockage des données et la puissance de traitement nécessaire au développement et à l’exécution de nouveaux modèles, encore plus volumineux. Pourtant, leurs clouds sont bien plus qu’une infrastructure proposée sous forme de service loué. Les start-ups, les développeurs d’applications et les entreprises des secteurs les plus divers louent des modèles d’IA, des logiciels, des plateformes et d’autres technologies numériques en tant que service sur les clouds d’Amazon, de Microsoft et de Google. Même DeepSeek propose ses modèles sous forme de service loué sur ces supermarchés de technologies numériques, en versant une redevance aux géants du cloud chaque fois que quelqu’un loue ses modèles. Ainsi, même si un jour DeepSeek ou une autre entreprise chinoise développait un modèle vraiment plus performant que ses concurrents occidentaux, elle dépendrait probablement des clouds d’Amazon, de Microsoft et de Google pour le commercialiser. Dans tous les cas, ces trois leaders américains sont toujours gagnants.

Dans la suite de cet article, je présente les raisons qui soutiennent l’idée que les grandes entreprises technologiques chinoises ont préféré l’imitation rapide dans le domaine de l’IA et j’explore comment cela a affecté les start-ups chinoises spécialisées dans l’IA telles que DeepSeek. Je procède ensuite à une évaluation plus détaillée de la manière dont le succès des entreprises chinoises spécialisées dans l’IA, grandes et petites, favorise en fin de compte Amazon, Microsoft et Google.

Pourquoi les grandes entreprises technologiques chinoises préfèrent l’imitation

Dans la littérature économique, l’une des raisons qui expliquent la préférence pour l’imitation est l’insuffisance des capacités.[5] Si les entreprises chinoises et le système d’innovation chinois restent à la traîne, l’imitation peut constituer une alternative dans le processus de développement des capacités nécessaires pour rattraper leur retard. Un moyen d’identifier ce manque potentiel d’expertise ou de capacités consiste à examiner les articles scientifiques sur l’IA publiés avant la sortie de ChatGPT, qui a marqué l’ouverture du marché des modèles d’IA générative.

Afin de déterminer où se situaient les organisations chinoises par rapport aux modèles d’IA générative avant la sortie de ChatGPT, j’ai analysé les 37 058 articles scientifiques présentés lors des 14 principales conférences sur l’IA entre 2018 et 2020.[6] L’année de départ a été choisie car l’article fondateur de Google DeepMind et OpenAI intitulé « Deep Reinforcement Learning from Human Preferences » a été publié en 2017. Il s’agit de l’un des premiers exemples de systèmes d’apprentissage par renforcement interagissant avec des environnements réels. Il s’agit d’un élément fondamental des modèles d’IA générative actuels, car ceux-ci sont en partie entraînés à l’aide de l’apprentissage par renforcement. Contrairement à l’apprentissage supervisé, dans lequel le modèle est entraîné à l’aide d’ensembles de données préclassifiés, dans l’apprentissage par renforcement, le modèle répond à des questions et reçoit une réponse binaire indiquant si la réponse était bonne ou mauvaise. Cette réponse est ensuite traitée par le modèle afin d’améliorer les résultats futurs.

Les modèles d’IA générative combinent ces deux méthodes d’entraînement. En examinant les coauteurs les plus fréquents des recherches présentées lors des principales conférences sur l’IA entre 2018 et 2020, j’ai constaté que les grandes entreprises technologiques américaines, en particulier Microsoft et Google, suivies par Meta et Amazon, sont les acteurs les plus importants du réseau de recherche de pointe en matière d’IA.

Dans l’analyse de réseau, elles occupent une position définie comme étant les principaux ponts entre les différentes parties du réseau, ce qui signifie qu’elles ont la plus grande capacité d’influencer l’agenda de recherche de l’ensemble du réseau. Les grandes entreprises technologiques chinoises s’intègrent également dans le réseau, mais principalement en co-rédigeant avec d’autres organisations chinoises et Microsoft, qui a une forte présence dans le domaine de la recherche en Chine depuis des décennies.[7]

Alors qu’Amazon, Microsoft et Google présentaient déjà fréquemment leurs recherches sur l’IA générative lors de ces événements, les entreprises chinoises restaient concentrées sur l’IA préexistante dans la famille des modèles d’apprentissage profond appliqués à leurs principaux domaines d’activité. Néanmoins, en y regardant de plus près, il est possible d’identifier que certaines grandes entreprises technologiques chinoises travaillaient sur les techniques nécessaires au développement de modèles d’IA générative.

La méthodologie de réseau utilisée pour cette analyse étant une mesure relative qui relie les organisations aux thèmes qui les représentent le mieux par rapport à tous les liens possibles entre les organisations et les thèmes, un examen plus approfondi de l’échantillon de présentations chinoises peut fournir des informations sur les acteurs qui ont mené la recherche sur l’IA générative en Chine.

Parmi les 8 614 présentations de l’échantillon initial qui comptaient au moins un coauteur basé en Chine, j’ai extrait les 1 000 termes les plus fréquents dans leurs titres, résumés et mots-clés, qui comprenaient des termes liés à l’IA générative. Cela signifie qu’il y a eu des recherches sur ce type de modèle en Chine entre 2018 et 2020, même si elles n’étaient pas aussi importantes que celles d’Amazon, Microsoft et Google. Il est particulièrement intéressant de noter que dans cet échantillon plus restreint, les termes principalement liés à l’IA générative ne concernaient pas seulement les principales universités chinoises, mais aussi Alibaba, Tencent, Huawei et ByteDance (voir tableau 1, les termes liés à l’IA générative sont en gras). En revanche, les recherches de Baidu sont restées axées sur des sujets qui ne sont pas directement liés à l’IA générative. Cela ne signifie pas que Baidu n’a pas mené de recherches sur l’IA générative, mais que d’autres organisations chinoises ont travaillé plus activement sur ces sujets (voir tableau 1).

Alibaba est la grande entreprise technologique chinoise associée à davantage de thèmes liés à l’IA générative, en particulier les modèles linguistiques. Les publications de Huawei portaient sur « l’apprentissage par renforcement ». Tencent et ByteDance présentaient des recherches sur « l’extraction de relations », un terme qui désigne la prédiction et l’étiquetage des relations sémantiques entre des entités dans l’analyse de texte. Seules les présentations de Baidu ne traitaient pas de recherches sur des thèmes liés à l’IA générative.

Si l’on examine conjointement les analyses mondiales et chinoises des présentations scientifiques, on peut affirmer qu’au moins certains géants chinois s’intéressaient à l’IA de pointe, mais pas autant que les grandes entreprises technologiques américaines et d’autres organisations du réseau mondial. En effet, en termes relatifs, ils ont moins souvent présenté des sujets liés à l’IA de pointe que d’autres acteurs du réseau mondial ; les entreprises chinoises n’étaient pas associées à des termes multiples liés à l’IA générative. Cela change lorsque l’échantillon de présentations est réduit au réseau de recherche chinois en IA. Dans l’échantillon basé en Chine, Alibaba et Huawei, suivis de Tencent et Bytedance, figuraient parmi les organisations qui présentaient le plus souvent des sujets liés à l’IA générative.

Ces résultats suggèrent que les dirigeants chinois disposaient de capacités de recherche en IA générative et présentaient des résultats dans ce domaine lors des principales conférences mondiales plusieurs années avant la sortie de ChatGPT. Même s’ils ne présentaient pas autant d’articles que leurs homologues américains, ils travaillaient néanmoins sur le sujet et obtenaient des résultats suffisamment bons pour être présentés lors des conférences les plus importantes au monde sur l’IA. Ce n’est donc pas un manque de capacités technologiques qui les a empêchés de créer en premier une interface comme ChatGPT.

Les grandes entreprises technologiques chinoises ont bénéficié de ce que la littérature économique sur l’innovation décrit comme des fenêtres d’opportunité impulsées par l’État et la demande. La première est générée par les politiques publiques qui protègent et encouragent l’IA en Chine. La seconde s’explique par la taille du marché chinois et la demande en produits d’IA.[8] Étant donné que les grands acteurs chinois disposaient de capacités de pointe en matière d’IA avant la sortie de ChatGPT et qu’ils s’étaient assuré un marché important pour commercialiser ces produits, ils auraient pu lancer des solutions d’IA avant les États-Unis. Pourquoi alors n’ont-ils pas mis au point une interface comme ChatGPT avant OpenAI et pourquoi est-ce DeepSeek, et non les grandes entreprises technologiques chinoises, qui a finalement proposé un modèle ? S’il est impossible d’exclure totalement la malchance, plusieurs raisons permettent de penser qu’ils préfèrent en réalité l’imitation rapide.

Motivations de l’imitation

Il existe une hypothèse quelque peu ancrée parmi les scientifiques et les ingénieurs en IA selon laquelle la Chine excelle dans le clonage et la mise à l’échelle des technologies numériques, mais peine à créer quelque chose de complètement nouveau. On peut citer comme exemple la manière dont Alibaba a adapté le modèle commercial d’Amazon au marché chinois.[9] Cette opinion est souvent attribuée en partie à la culture chinoise, en particulier à son système éducatif qui, selon ce point de vue, « met l’accent sur le respect et l’attention aux connaissances et doctrines existantes, plutôt que d’encourager la pensée critique et la remise en question des limites existantes », freinant ainsi la créativité.[10] Cependant, ce n’est qu’une explication possible parmi d’autres pour expliquer pourquoi les grandes entreprises technologiques chinoises ont eu tendance à imiter les États-Unis dans le domaine de l’IA générative plutôt que de transformer leurs recherches en solutions commercialisables avant leurs rivaux américains.

Une autre explication est que les grandes entreprises technologiques chinoises ne semblent pas chercher à devenir leaders mondiaux dans le domaine de l’IA, mais plutôt à mettre en œuvre une stratégie nationale. À l’exception du succès mondial de TikTok, l’internationalisation des géants technologiques chinois est jusqu’à présent restée limitée. Dans le domaine de l’IA, leurs efforts restent largement concentrés sur les économies connectées par la « route numérique de la soie » chinoise, qui ne font pas partie des priorités des géants technologiques américains.[11] Alors que l’expansion internationale du cloud pourrait potentiellement encourager une adoption plus large des modèles d’IA chinois proposés sous forme de services cloud, même Alibaba, le premier fournisseur de cloud en Chine, n’a trouvé que peu ou pas de place sur le marché mondial du cloud. Les principaux obstacles sont l’accès limité aux talents internationaux et les tensions géopolitiques actuelles.[12]

Depuis la présidence de Barack Obama et, de manière plus agressive depuis la première présidence de Donald Trump, les États-Unis ont mis en œuvre une série de mesures qui ont limité l’expansion mondiale des entreprises technologiques chinoises. Les États-Unis ont utilisé l’interdépendance des chaînes de valeur mondiales liées à l’IA, en particulier pour les semi-conducteurs, comme une arme en renforçant les restrictions commerciales. Cette instrumentalisation pourrait à l’avenir s’étendre aux câbles Internet sous-marins, dont plus de la moitié appartiennent à des entreprises technologiques américaines, qui consomment également près de 70 % de la bande passante mondiale.[13]

Le gouvernement américain a également fait pression sur le reste du monde pour qu’il suive son exemple. Cela a notamment eu pour effet que, afin de conserver ses gros clients américains, le leader mondial de la fabrication de puces électroniques TSMC a rompu ses relations avec Huawei, qui figurait jusqu’alors parmi ses principaux clients. Cela a dressé un obstacle pour toute entreprise chinoise souhaitant développer des modèles d’IA de pointe, car celles-ci ont besoin d’un nombre considérable de puces d’IA interconnectées que seule TSMC est capable de fabriquer et que, jusqu’à présent, seules les entreprises américaines sont en mesure de concevoir, Nvidia étant le leader mondial dans ce domaine.

Cela pourrait expliquer davantage pourquoi les géants technologiques chinois ont préféré imiter rapidement l’IA afin d’utiliser plus efficacement leur puissance de traitement disponible, en ne formant que des modèles ayant une valeur économique avérée. Huawei a réagi en concevant des puces d’IA fabriquées par Semiconductor Manufacturing International Corporation (SMIC).[14] Ils ont amélioré le taux de réussite des puces par lot — ce que l’industrie appelle le « rendement des semi-conducteurs » — mais ils sont encore loin d’égaler les performances du tandem Nvidia-TSMC.

Les tensions géopolitiques croissantes ont également conduit les entreprises technologiques chinoises à fermer leurs laboratoires de recherche et développement (R&D) aux États-Unis. Fin 2023, les pressions en faveur du découplage ont même poussé Microsoft à encourager ses scientifiques et ingénieurs spécialisés dans l’IA à quitter la Chine pour s’installer au Canada.[15]

Les tensions géopolitiques rendent de plus en plus improbable que la domination technologique des entreprises technologiques chinoises se traduise par une domination du marché mondial, alors que cela nécessiterait des investissements plus importants et plus risqués. Cela semble d’autant plus probable compte tenu des annonces de l’administration Trump concernant les droits de douane. Même si ces mesures concernent principalement les biens plutôt que les services numériques – et que les deux pays sont déjà largement découplés dans ce domaine –, il y a lieu de penser que les turbulences mondiales provoquées par ces annonces dissuaderont davantage les entreprises technologiques chinoises de tenter de dépasser les États-Unis.

L’expérience de Huawei sert d’avertissement. Bien qu’elle ait pris une longueur d’avance dans le domaine de la 5G, les réactions géopolitiques ont freiné son expansion sur le marché mondial. Huawei a été la première à développer cette technologie, mais Washington a systématiquement réduit son potentiel et signé des accords pour l’installation de réseaux 5G dans les économies occidentales, laissant ainsi à Ericsson et Nokia le temps de reproduire cette technologie et de limiter la croissance du marché du géant chinois des télécommunications.

D’autres éléments vont dans ce sens, notamment la participation des entreprises chinoises à la définition des normes internationales. Les entreprises chinoises, en particulier Huawei, sont les contributeurs les plus actifs à la normalisation internationale dans le domaine des technologies de l’information et de la communication. Cependant, le taux d’acceptation des propositions techniques chinoises est inférieur à celui des États-Unis et de l’Europe[16]. Cela renforce l’idée que les contraintes géopolitiques entravent les retombées mondiales des entreprises technologiques chinoises en cas de leadership technologique.

Ces contraintes géopolitiques se traduisent par différentes stratégies au sein du secteur technologique. Par exemple, la stratégie de Huawei dans le domaine des smartphones diffère de la sienne et de celle des autres grandes entreprises technologiques chinoises dans le domaine de l’IA. Après que les États-Unis ont limité l’accès des entreprises chinoises aux technologies clés étrangères, Huawei s’est efforcée de concevoir ses propres puces pour smartphones, avancées mais pas encore à la pointe de la technologie, afin de conserver sa part de marché, même en Chine. Le secteur des smartphones n’a pas été confronté au même degré de protectionnisme que celui de l’IA, les iPhones d’Apple conservant une position dominante dans le segment haut de gamme du marché. La part de marché d’Apple en Chine a récemment diminué, en partie en raison de la compétitivité de Huawei depuis qu’elle a commercialisé des smartphones équipés de ses propres semi-conducteurs.[17]

La stratégie de Huawei pour rattraper son retard dans le domaine des semi-conducteurs n’a pas été accompagnée d’une stratégie similaire dans le domaine de l’IA, tant pour Huawei que pour les autres grandes entreprises technologiques chinoises. Dans le cas de l’IA, les solutions étrangères n’ont pratiquement aucune place sur le marché intérieur chinois, principalement en raison de la politique industrielle du gouvernement, qui limite la concurrence étrangère dans ce domaine. Le marché chinois des technologies numériques est dominé par des entreprises chinoises, notamment les Big Tech et, plus récemment, DeepSeek, car les secteurs public et privé préfèrent les technologies numériques chinoises, même lorsqu’elles s’internationalisent. Il est donc peu probable que le fait de dépasser les géants américains modifie de manière significative les parts de marché de l’IA en Chine. Il s’agit plutôt d’une course interne, entre acteurs nationaux, qui peut encore être remportée en étant le premier à lancer des versions locales de technologies étrangères en Chine. C’est pourquoi la sécurité du marché intérieur peut être ajoutée aux raisons qui dissuadent les entreprises chinoises de dépasser les entreprises américaines dans le développement de solutions basées sur l’IA et les incitent plutôt à privilégier l’imitation rapide.

Une raison complémentaire à la préférence pour l’imitation rapide est que la facilité d’accès aux données en Chine réduit les incitations à l’internationalisation, décourageant ainsi indirectement les efforts visant à devenir le leader mondial de l’IA. Les grandes entreprises technologiques chinoises et certaines start-ups spécialisées dans l’IA ont bénéficié d’un accès privilégié aux données du secteur public et ont opéré dans le cadre d’une réglementation historiquement laxiste en matière de confidentialité des données[18]. En outre, la taille même de la population connectée en Chine, en particulier celle qui utilise les plateformes Alibaba et Tencent, rend les ensembles de données collectés suffisamment importants. Le marché intérieur est également un marché suffisamment vaste et attractif en soi. On pourrait faire valoir que les modèles d’IA chinois qui en résulteront ne seront de bons prédicteurs que dans la mesure où ils disposeront de données, ce qui justifie d’autant plus qu’ils restent principalement chinois puisqu’ils ont été formés avec des données chinoises.

Dans l’ensemble, le paradoxe de la politique chinoise en matière d’IA est que les mêmes instruments qui créent un espace permettant aux entreprises chinoises de développer et de déployer leurs propres solutions numériques leur permettent de tirer profit d’une imitation rapide. Une fois qu’un nouveau modèle d’IA ou un autre produit issu des technologies numériques est introduit et a prouvé sa valeur économique en Occident, il est plus facile, moins risqué et mieux protégé de la concurrence étrangère de créer une version chinoise en s’appuyant sur toutes les données accumulées. En termes simples, le « Grand Firewall » chinois est une barrière à double tranchant.

Considérées conjointement, les possibilités limitées d’expansion à l’étranger et la sécurité du marché intérieur dissuadent les entreprises chinoises de prendre le risque d’introduire des innovations en matière d’IA qui repoussent les frontières mondiales. Dans le même temps, le fait de rester des suiveurs rapides permet aux entreprises chinoises qui développent l’IA de tirer profit des avancées américaines. En privilégiant l’imitation, les géants technologiques et les start-ups chinois réduisent les risques économiques et d’innovation liés à l’IA tout en se disputant le marché local, y compris les contrats publics chinois.

DeepSeek : menace ou opportunité pour les Big Tech ?

Les Big Tech américaines et chinoises ne diffèrent pas seulement dans leur approche de l’innovation de pointe. Une autre différence pertinente réside dans l’objectif de leurs investissements dans les start-ups. Bien qu’elles cherchent toutes à contrôler les start-ups et à tirer profit de leur intégration dans leurs réseaux respectifs dans une position subordonnée, seules les Big Tech américaines ont investi dans des start-ups spécialisées dans l’IA travaillant sur des modèles d’IA fondamentaux. Le cas de Microsoft et d’OpenAI n’est qu’un exemple parmi les dizaines d’accords signés par les Big Tech américaines avec des start-ups de pointe dans le domaine de l’IA afin d’accéder à leurs technologies et de les orienter tout en les enfermant dans leurs systèmes.[19]

Les Big Tech chinoises investissent également de manière importante dans les start-ups, mais leurs motivations sont différentes. Il a été constaté que le capital-risque des entreprises en Chine est principalement motivé par des objectifs de diversification du marché intérieur.[20]Lorsque les géants technologiques chinois investissent dans des start-ups spécialisées dans l’IA, ils privilégient les applications plutôt que les modèles fondamentaux. Le PDG de Baidu a ouvertement plaidé en faveur des applications concrètes de l’IA, considérées comme plus importantes que la concurrence entre les modèles.[21]

Alibaba n’a investi dans DeepSeek qu’après que cette dernière ait lancé des modèles capables de rivaliser avec ChatGPT, prouvant ainsi son potentiel commercial. Auparavant, les investissements dans les start-ups spécialisées dans l’IA ne visaient pas à encourager le développement de modèles de base. Par exemple, la start-up Megvii a reçu du capital-risque d’Alibaba, mais l’objectif n’était pas de promouvoir les recherches en cours de l’entreprise sur les modèles d’IA, mais d’utiliser sa technologie de déverrouillage par reconnaissance faciale dans Alipay jusqu’à ce qu’Alibaba la remplace par une solution interne. Megvii a également été engagée pour personnaliser les applications d’IA de Huawei et Xiaomi. Tant au niveau national que provincial, le gouvernement chinois a également été l’un des principaux clients de Megvii. Megvii propose à ces gouvernements un système de reconnaissance faciale avec des caméras de surveillance qui facilitent l’accès aux données.

Dans l’ensemble, les grandes entreprises technologiques chinoises et l’État ont influencé les priorités des start-ups chinoises spécialisées dans l’IA, les poussant à se concentrer sur des applications étroites plutôt que sur une IA plus fondamentale et novatrice. Dans ce contexte, il n’est pas surprenant que DeepSeek ait été financée et fondée par un acteur technologique atypique : le fonds spéculatif High-Flyer.[22] DeepSeek, initialement appelée Fire-Flyer, était la branche de recherche de High-Flyer. Elle se concentrait au départ sur la recherche en apprentissage profond pour l’analyse de données financières, ce qui nécessitait le stockage de GPU. High-Flyer les a accumulés avant et pendant la mise en place des restrictions américaines à l’encontre de la Chine.

Le nombre de GPU accumulés était encore bien inférieur à celui utilisé pour former l’IA générative selon le modèle commercial promu par les géants américains de la technologie et leurs start-ups satellites, qui est extrêmement gourmand en puissance de calcul. Pour parvenir à un modèle similaire, DeepSeek a utilisé une autre technique d’apprentissage appelée « distillation ». Dans ce contexte, « distiller » signifie extraire automatiquement l’apprentissage de modèles déjà existants. Cette technique avait déjà été utilisée auparavant, mais pour des modèles à plus petite échelle qui n’étaient pas aussi performants que les originaux. DeepSeek est plus petit en termes de nombre de paramètres (ce qui le rend également moins coûteux à utiliser), mais il joue dans la cour des grands.

À partir de la distillation, la formation restante est plus courte et chaque cycle de formation nécessite moins d’investissement, car elle ne part pas de zéro, mais de l’apprentissage déjà effectué par d’autres modèles, qui dans le cas de DeepSeek avait été réalisé par d’autres entreprises. C’est une autre raison pour laquelle DeepSeek-R1 est moins cher. Bien que nous ne puissions pas comparer directement le coût de formation de modèles tels que GPT d’OpenAI ou LLaMA de Meta, car cela nécessiterait de connaître le coût total de production de DeepSeek-R1, qui reste secret, il est clair que DeepSeek produit une IA moins coûteuse. Son dernier cycle de formation n’a nécessité que 5,6 millions de dollars.

Le fait que DeepSeek soit chinois n’est donc qu’une partie des raisons pour lesquelles les actions de Nvidia, Amazon, Microsoft, Meta et Google ont chuté. DeepSeek a créé une version économique des modèles d’IA leaders aux États-Unis, ce qui a un impact direct sur le modèle commercial mondial de l’IA générative dominé par les États-Unis. Comme je l’avais prévu dans l’introduction, le développement de modèles de pointe sans concentrer d’énormes quantités de puces d’IA de pointe pour la formation sape l’activité de Nvidia, qui se consacre presque entièrement à la conception de ces puces. D’où la chute de sa capitalisation boursière lors de la sortie de DeepSeek R1.

DeepSeek R1 peut également être téléchargé et exécuté localement, contrairement à tous les autres modèles de pointe. Et il est proposé à un prix inférieur à celui pratiqué par Meta pour son modèle LLaMA, accessible via les clouds d’Amazon, de Microsoft et de Google. Contrairement à Nvidia, pour ces trois géants américains du cloud, DeepSeek représente davantage une opportunité d’étendre leurs activités dans le cloud qu’une menace.

Amazon, Microsoft et Google sont toujours gagnants

Presque toutes les start-ups spécialisées dans l’IA générative dépendent aujourd’hui d’au moins un géant du cloud, y compris des entreprises étrangères comme DeepSeek ou Mistral en France. Bien que les modèles DeepSeek puissent être téléchargés, ils sont également disponibles en tant que service sur les clouds de ces géants. Cela montre que la domination du cloud va bien au-delà de l’infrastructure en tant que service, puisque même les entreprises qui n’ont pas utilisé le cloud pour former leurs modèles, comme Meta et DeepSeek ou, plus récemment, xAI, dépendent du cloud pour les proposer. C’est pourquoi le succès de la société chinoise DeepSeek ne constitue pas une menace sérieuse pour elles. DeepSeek ne vise pas à concurrencer les géants du cloud, mais des entreprises comme OpenAI et Anthropic, dont l’activité consiste exclusivement à vendre des modèles. Les géants du cloud vendent également leurs propres modèles, mais cela ne représente qu’une infime partie de leur activité.

En fait, l’intensification de la concurrence dans le domaine des modèles d’IA renforce la domination globale des géants du cloud, car elle dissuade les start-ups leaders dans le domaine de l’IA de se diversifier et, à terme, de leur faire concurrence en développant un écosystème cloud indépendant. Une concurrence accrue au niveau de la modélisation de l’IA rend les start-ups occidentales encore plus dépendantes. Amazon, Microsoft et Google sont souvent leurs principaux investisseurs et représentent la majeure partie de la demande d’utilisation payante de l’IA en dehors de la Chine. Les entreprises, les gouvernements, les universités et bien d’autres considèrent le cloud comme le guichet unique pour tous les services numériques. Il n’est donc pas surprenant que DeepSeek propose également ses modèles sous forme de service.

Pour OpenAI et d’autres, il semble inutile de quitter cet écosystème, surtout lorsque des modèles concurrents sont proposés. Développer des modèles sans le soutien d’Amazon, de Microsoft ou de Google, surtout si cela implique d’utiliser des techniques entièrement nouvelles et plus coûteuses que celles de DeepSeek, n’est pas viable pour les start-ups occidentales spécialisées dans l’IA. En Chine, en revanche, l’imitation reste la stratégie privilégiée. Parfois, comme dans le cas de DeepSeek, cette stratégie s’avère payante.

Un échiquier géopolitique

Pour la Chine, cette issue est problématique. Le gouvernement chinois s’est engagé à faire de la Chine le centre mondial de l’innovation en matière d’IA d’ici 2030 dans son plan de développement de l’intelligence artificielle de nouvelle génération (AIDP) de 2017.[23] Cet objectif suppose que les entreprises technologiques chinoises visent à devenir des précurseurs technologiques, car la Chine ne peut pas devenir le leader mondial de l’IA sans que les entreprises chinoises ne prennent les devants. Dans le même temps, les puissances économiques chinoises restent dépendantes de la dextérité de l’État chinois pour maintenir leur position combinée d’imitateurs rapides et de leaders du marché chinois.

À leur tour, les géants américains ont mobilisé un discours fondé sur la menace que représente l’avance de la Chine. Cela leur a permis de rallier davantage d’alliés aux États-Unis et dans d’autres gouvernements et sert à justifier leurs appels à un soutien de l’État en faveur de l’innovation dans le domaine de l’IA, compte tenu de ce qui est présenté comme une menace nationale.[24] La possibilité d’une expansion chinoise sert également la stratégie des géants américains de la technologie pour militer contre les mesures antitrust. Tout cela semble toutefois exagéré si l’on considère que le contexte général incite les entreprises chinoises à préférer l’imitation rapide plutôt que de dépasser les États-Unis.

Jusqu’à présent, le scénario décrit ici représente une situation gagnant-gagnant pour les géants technologiques américains. Ils utilisent la criticité géopolitique comme une arme pour s’assurer que les géants chinois restent principalement en Chine, tout en bénéficiant potentiellement non seulement d’une réglementation plus favorable, mais aussi d’investissements publics supplémentaires dans l’IA. Compte tenu de leur contrôle actuel de la chaîne de valeur de l’IA, y investir davantage leur serait favorable.[25]

Le contexte des deux côtés du Pacifique présente au moins deux points communs. Premièrement, il souligne la profonde interdépendance entre le pouvoir des entreprises et le pouvoir politique.[26] Deuxièmement, ni les États-Unis ni la Chine ne placent les défis sociaux et écologiques avant les profits privés dans le développement de l’IA.

Souveraineté numérique

Quelle que soit l’issue de la confrontation entre les deux puissances mondiales, l’émergence de DeepSeek-R1 contribue à convaincre les décideurs politiques qu’il est possible de développer l’IA dans le reste du monde, même avec un budget inférieur aux milliards de dollars investis par les géants de la technologie. Mais au-delà de DeepSeek, le rôle central de ces technologies dans toutes les dimensions de notre vie, des relations sociales à notre façon de penser, ainsi que leurs économies d’échelle, leurs économies de gamme et leurs effets de réseau intrinsèques, nous obligent à promouvoir le développement de tels modèles d’IA en tant que solutions publiques. Cela signifie des modèles financés par le secteur public et véritablement open source, qui ne se contentent pas de divulguer les paramètres finaux du modèle comme le fait Meta avec Llama, mais qui incluent la divulgation de l’ensemble du développement et des données utilisées pour l’entraînement.

Cependant, les modèles à développer ne doivent pas viser à reproduire ou à imiter ceux promus par les entreprises américaines et chinoises. Au contraire, les modèles d’IA devraient être développés par des équipes interdisciplinaires qui tiennent compte de leurs implications écologiques, sociales et éthiques. Ces équipes devraient comprendre des spécialistes de l’impact de l’IA sur la société, le travail, l’écologie, les droits de l’homme et d’autres domaines, issus du monde universitaire et de la société civile. Une telle institution publique, mais autonome, pourrait évaluer et recommander aux gouvernements les modèles d’IA souhaitables et à quelles fins, limitant ainsi la tendance à vouloir tout résoudre avec des modèles d’IA. Toutefois, une fois que de nouveaux modèles de base auront été conçus et développés, les exigences en matière de puissance de traitement pour les itérations et l’adaptation ultérieures de ces modèles seront moins élevées grâce à l’utilisation de techniques de distillation similaires à celles de DeepSeek.

La possibilité de construire des modèles de pointe moins coûteux est une invitation à travailler au niveau international sur des développements technologiques qui donnent la priorité aux besoins sociaux et respectent les limites de la planète en ne développant des modèles d’IA que pour les utilisations nécessaires où il n’existe pas d’autres alternatives moins gourmandes en ressources. Ces modèles devraient intégrer une chaîne de valeur internationale, démocratique, centrée sur l’humain et écologique, plus large et dirigée par le public, où les segments fondamentaux de la chaîne sont offerts comme des biens publics, y compris les infrastructures physiques et les plateformes fondamentales pour le développement de solutions spécifiques.[27]

Il n’y a pas de temps à perdre. Nous assistons déjà aux effets de la disparition des espaces de délibération publique. Les algorithmes d’IA des réseaux sociaux décident quels messages sont affichés, où, quand et, en fait, lesquels ne sont pas affichés du tout. À partir de là, une poignée d’entreprises influencent l’opinion publique (et le bon sens). Musk est allé jusqu’à annoncer que sa plateforme X serait le seul canal utilisé pour la communication publique de l’administration de la sécurité sociale.[28] Même si cela ne se produira probablement pas, la simple possibilité montre l’ampleur du problème.

Les réseaux sociaux ne sont que la partie émergée de l’iceberg. La dépendance numérique s’étend à tous les aspects de la vie à mesure que l’IA et d’autres technologies numériques proposées sous forme de services cloud pénètrent toutes les entreprises, toutes les organisations et même tous les États. La capacité à gouverner, à être souverain, est détournée lorsque les technologies essentielles au fonctionnement économique et politique d’un pays sont contrôlées par une poignée d’entreprises issues de la superpuissance mondiale. J’ai fait valoir ici qu’elles ne seront pas dépassées de sitôt par les entreprises chinoises. Même si elles l’étaient, cela ne résoudrait pas les profondes dépendances mondiales générées par le contrôle privé des technologies de l’information essentielles par quelques entreprises de deux pays.

Il est urgent de surmonter cette dépendance, et pas seulement en raison des pertes économiques qui en résultent. Les géants de la technologie définissent les technologies auxquelles nous avons accès et, par conséquent, les développements qui sont négligés, c’est-à-dire les technologies auxquelles nous n’avons pas accès. Sans une réorientation qui crée et permette des modèles publics, ouverts et vérifiables, nous risquons de voir se poursuivre un développement technologique qui favorise des utilisations allant du contrôle militaire ou de la surveillance (sur le lieu de travail et en dehors) à l’IA qui remplace le travail créatif au lieu de le rendre plus épanouissant. Il est aujourd’hui plus urgent que jamais de réclamer des solutions publiques, internationales et ouvertes[29] qui devraient au moins être utilisées dans les écoles, les hôpitaux et par l’administration publique.

NOTES :

[1] Adina Yakefu, “A Short Summary of Chinese AI Global Expansion’, Hugging Face, 1 October 2024. Available here.

[2] World Intellectual Property Organization, “Generative Artificial Intelligence. Patent Landscape Report”, WIPO, 2024.

[3] Stanford HAI, “Artificial Intelligence Index Report 2024”, Stanford University Human Centered Artificial Intelligence, 2024.

[4] See Cecilia Rikap, “Dynamics of Corporate Governance Beyond Ownership in AI”, Common Wealth, 2024. Available here.

[5] Sungyong Chang et al., “Dynamics of Imitation versus Innovation in Technological Leadership Change: Latecomers’ Catch-up Strategies in Diverse Technological Regimes”, Research Policy, 53, no. 9, 2024; Hart E. Posen, Jeho Lee, and Sangyoon Yi, “The Power of Imperfect Imitation”, Strategic Management Journal, 34, no. 2, February 2013, pp. 149–64; Yangao Xiao, Andrew Tylecote, and Jiajia Liu, “Why Not Greater Catch-up by Chinese Firms? The Impact of IPR, Corporate Governance and Technology Intensity on Late-Comer Strategies”, Research Policy, 42, no. 3, 2013, pp. 749–64.

[6] A detailed methodology of how I retrieved this dataset can be found at Rikap “Varieties of corporate innovation systems and their interplay with global and national systems: Amazon, Facebook, Google and Microsoft’s strategies to produce and appropriate artificial intelligence”, Review of International Political Economy31(6), pp. 1735–1763.

[7] See the full network of Reikap, “Varieties of corporate innovation systems and their interplay with global and national systems: Amazon, Facebook, Google and Microsoft’s strategies to produce and appropriate artificial intelligence”, Review of International Political Economy, 31(6), pp. 1735–1763.

[8] Bengt-Åke Lundvall and Cecilia Rikap, “China’s Catching-up in Artificial Intelligence Seen as a Co-Evolution of Corporate and National Innovation Systems”, Research Policy, 51, no. 1, 2022.

[9] Xinyi Wu and Gary Gereffi, “Amazon and Alibaba: Internet Governance, Business Models, and Internationalization Strategies”, International Business in the Information and Digital Age, Emerald Publishing Limited, 2018, pp. 327–56.

[10] Xiaolan Fu, Wing Thye Woo and Jun Hou, “Technological Innovation Policy in China: The Lessons, and the Necessary Changes Ahead”, Economic Change and Restructuring, 49, no. 2–3 (2016), p. 153.

[11] See Adina Yakefu, “A Short Summary of Chinese AI Global Expansion’, Hugging Face, 1 October 2024. Available here.

[12] Lundvall and Rikap, “China’s Catching-up in Artificial Intelligence Seen as a Co-Evolution of Corporate and National Innovation Systems”; Cecilia Rikap, “Varieties of Corporate Innovation Systems and Their Interplay with Global and National Systems: Amazon, Facebook, Google and Microsoft’s Strategies to Produce and Appropriate Artificial Intelligence”, Review of International Political Economy, 31, no. 6, 2024, pp. 1735–63.

[13] Guillaume Beaumier and Madison Cartwright, “Cross-Network Weaponization in the Semiconductor Supply Chain”, International Studies Quarterly, 68, no. 1, 2024 ; Henry Farrell and Abraham L. Newman, “Weaponized Interdependence: How Global Economic Networks Shape State Coercion”, International Security, 44, no. 1, 2019, pp. 42–79; Lars Gjesvik, “Private Infrastructure in Weaponized Interdependence”, Review of International Political Economy, 30, no. 2, 2022, pp. 1–25; Martin Kenney and Arie Y. Lewin, “Semiconductor Catch-up Is Not Enough: Twigging the Context of China’s Ambitions”, Management and Organization Review, 18, no. 4, 2022, pp. 816–26; “The State of the Network. 2023 Edition”, Telegeography, 2023.

[14] Zijing Wu and Eleanor Olcott, “Huawei improves AI chip production in boost for China’s tech goals”, FT, 25 Feburary 2025. Available here.

[15] Eleanor Olcott, Qianer Liu, Ryan McMorrow, “Microsoft to move top AI experts from China to new lab in Canada”, FT, 9 June 2023. Available here.

[16] Lennart Schott and Kerstin J. Schaefer, “Acceptance of Chinese Latecomers’ Technological Contributions in International ICT Standardization—The Role of Origin, Experience and Collaboration”, Research Policy, 52 , no. 1, 2023.

[17] Qianer Liu, “How Huawei surprised the US with a cutting-edge chip made in China”, FT, 30 November 2023. Available here.

[18] Alberto Arenal et al., “Innovation Ecosystems Theory Revisited: The Case of Artificial Intelligence in China”, Telecommunications Policy 44, no. 6, 2020, p. 101960; Jeffrey Ding, “Deciphering China’s AI Dream”, Future of Humanity Institute Technical Report, 2018, https://www.fhi.ox.ac.uk/wp-content/uploads/Deciphering_Chinas_AI-Dream.pdf; Huw Roberts et al., “The Chinese Approach to Artificial Intelligence: An Analysis of Policy, Ethics, and Regulation”, AI & Society, 2020, pp. 1–19.

[19] Cecilia Rikap, “Dynamics of Corporate Governance Beyond Ownership in AI”, Common Wealth, 2024. Available here.

[20] Dushnitsky and Yu, “Why Do Incumbents Fund Startups? A Study of the Antecedents of Corporate Venture Capital in China”, Research Policy, 51, no. 3, 2022.

[21] See “Baidu bets on practical AI as industry shifts to real-world applications”, KrAsia, 7 January 2025. Available here.

[22] Zeyi Yang, “How Chinese AI Startup DeepSeek Made a Model that Rivals OpenAI”, Wired, 25 January 2025. Available here.

[23] Gregory C. Allen, “Understanding China’s AI Strategy: Clues to Chinese Strategic Thinking on Artificial Intelligence and National Security”, Center for a New American Security, 2019; Jeffrey Ding, “Deciphering China’s AI Dream”, Future of Humanity Institute Technical Report, 2018. Available here; Huw Roberts et al., “The Chinese Approach to Artificial Intelligence: An Analysis of Policy, Ethics, and Regulation”, AI & SOCIETY, 2020, pp. 1–19; Graham Webster et al., “Full Translation: China’s ‘New Generation Artificial Intelligence Development Plan’”(2017)’, DigiChina, 1 August 2017.

[24] See e.g. “NSCAI, The Final Report”,:National Security Commission on Artificial Intelligence, 2020.

[25] See Cecilia Rikap, “Europe Needs an EC-Led AI Plan for the People and the Planet”, AI Now Institute, 2024. Available here.

[26] Alberto Arenal et al., “Innovation Ecosystems Theory Revisited: The Case of Artificial Intelligence in China”, Telecommunications Policy 44, no. 6 (2020), p. 101960; Bengt-Åke Lundvall and Cecilia Rikap, “China’s Catching-up in Artificial Intelligence Seen as a Co-Evolution of Corporate and National Innovation Systems”, Research Policy, 51, no. 1, 2022; Steve Rolf and Seth Schindler, “The US–China Rivalry and the Emergence of State Platform Capitalism”, Environment and Planning A: Economy and Space 55, no. 5 (August 2023):pp. 1255–80.

[27] See Cecilia Rikap, Cédric Durand, Paolo Gerbaudo, Paris Marx and Edemilson Paraná, “Reclaiming digitial sovereignty”, UCL Bartlett Faculty of the Built Environment, 2021. Available here.

[28] Zoë Schiffer, “The Social Security Administration Is Gutting Regional Staff and Shifting All Public Communications to X”, Wired, 11 April 2025. Available here.

[29] See Rikap, Durand, Gerbaudo, Marx and Paraná, “Reclaiming digitial sovereignty”.

Notes

  • 1
    Dynamics of Corporate Governance Beyond Ownership in AI

Qu'en pensez vous ?