DeepSeek bouleverse les enjeux de l’IA générative mondiale

Avec DeepSeek la Chine entend démontrer que le modèle de ces 50 dernières années où elle copiait avant d’essayer d’améliorer est désormais obsolète. Avec l’IA générative, il s’agit désormais de faire la course technologique en tête.

Mi-Janvier, l’irruption de DeepSeek a stupéfié tout le monde, dans la Silicon Valley et ailleurs. Effet immédiat, le téléchargement frénétique de l’application (gratuite) sur les App Store d’Apple et de Google qui se poursuit aujourd’hui : plus de 10 millions d’exemplaires téléchargés à début février.

Derrière cet empressement, les questions : quelle qualité technique réelle par rapport à ses rivaux américains, notamment ChatGPT ? Quels sont les moyens financiers techniques et financiers réels dont elle a bénéficié ? A long terme, quel est son ambition sur le marché et le modèle économique par l’atteindre ? Enfin, sur le plan politique, y-a-t-il des biais idéologiques inclus dans sa conception ?

 

Quelques éléments connus, toujours beaucoup d’incertitudes

 

Première surprise, selon les premiers tests techniques publiés, notamment dans la presse américaine, DeepSeek se serait montré supérieur à ChatGPT sur plusieurs domaines clé, par exemple en termes de raisonnement et de tâches mathématiques. Sous réserve d’analyses plus approfondies …et des prochaines versions du rival américain.

Concernant sa conception, ses promoteurs assurent que le coût de développement, même dans sa version la plus performante en version gratuite (R1), n’aurait coûté qu’une fraction (environ 6 millions de dollars) de ce que coûtent les modèles américains concurrents à développer. Qui, eux, le sont à coups de centaines de millions de dollars de private equity (et cela continue), alors que les fonds publics de la nouvelle administration Trump ne viennent à la rescousse (Stargate).

La réalité du financement de DeepSeek est évidemment plus opaque et la lecture d’interviews publiées récemment du fondateur, Liang Wenfeng, montre que celui-ci n’a eu aucun problème de ressources humaines, ni d’accès à des capacités de calcul illimitées, sans parler des coûts d’hébergement informatiques (cloud). Une grande partie de toutes ces ressources étant subventionnés par le gouvernement chinois. Et pas seulement dans l’IA (véhicules électriques).

Concernant l’entrainement du modèle, on peut suspecter un autre avantage spécifique « en nature », difficile à démontrer néanmoins :  l’accès illimité à l’océan de données personnelles que le gouvernement chinois collecte depuis des années sur sa population d’un milliard et demi d’habitants. L’abondance de données est la clé d’un entrainement réussi des modèles d’IA générative et donc un accès sans restriction à ces données (Il n’existe pas en Chine d’équivalent au RGPD européen ou à son équivalent américain) constituerait un avantage concurrentiel a priori déloyal.

Sur un plan plus technique cette fois, il semble que les ingénieurs de DeepSeek se soient illustrés par des techniques de programmation innovantes pour réduire considérablement les coûts et la complexité de la programmation de leur modèle d’IA générative. Une performance qui s’appliquerait également à un besoin de moindre puissance informatique qui aurait permis de se passer des dernières générations de puces Nvidia, interdites à l’export par les Etats-Unis. Dernier facteur d’optimisation des coûts de mise au point : le recours aux bibliothèques open source, libres d’accès.

 

Tentation monopolistique

 

Pour autant, cette approche « ouverte » ne doit pas être confondue avec le résultat du développement qui n’est lui, en aucune façon Open Source. A l’heure actuelle, personne ne sait comment fonctionne réellement ce modèle.

C’est dans ce contexte que DeepSeek veut proposer à des prix « cassés » son modèle au marché mondial. Aussi bien aux particuliers pour lesquels la version équivalente à celle de ChatGPT 4.o est gratuite alors que celle de son concurrent américain est payante, qu’aux professionnels. Via l’accès à ses API, qui permettent à d’autres modèles d’IA verticalisés de se « brancher » sur son moteur principal.

Du coup, l’éventuelle dépendance à cette technologie bon marché mais opaque pose la question de la dépendance à une telle solution appelée à devenir indispensable. 

Si l’on considère que l’IA fera demain partie de toutes les composantes de la vie humaine, l’urgence consiste certainement à tenter de conserver un choix entre des solutions transparentes et respectueuses de certains droits. Et d’éviter que « the winner takes all ». Quel qu’il soit.

 

Michel Ktitareff

CEO & CO-FOUNDER SCALE- UP BOOSTER