BBC Afrique of Tuesday, 28 January 2025

Source: BBC

DeepSeek : l'application chinoise d'IA qui fait parler d'elle

BBC news BBC news

Un modèle d'intelligence artificielle (IA) de fabrication chinoise appelé DeepSeek s'est hissé au sommet des téléchargements de l'Apple Store, stupéfiant les investisseurs et faisant chuter certaines valeurs technologiques.

Lancé le 20 janvier, il a rapidement impressionné les spécialistes de l'IA avant d'attirer l'attention de l'ensemble de l'industrie technologique - et du monde entier.

Le président américain Donald Trump a déclaré qu'il s'agissait d'une « sonnette d'alarme » pour les entreprises américaines, qui doivent se concentrer sur la « concurrence pour gagner ».

Ce qui rend DeepSeek si spécial, c'est l'affirmation de l'entreprise selon laquelle il a été construit pour une fraction du coût des modèles de pointe comme OpenAI - parce qu'il utilise moins de puces avancées.

Cette possibilité a conduit le géant de la fabrication de puces Nvidia à perdre près de 600 milliards de dollars (482 milliards de livres sterling) de sa valeur boursière lundi, soit la plus forte perte en une journée de l'histoire des États-Unis.

DeepSeek soulève également des questions sur les efforts déployés par Washington pour contenir la suprématie technologique de Pékin - l'une des principales restrictions a été l'interdiction d'exporter des puces avancées vers la Chine.

Pékin a toutefois redoublé d'efforts, le président Xi Jinping ayant déclaré que l'IA était une priorité absolue. Des start-ups comme DeepSeek sont cruciales, car la Chine passe de la fabrication traditionnelle (vêtements et meubles) aux technologies de pointe (puces, véhicules électriques et IA).

Que savons-nous de DeepSeek ?


  • L'IA pourrait-elle contribuer à prévenir la perte de vision liée au diabète ?
  • L’Afrique doit-elle adopter l’IA pour garder sa musique au centre de la scène ?
  • Apple mise sur l'IA pour stimuler les ventes du nouvel iPhone 16

Qu'est-ce que DeepSeek ?

DeepSeek est un chatbot alimenté par l'IA, comme ChatGPT.

Il s'agit de l'application gratuite téléchargée sur l'app store d'Apple, où DeepSeek affirme qu'elle est conçue pour « répondre à vos questions et améliorer votre vie de manière efficace ».

Mais le modèle d'IA qui l'alimente - appelé R1 - compte quelque 670 milliards de paramètres, ce qui en fait le plus grand modèle de langage à code source ouvert à ce jour, selon Anil Ananthaswamy, auteur de l'ouvrage Why Machines Learn : The Elegant Math Behind Modern AI.

Il serait aussi puissant que le modèle O1 d'OpenAI - qui alimente ChatGPT - en matière de mathématiques, de codage et de raisonnement.

Comme beaucoup d'autres modèles d'IA chinois - Ernie de Baidu ou Doubao de ByteDance - DeepSeek est formé pour éviter les questions politiquement sensibles.

Lorsque la BBC a demandé à l'application ce qui s'était passé sur la place Tiananmen le 4 juin 1989, DeepSeek n'a donné aucun détail sur le massacre, un sujet tabou en Chine.

L'application a répondu : « Je suis désolé, je ne peux pas répondre à cette question. Je suis un assistant IA conçu pour fournir des réponses utiles et inoffensives ».

La censure du gouvernement chinois était considérée comme un énorme défi pour le développement de l'IA. Mais DeepSeek semble avoir été formé sur un modèle open-source, ce qui lui permet d'effectuer des tâches complexes, tout en retenant certaines informations.

Les chercheurs qui l'ont conçu affirment que sa construction a coûté 6 millions de dollars (4,8 millions de livres sterling), un budget dérisoire comparé aux milliards dépensés par les entreprises d'IA aux États-Unis.

La manière dont ils y sont parvenus n'est pas encore claire. Le fondateur de DeepSeek aurait constitué un stock de puces Nvidia A100, dont l'exportation vers la Chine est interdite depuis septembre 2022.

Les experts pensent que cette collection - que certains estiment à 50 000 - l'a conduit à construire un modèle d'IA aussi puissant, en associant ces puces à d'autres moins chères et moins sophistiquées.

Qui se cache derrière DeepSeek ?

DeepSeek a été fondée en décembre 2023 par Liang Wenfeng et a publié son premier modèle d'IA pour les grandes langues l'année suivante.

On ne sait pas grand-chose de Liang, qui est diplômé de l'université de Zhejiang en ingénierie de l'information électronique et en informatique. Mais il se retrouve aujourd'hui sous les feux de la rampe au niveau international.

Il a récemment participé à une réunion organisée par le premier ministre chinois Li Qiang, ce qui témoigne de l'importance croissante de DeepSeek dans le secteur de l'IA.

Contrairement à de nombreux entrepreneurs américains de l'IA issus de la Silicon Valley, M. Liang a également une expérience dans la finance.

Il est le PDG d'un fonds spéculatif appelé High-Flyer, qui utilise l'IA pour analyser les données financières afin de prendre des décisions d'investissement - ce que l'on appelle le trading quantitatif. En 2019, High-Flyer est devenu le premier fonds spéculatif quantique en Chine à lever plus de 100 milliards de yuans (13 millions de dollars).

Dans un discours prononcé cette année-là, Liang a déclaré : « Si les États-Unis peuvent développer leur secteur du trading quantitatif, pourquoi pas la Chine ? »

Dans une rare interview accordée l'année dernière, il a déclaré que le secteur chinois de l'IA « ne peut pas rester éternellement un suiveur ».

Il poursuit : « Souvent, nous disons qu'il y a un écart d'un ou deux ans entre l'IA chinoise et l'IA américaine, mais le véritable écart se situe entre l'originalité et l'imitation. Si cela ne change pas, la Chine sera toujours un suiveur ».

À la question de savoir pourquoi le modèle de DeepSeek a surpris tant de monde dans la Silicon Valley, il répond : « Leur surprise vient du fait qu'une entreprise chinoise se joint à leur jeu en tant qu'innovateur, et pas seulement en tant que suiveur - ce à quoi la plupart des entreprises chinoises sont habituées. »

Comment les entreprises américaines sont-elles impactées ?

Les réalisations de DeepSeek remettent en cause la croyance selon laquelle des budgets plus importants et des puces de premier ordre sont les seuls moyens de faire progresser l'IA, une perspective qui a créé une incertitude quant à l'avenir des puces à haute performance.

« DeepSeek a prouvé que des modèles d'IA de pointe peuvent être développés avec des ressources informatiques limitées », déclare Wei Sun, analyste principal de l'IA chez Counterpoint Research.

« En revanche, OpenAI, évaluée à 157 milliards de dollars, fait l'objet d'un examen minutieux quant à sa capacité à conserver un avantage dominant en matière d'innovation ou à justifier son évaluation et ses dépenses massives sans produire de résultats significatifs. »

La baisse possible des coûts de l'entreprise a ébranlé les marchés financiers le 27 janvier, entraînant une chute de plus de 3 % de l'indice Nasdaq, à forte composante technologique, dans un vaste mouvement de liquidation qui a touché les fabricants de puces et les centres de données du monde entier.

Nvidia semble avoir été le plus durement touché, le cours de son action ayant chuté de 17 % au cours de la journée.

Le fabricant de puces était l'entreprise la plus précieuse au monde, en termes de capitalisation boursière, mais il est tombé à la troisième place, derrière Apple et Microsoft, lundi, lorsque sa valeur boursière est passée de 3,5 milliards de dollars à 2,9 milliards de dollars, a rapporté Forbes.

Comment la Chine réagit-elle ?

L'essor de DeepSeek est un énorme coup de pouce pour le gouvernement chinois, qui cherche à développer des technologies indépendantes de l'Occident.

Si le parti communiste n'a pas encore fait de commentaire, les médias d'État chinois ont tenu à souligner que les géants de la Silicon Valley et de Wall Street « perdaient le sommeil » à cause de DeepSeek, qui était en train de « bouleverser » le marché boursier américain.

« En Chine, les progrès de DeepSeek sont célébrés comme un témoignage des prouesses technologiques et de l'autonomie croissantes du pays », explique Marina Zhang, professeur associé à l'université de technologie de Sydney.

« Le succès de l'entreprise est perçu comme une validation de l'innovation 2.0 en Chine, une nouvelle ère de leadership technologique local mené par une jeune génération d'entrepreneurs ».

Mais elle a également mis en garde contre le risque de voir ce sentiment déboucher sur un « isolationnisme technologique ».

Reportage complémentaire de João da Silva


  • L'IA suscite des inquiétudes dans le secteur du divertissement pour adultes
  • La version améliorée de ChatGPT enseigne les mathématiques et le flirt - mais elle a encore des ratés
  • L'intelligence artificielle peut-elle profiter à la démocratie ?