BBC Afrique of Wednesday, 29 January 2025

Source: BBC

Le cerveau de DeepSeek : Qui est Liang Wenfeng ?

BBC news BBC news

DeepSeek, le nouveau chatbot d'IA chinois, a provoqué une onde de choc dans le monde de la technologie, détrônant ChatGPT en tant qu'application gratuite la plus téléchargée aux États-Unis et catapultant son fondateur, le milliardaire Liang Wenfeng, vers une célébrité du jour au lendemain dans son pays d'origine.

Lancé la semaine dernière, ce chatbot bon marché - qui aurait été développé pour une fraction du budget de ses rivaux - a fait vaciller Wall Street et les concurrents se démènent pour le rattraper.

Le président Donald Trump s'en est mêlé, estimant qu'il s'agissait d'un « signal d'alarme » pour les entreprises américaines, qui doivent « être compétitives pour gagner ».


A lire aussi sur BBC Afrique:


  • DeepSeek : l'application chinoise d'IA qui fait parler d'elle
  • La Chine peut-elle dépasser les États-Unis dans le marathon de l'IA ?
  • Comment TikTok va-t-il contester l'interdiction dont il est menacé aux États-Unis ?

"Plus un geek qu'un patron"

DeepSeek a été fondée en décembre 2023 par Liang Wenfeng et a publié son premier modèle d'IA pour les grandes langues l'année suivante. On ne sait pas grand-chose de cet homme de 40 ans, né dans le Guangdong, dans le sud de la Chine, et diplômé de l'université de Zhejiang en ingénierie de l'information électronique et en informatique.

Dans un article paru sur le site technologique 36Kr, des personnes qui le connaissent bien disent qu'il est « plus un geek qu'un patron ».

Mais M. Liang, qui fait rarement des apparitions publiques ou donne des interviews, se retrouve aujourd'hui sous les feux de la rampe au niveau international.

Il a été le seul dirigeant de l'IA sélectionné pour assister à une réunion publique d'entrepreneurs avec le deuxième dirigeant le plus puissant du pays, Li Qiang. Les hommes d'affaires ont été invités à « concentrer leurs efforts sur les technologies clés ».

Contrairement à de nombreux entrepreneurs américains spécialisés dans l'IA et issus de la Silicon Valley, M. Liang a également une expérience dans le domaine de la finance. Il est le PDG d'un fonds spéculatif appelé High-Flyer, qui utilise l'IA pour analyser les données financières afin de prendre des décisions d'investissement - ce que l'on appelle le trading quantitatif.

En 2019, High-Flyer est devenu le premier fonds spéculatif quantique en Chine à lever plus de 100 milliards de yuans (13 millions de dollars).

Chez High-Flyer, M. Liang a fait fortune en utilisant l'IA et les algorithmes pour identifier des modèles susceptibles d'influer sur le cours des actions. Son équipe est devenue experte dans l'utilisation des puces H800 fabriquées par Nvidia, concepteur de puces d'IA et récent favori de Wall Street, pour gagner de l'argent en négociant des actions. En 2023, il a lancé DeepSeek, annonçant son intention de développer une IA de niveau humain.

M. Liang, qui est personnellement impliqué dans les recherches de DeepSeek, utiliserait les revenus de ses opérations de fonds spéculatifs pour payer les salaires les plus élevés aux meilleurs talents en matière d'IA. Le personnel de l'entreprise est composé de docteurs issus des meilleures écoles chinoises (universités de Pékin, de Tsinghua et de Beihang) et non d'experts issus d'institutions américaines.

Avec ByteDance, propriétaire de TikTok, DeepSeek est connue pour offrir les rémunérations les plus élevées aux ingénieurs en IA en Chine, avec un personnel basé dans les bureaux de Hangzhou et de Pékin.

Dans une interview accordée à la presse nationale l'année dernière, il a déclaré que son équipe de base « ne comptait pas de personnes revenant de l'étranger. Ils sont tous locaux [...]. Nous devons développer nous-mêmes les meilleurs talents ».

M. Liang a également déclaré que le secteur chinois de l'IA « ne peut pas rester éternellement un suiveur ».

Il a poursuivi : « Souvent, nous disons qu'il y a un écart d'un ou deux ans entre l'IA chinoise et l'IA américaine, mais le véritable écart se situe entre l'originalité et l'imitation. Si cela ne change pas, la Chine sera toujours un suiveur ».

Interrogé sur les raisons pour lesquelles le modèle de DeepSeek a surpris tant de monde dans la Silicon Valley, M. Liang a déclaré : « Leur surprise vient du fait qu'une entreprise chinoise se joint à leur jeu en tant qu'innovateur, et pas seulement en tant que suiveur - ce à quoi la plupart des entreprises chinoises sont habituées. »

L'avantage concurrentiel de DeepSeek

DeepSeek affirme que son modèle, R1, a été développé à l'aide de technologies existantes et de logiciels libres qui peuvent être utilisés et partagés gratuitement par tout le monde.

Mais le magazine WIRED rapporte que le fonds spéculatif du fondateur de DeepSeek, Liang Wenfeng, High-Flyer, a stocké les puces qui forment l'épine dorsale de l'intelligence artificielle, connues sous le nom de GPU, ou unités de traitement graphique. Selon le MIT Technology Review, le nombre de puces qu'il a acquises varie entre 10 000 et 50 000.

Ces puces sont essentielles pour construire de puissants modèles d'IA capables d'effectuer toute une série de tâches humaines, depuis la réponse à des questions élémentaires jusqu'à la résolution de problèmes mathématiques complexes.

En septembre 2022, les États-Unis ont interdit la vente de ces puces plus puissantes à la Chine, une décision qualifiée de « principal défi », a déclaré M. Liang lors d'entretiens avec des médias chinois.

Les principaux modèles d'IA en Occident utilisent environ 16 000 puces spécialisées. DeepSeek affirme avoir entraîné son modèle d'IA, R1, à l'aide de 2 000 puces de ce type et de milliers de puces de qualité inférieure, ce qui rend son produit moins cher. Selon ses concepteurs, le chatbot n'a coûté que 5,6 millions de dollars, alors que le fabricant de ChatGPT, OpenAI, a dépensé à lui seul 5 milliards de dollars l'année dernière.

Certains, dont le milliardaire américain de la technologie Elon Musk, ont mis en doute cette affirmation, arguant que l'entreprise ne peut pas révéler le nombre de puces avancées qu'elle a réellement utilisées compte tenu des restrictions.

Mais les experts estiment que l'interdiction de Washington a apporté à l'industrie chinoise de l'IA à la fois des défis et des opportunités.

Elle a « forcé des entreprises chinoises comme DeepSeek à innover » pour pouvoir faire plus avec moins, explique Marina Zhang, professeure associée à l'université de technologie de Sydney.

« Si ces restrictions posent des problèmes, elles ont également stimulé la créativité et la résilience, s'alignant ainsi sur les objectifs politiques plus larges de la Chine visant à atteindre l'indépendance technologique. »

La deuxième économie mondiale a investi massivement dans les grandes technologies, qu'il s'agisse des batteries qui alimentent les véhicules électriques, des panneaux solaires ou de l'intelligence artificielle.

L'ambition du président Xi Jinping est depuis longtemps de faire de la Chine une superpuissance technologique, de sorte que les restrictions imposées par Washington constituent également un défi que Pékin a relevé.


  • L'IA pourrait-elle contribuer à prévenir la perte de vision liée au diabète ?
  • L'IA peut-elle raconter de meilleures blagues que les humains ?

Avis mitigés

Après son lancement, DeepSeek a déclenché une vente massive des principales valeurs technologiques.

Les actions de Nvidia, par exemple, avaient plongé de 17 % à la fermeture des marchés américains lundi - une perte de 600 milliards de dollars en valeur de marché qui, selon Bloomberg, est la plus forte baisse de l'histoire du marché boursier américain.

L'investisseur en capital-risque Marc Andreessen a décrit « DeepSeek-R1 comme le moment Spoutnik de l'IA », a-t-il posté sur X dimanche, en référence au satellite qui a donné le coup d'envoi de la course à l'espace.

Mais l'application chinoise a également suscité de nombreuses inquiétudes.

Je pense toujours que la vérité se trouve sous la surface en ce qui concerne ce qui se passe réellement », a déclaré l'analyste chevronné Gene Munster à la BBC, faisant allusion aux données financières citées par DeepSeek. Il s'est également demandé si la startup était subventionnée ou si les chiffres communiqués étaient exacts.

« Le chatbot est étonnamment bon, ce qui le rend difficile à croire », a-t-il ajouté.

Le ministre australien des sciences, Ed Husic, a évoqué des problèmes de sécurité. « Il y a beaucoup de questions auxquelles il faudra répondre à temps sur la qualité, les préférences des consommateurs, les données et la gestion de la vie privée », a-t-il déclaré à ABC. « Je serais très prudent à ce sujet. Ces types de questions doivent être évalués avec soin.

La semaine dernière, Sam Altman, d'OpenAI, et Larry Ellison, d'Oracle, se sont joints au président Donald Trump pour annoncer Stargate, une coentreprise qui promet jusqu'à 500 milliards de dollars d'investissements privés dans l'infrastructure de l'IA : des centres de données au Texas et au-delà, ainsi que la création de 100 000 nouveaux emplois.

Mais avec un autre acteur de poids dans le jeu de l'IA, certains experts pensent que l'arrivée soudaine de DeepSeek pourrait soulever des questions sur l'avenir de la domination américaine en matière d'IA et sur l'ampleur des investissements prévus par les entreprises américaines.


  • La version améliorée de ChatGPT enseigne les mathématiques et le flirt - mais elle a encore des ratés
  • L'intelligence artificielle peut-elle profiter à la démocratie ?
  • Comment détecter les escroqueries aux offres d'emploi sur WhatsApp et que faire pour les éviter