p Seek accélère le lancement d’un nouveau modèle d’IA au milieu de la volatilité des investissements chinois
ARTA – La start-up chinoise, DeepSeek, se prépare à lancer une nouvelle génération de modèles d’intelligence artificielle (IA), R2, plus rapidement que prévu. Selon certaines sources familières sur les opérations de l’entreprise, le lancement, initialement prévu pour mai, est maintenant accéléré, bien qu’il n’y ait aucun détail détaillé sur la date de sortie.
de cette décision intervient après le modèle précédent, le DeepSeek R1, qui a secoué le marché mondial avec des performances supérieures à de nombreux modèles d’IA occidental, bien qu’il soit construit sur des puces Nvidia avec une puissance informatique inférieure. Le lancement du R1 a même déclenché une baisse de la valeur marchande de plus de 1 000 milliards de dollars dans divers secteurs de la technologie.
Seek est sous le feu des projecteurs pour sa approche différente par rapport à d’autres géants de la technologie chinois. Fondé par Liang Wenfeng, un ancien gestionnaire de fonds quantitatifs connu pour être fermé, DeepSeek est plus axé sur la recherche que les entreprises commerciales en général.
ang, né au Guangdong en 1985, diplômé en génie de communication de l’Université de Zhejiang, gère DeepSeek avec une structure de gestion plus platte. La culture de travail de cette entreprise diffère de l’industrie technologique chinoise, bien connue pour son système hiérarchique et sa culture de travail « 966 » (travaillant de 9h à 9h, six jours par semaine). À DeepSeek, les employés, y compris les nouveaux diplômés, ont le contrôle total de leurs projets avec des heures de travail plus flexibles.
» Liang nous a donné toute confiance et nous a traités comme des experts dans leurs domaines respectifs », a déclaré Benjamin Liu, chercheur de 26 ans qui avait travaillé chez DeepSeek. « J’ai toute la liberté dans le développement de parties importantes de leur système d’IA. »
, au lieu de se concentrer sur le développement d’applications basées sur l’IA telles que Baidu et Tencent, DeepSeek préfère améliorer la qualité de leurs modèles d’IA. Cette stratégie s’est avérée réussie, car leur modèle R1 peut rivaliser avec les modèles d’IA de classe mondiale à un coût beaucoup plus faible.
p Seek peut se développer grâce à l’investissement massif de High-Flyer, une société de financement quantitatif appartenant à Liang. Depuis 2020, High-Flyer consacre environ 70% de ses opinions à la recherche d’IA et à la construction de deux clusters de superordinateurs. L’un d’eux, Fire-Flyer II, possède 10 000 puces Nvidia A100 et joue un rôle important dans le développement de leurs derniers modèles d’IA.
an, en particulier, la décision d’investir considérablement dans le calcul de l’IA a suscité l’attention des régulateurs chinois, en raison de l’accumulation massive de puces. Cependant, les autorités n’ont finalement pas intervenu, une décision qui s’est avérée cruciale lorsque les États-Unis ont imposé une interdiction sur les puces A100 à la Chine en 2022.
akibak est désormais très favorable au gouvernement chinois et a même demandé à l’entreprise d’être humble dans son interaction avec les médias afin d’éviter une attention excessive des pays occidentaux.
amphétamine : l’un des principaux facteurs du succès de DeepSeek est sa approche de concepter une architecture d’IA plus efficace. Leur modèle utilise des techniques de mixage des experts (MoE) et d’attention latente à plusieurs chefs (MLA), qui permettent le traitement des données avec une consommation de puissance informatique plus faible. Cette approche rend les prix des services de DeepSeek 20 à 40 fois moins chers que OpenAI, selon les analystes chez Bernstein.
Cependant, le succès de DeepSeek soulève également des inquiétudes dans l’Occident. Plusieurs pays, dont la Corée du Sud et l’Italie, ont supprimé l’application DeepSeek de leurs magasins d’applications nationaux en raison de problèmes de confidentialité. Pendant ce temps, plusieurs entrepreneurs d’IA en Occident, dont le PDG de Scale AI, Alexandr Wang, ont accusé DeepSeek de posséder jusqu’à 50 000 puces Nvidia de première qualité qui sont interdites d’exporter vers la Chine, bien qu’il n’y ait aucune preuve concrète de ces affirmations.
coin a maintenant été adopté par diverses entités gouvernementales et entreprises chinoises, dont 13 gouvernements municipaux et 10 entreprises énergétiques appartenant à l’État. Les géants de la technologie tels que Labow, Baidu et Tencent ont également intégré des modèles DeepSeek dans leurs produits.
chinois considère DeepSeek comme une preuve que son pays est en mesure de rivaliser avec la domination mondiale de l’IA, en particulier dans le contexte des tensions commerciales et des embargos technologiques imposés par les États-Unis.
in, les concurrents de DeepSeek en Occident ont commencé à ajuster leurs stratégies. OpenAI a récemment réduit les prix de leurs services, tandis que Google Gemini a introduit des colis d’abonnement moins chers. DeepSeek encourage également l’innovation dans l’industrie de l’IA, certaines entreprises ayant commencé à adopter leurs approches plus économiques.
Avec le projet d’accélérer le lancement du R2, le monde attend maintenant de voir comment DeepSeek continuera d’exprimer l’industrie mondiale de l’intelligence artificielle.