AKARTA - Le développeur chinois d’intelligence artificielle (IA), DeepSeek, a publié son dernier modèle « expérimental ». Ce modèle est censé être plus efficace dans la formation et mieux traité dans les ordres de texte longs que les modèles précédents.
an, basée à Hangzhou, a nommé le modèle DeepSeek-V3.1-Exp, et l’a qualifié de « étape entre vers l’architecture de prochaine génération » dans un post sur le forum des développeurs Hugging Face.
in, qui a été créé, est probablement le lancement du produit le plus important de DeepSeek depuis les modèles V3 et R1 qui ont surpris la Silicon Valley et les investisseurs technologiques en dehors de la Chine.
Metadata V3.1-Exp est équipé d’un mécanisme appelé DepSeek Save Attention, qui, selon la société, peut réduire les coûts de calcul tout en améliorant les performances du modèle en plusieurs sens. Dans un post sur la plate-forme X le lundi 29 septembre, DeepSeek a également annoncé qu’il réduisait les prix des applications d’application de plus de 50%.
Bien que l’architecture de la nouvelle génération de DeepSeek ne devrait pas alourdir le marché comme la version précédente en janvier, son succès pourrait encore exercer une pression majeure sur les concurrents nationaux tels que les Qwen d’Alibaba, ainsi que sur les joueurs internationaux comme OpenAI, si DeepSeek sera à nouveau en mesure d’afficher de haute performance à un coût beaucoup plus faible que ses concurrents.
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)