L’intelligence artificielle remodèle les industries à un rythme effréné, mais peu de transitions ont été aussi audacieuses – ou aussi réussies – comme celle réalisée par Deepseek. Né de la puissance de trading quantitative, Deepseek est devenu un leader dans la recherche sur l’IA. Mais comment l’ont-ils fait? Qu’est-ce qui a fait leur pivot des marchés financiers à l’intelligence générale artificielle (AGI) non seulement plausible, mais un succès record? Voici une plongée profonde dans la stratégie, l’infrastructure et la vision qui les distinguent.
High-Flyer n’a jamais été juste un autre hedge fund. À son apogée, il a réussi presque 100 milliards de yuan (environ 13,79 milliards de dollars) L’utilisation du trading algorithmique qui reposait fortement sur l’intelligence artificielle. L’entreprise avait toujours été à la pointe, tirant parti d’un apprentissage automatique avancé pour le trading à haute fréquence. Mais d’ici 2023, le haut-voleur a vu l’écriture sur le mur – le potentiel de l’ai s’étendait bien au-delà des marchés financiers.
Au lieu de simplement affiner les algorithmes commerciaux, ils sont allés dans AGI. Le résultat? En profondeurun laboratoire de recherche dédié s’est concentré sur la poussée de l’IA au-delà des tâches étroites et dans l’intelligence plus large de niveau humain.
Comment Deepseek a provoqué la plus grande vente technologique de l’histoire
Le bord de Deepseek se résume à puissance de calcul brute. Des années avant le boom mondial de l’IA, le voleur élevé avait déjà stocké des GPU haute performance pour ses opérations commerciales. Ces investissements se sont avérés être l’arme secrète de Deepseek.
- Premier cluster IA (2020): construit avec 1 100 GPU NVIDIA A100 à un coût de 200 millions de yuans.
- Deuxième cluster AI (2021): élargi avec 10 000 GPU NVIDIA A100poussant leurs capacités de formation d’IA à un nouveau niveau.
- Au-delà de A100: Aujourd’hui, Deepseek s’appuie sur un mélange de puces NVIDIA H800 et d’architectures potentiellement encore plus avancées, bien que les détails restent non divulgués.
En sécurisant cette infrastructure avant Les restrictions d’exportation américaines sur les puces d’IA haut de gamme, Deepseek se sont isolées des perturbations mondiales de la chaîne d’approvisionnement – un mouvement qui leur a donné un avantage essentiel sur les concurrents qui se précipitent pour le matériel.
Comment Deepseek a optimisé son développement de l’IA
La stratégie de Deepseek est un Masterclass en allocation des ressources et réflexion sur l’IA-First. Voici ce qui les distingue:
1. Réutilisation des infrastructures commerciales
Deepseek n’avait pas besoin de partir de zéro. Les mêmes grappes GPU qui ont autrefois alimenté le trading à haute fréquence ont été transférées de manière transparente en formation de modèle d’IA. Cela signifiait un saut zéro à un sans coûts initiaux massifs.
2. Investir agressivement dans les talents de l’IA
Ils n’ont pas seulement acheté des GPU – ils a apporté le cerveau pour correspondre. Deepseek a recruté de manière agressive les meilleurs chercheurs d’IA des universités d’élite chinois et des entreprises mondiales d’IA, créant un groupe de réflexion dédié à l’AGI.
3. Expériences AI à grande échelle
La construction d’un modèle d’IA de pointe ne consiste pas à exécuter un seul processus de formation. C’est à peu près itération, expérimentation et échec. Deepseek consacre à Quatre fois la puissance de calcul pour la recherche comme pour le déploiement du modèle final. Cet engagement à expérimenter alimente les percées.
4. Une stratégie à double usage
Même si Deepseek avance AGI, High-Flyer continue d’affiner ses modèles financiers. La synergie entre les deux permet de tester les modèles d’IA dans des applications financières du monde réel, donnant à Deepseek un bord pratique Ce peu de laboratoires AI purs peuvent correspondre.
La force motrice derrière Deepseek
Rien de tout cela ne serait possible sans un leader avec le Vision et appétit des risques Parié grand sur l’IA. Ce leader est Liang Wenfengle fondateur et l’actionnaire de contrôle de haut vol.
Alors que beaucoup de finances voient l’IA comme un outil, Wenfeng l’a vu comme le avenir de tout. Sous sa direction, Deepseek n’essaie pas seulement de rivaliser avec Openai et Google Deepmind– Ils visent à les sauter en développant IA qui peut effectuer des tâches économiquement précieuses aux niveaux humain ou surhumain.
Quelle est la prochaine étape pour Deepseek?
Deepseek ne ralentit pas. Voici où ils se dirigent:
- Échec de la formation sur l’IA: Attendez-vous à des grappes GPU plus grandes, à une puissance plus de calcul et à des modèles d’IA encore plus ambitieux.
- Repousser les limites AGI: Contrairement à la plupart des laboratoires d’IA se sont concentrés sur les progrès incrémentiaux, Deepseek s’est engagé à AGI de bout en bout– pas juste des chatbots plus intelligents mais ai que cela peut Raison, apprendre et s’adapter de manière autonome.
- Isolement: Alors que certaines entreprises d’IA gardent leurs recherches, Deepseek a laissé entendre plus open source, approche collaborativepotentiellement accélérer le développement mondial de l’IA.
La montée fério de Deepseek est un Étude de cas pour saisir des opportunités. Ils ne se sont pas contentés de ne pas avoir été en IA; ils Je parie que la maison dessus. En utilisant simplement les infrastructures commerciales existantes, en obtenant des GPU hautes performances avant le CHIP Crunch mondial et en créant une équipe de recherche sur l’IA de classe mondiale, Deepseek s’est fait comme un concurrent sérieux dans la course AGI.
Les entreprises qui gagnent dans l’IA ne seront pas celles qui attendent les percées – ce seront celles qui les créeront.