Etched AI fait des vagues dans le secteur technologique avec son projet ambitieux de créer une puce IA qui n’exécute qu’un seul type de modèle, la puce Sohu.
Cette approche innovante est incarnée dans leur puce Sohu, spécialement conçue pour les transformateurs, un modèle dominant en IA générative. Les fondateurs, Gavin Uberti et Chris Zhu, ainsi que leur équipe, parient sur une conception ciblée et rationalisée pour repousser les limites des performances des puces IA.
Laissez-nous vous présenter le parcours d’Etched AI et les aspects uniques de leur puce Sohu.
Apprenez à connaître Etched AI
IA gravéeLa création de est ancrée dans la vision de deux décrocheurs de Harvard, Gavin Uberti et Chris Zhu, qui ont vu une opportunité de révolutionner le matériel d’IA. Avec Robert Wachen et l’ancien CTO de Cypress Semiconductor Mark Ross, ils ont fondé Etched AI en 2022.
Leur objectif était de répondre à un besoin spécifique de l’industrie de l’IA : créer une puce qui excelle dans l’exécution de modèles de transformateurs.
Contrairement à de nombreuses puces IA conçues à des fins générales, la puce Sohu est un circuit intégré spécifique à une application (ASIC) axé uniquement sur les transformateurs.
L’importance des transformateurs dans le paysage de l’IA ne peut être surestimée. Depuis leur introduction par les chercheurs de Google en 2017, les transformateurs sont devenus l’épine dorsale de nombreux modèles d’IA générative. Ceux-ci incluent le modèle de génération vidéo d’OpenAI Sorades générateurs de texte comme celui d’Anthropic Claude et celui de Google Gémeauxet des générateurs d’art tels que Diffusion stable.
Reconnaissant le pouvoir de transformation des transformateurs, Etched AI a décidé de concentrer tous ses efforts sur l’optimisation de sa puce pour ce modèle particulier.
Qu’est-ce qui distingue la puce Sohu ?
La puce Sohu témoigne de l’engagement d’Etched AI en faveur de la spécialisation. Construit à l’aide du processus 4 nm de TSMC, Sohu promet d’offrir des performances d’inférence exceptionnelles tout en consommant moins d’énergie que les GPU traditionnels.
D’après l’entretien d’Uberti avec Le bordSohu est nettement plus rapide et plus rentable que la nouvelle génération de Nvidia GPU Blackwell GB200 lorsqu’il s’agit d’exécuter des transformateurs de texte, d’image et de vidéo. Il affirme qu’un serveur Sohu peut remplacer 160 GPU H100, positionnant Sohu comme une solution hautement efficace et respectueuse de l’environnement.
La clé de la performance de Sohu réside dans son pipeline matériel et logiciel rationalisé. En se concentrant exclusivement sur les transformateurs, l’équipe de conception a pu éliminer les composants inutiles et réduire les coûts logiciels. Cette focalisation permet à la puce Sohu de fonctionner avec plus d’efficacité et de rapidité, offrant une solution spécialisée sur un marché dominé par les GPU à usage général. Cette approche aborde également les La consommation électrique croissante de l’IA et les préoccupations en matière d’impact environnemental associées à l’exécution de modèles d’IA à grande échelle.
En proposant une puce à la fois plus rapide et plus économe en énergie, Etched AI vise à atténuer certains de ces défis environnementaux, présentant Sohu comme une alternative viable pour les entreprises cherchant à réduire leur empreinte carbone.
La position sur le marché est l’obstacle
Le parcours d’Etched AI se déroule sur un marché hautement concurrentiel, où la domination d’entreprises comme Nvidia est formidable. Nvidia contrôle une part importante du marché des puces IA, les principaux fournisseurs de cloud comme Meta et Microsoft investissant massivement dans leurs GPU. Cependant, le recours à un fournisseur unique a suscité chez les fournisseurs d’IA générative et les investisseurs en capital-risque le désir de rechercher des solutions alternatives.
Etched AI se démarque parmi de nombreuses startups en se concentrant sur un seul type de modèle d’IA. Alors que d’autres sociétés comme Meta et Amazon ont développé leurs puces d’inférence, la proposition de vente unique d’Etched AI est sa spécialisation dans les transformateurs. Cette niche a attiré des investissements importants, avec Etched a récemment clôturé un cycle de financement de série A de 120 millions de dollars, portant le total levé à 125,36 millions de dollars..
Des investisseurs de premier plan, notamment :
- Pierre Thiel
- Thomas Dohmke, PDG de GitHub
- Charlie Cheever, co-fondateur de Quora
ont montré leur confiance dans le potentiel d’Etched AI.
Malgré les défis, notamment la possibilité de nouveaux concurrents et l’évolution des préférences des modèles d’IA, Etched AI est optimiste quant à son avenir. Ils se préparent à lancer Sohu Developer Cloud, une plateforme en ligne permettant aux clients de prévisualiser les capacités de Sohu, ce qui devrait susciter davantage d’intérêt et de ventes.
Le succès d’Etched AI dépendra de sa capacité à augmenter la production et à répondre à la demande de puces IA efficaces et spécialisées. Uberti estime que l’avenir de la technologie de l’IA dépend de la disponibilité d’une infrastructure plus rapide et plus efficace. Ses affirmations audacieuses sur les capacités de Sohu et la stratégie de marché agressive de l’entreprise soulignent l’engagement d’Etched AI à façonner l’avenir du matériel d’IA.
Crédit image en vedette: IA gravée