Karpathy rejoint Anthropic en tant que responsable de la recherche en pré-entraînement

Le 19 mai, Andrej Karpathy a annoncé sur X qu’il rejoignait Anthropic, précisant que « les prochaines années seront une période cruciale pour l’avancement de la recherche sur les grands modèles de langage » et exprimant sa grande excitation à l’idée de « retourner au travail de recherche ». Selon TechCrunch, Karpathy a officiellement commencé chez Anthropic cette semaine, intégrant l’équipe de pré-entraînement dirigée par Nick Joseph. L’entreprise a indiqué qu’il mettrait en place une nouvelle équipe dédiée à l’accélération de la recherche en matière de pré-entraînement pour Claude – étape essentielle permettant d’imprégner le modèle de connaissances et de compétences fondamentales, tout en étant la phase la plus coûteuse et la plus gourmande en ressources du développement des grands modèles. TechCrunch souligne que Karpathy fait partie des « rares chercheurs capables de relier la théorie des LLM à leur mise en pratique à grande échelle » ; ce recrutement illustre la stratégie d’Anthropic visant à miser sur la recherche assistée par l’IA – plutôt que sur un simple accroissement des capacités de calcul – afin de conserver son avance face à OpenAI et Google.

Co-fondateur d’OpenAI, Karpathy s’est consacré de 2015 à 2017 à la recherche en apprentissage profond et en vision par ordinateur, avant de rejoindre Tesla où il a piloté les projets Autopilot et FSD jusqu’en 2022. Il est ensuite revenu brièvement chez OpenAI pendant un an, puis a quitté l’entreprise en 2024 pour créer Eureka Labs, une startup spécialisée dans la formation en IA. Grâce à des cours publics tels que « Neural Networks: Zero to Hero » et à sa chaîne YouTube, il jouit d’une grande notoriété auprès des développeurs. Il affirme « nourrir toujours une passion profonde pour l’enseignement et prévoit de poursuivre dans cette voie », même si l’avenir d’Eureka Labs reste incertain. Le même jour, Anthropic a également annoncé l’arrivée de Chris Rohlf, vétéran de la cybersécurité ayant travaillé au sein des équipes de sécurité « Paranoid » de Yahoo et chez Meta : il intégrera l’équipe Red Team avancée et se concentrera sur l’utilisation de l’IA pour renforcer la défense cybernétique.

TechCrunch | X / Karpathy