Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Claude AI se classe dans le top 3% au concours de piratage des étudiants

byEmre Çıtak
août 6, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Selon un exclusif Axios Rapport, le modèle de grande langue Claude d’Anthropic a toujours surpassé la plupart des concurrents humains dans les scénarios de piratage des étudiants avec un soutien externe minimal. Cette capacité a été présentée lors de diverses compétitions avant une présentation Def Con.

Les pirates en équipe rouge d’Anthropic ont noté le succès de Claude. Keane Lucas, membre de l’équipe, est initialement entrée dans Claude dans PicoCTF de Carnegie Mellon. Lucas a indiqué qu’il avait simplement collé le premier défi directement dans Claude.ai. Claude a nécessité un téléchargement d’outil tiers pour un seul aspect, mais a ensuite résolu le problème. Claude a obtenu un haut Classement de 3% Dans PICOCTF, qui est un concours significatif de capture-the-FLAG pour les étudiants en se concentrant sur l’ingénierie inverse, les violations du système et le décryptage des fichiers.

Lucas a en outre testé Claude, utilisant Claude.ai et Claude Code, avec Sonnet 3.7 comme modèle. L’assistance de l’équipe rouge était limitée, principalement pour les installations logicielles. Dans une compétition, Claude a résolu 11 des 20 défis dans 10 minutes. Un supplément 10 minutes a conduit à cinq autres solutions, augmentant son rang à la quatrième place. L’ascension de Claude à la première place dans cette compétition a été manquée parce que Lucas n’était pas disponible à l’heure de début.

La performance des agents de l’IA dans la cybersécurité offensive augmente. Dans le concours Hack the Box, Cinq des huit équipes d’IAy compris Claude, terminé 19 des 20 défisalors que seulement 12% des équipes humaines A réalisé les 20 ans. La semaine dernière, XBow, un agent d’IA soutenu par DARPA, a atteint la première position du classement Global Bugy Bounty de Hackerone. Lucas a déclaré: «Le rythme est un peu ridicule.»

Malgré les succès, Claude a rencontré des difficultés avec des défis en dehors de ses paramètres attendus. Dans un défi de la compétition collégiale régionale de la cyber-défense occidentale, Claude n’a pas réussi à traiter une animation de poisson ASCII dans le terminal. Lucas a noté: «Un humain peut contrôler + C et le faire s’arrêter», mais Claude «obtient juste l’amnésie». Toutes les équipes de l’IA, y compris Claude, sont restées coincées sur le défi final Hack the Box, les organisateurs notant: «Pourquoi les agents ont échoué ici est encore incertain.»

L’équipe rouge d’Anthropic exprime que la communauté de la cybersécurité n’a pas pleinement évalué les progrès des agents de l’IA dans les tâches de sécurité offensive et le potentiel de leur utilisation dans les stratégies défensives. Logan Graham, chef de l’équipe de Red Frontier d’Anthropic, a informé Axios« Il semble vraiment probable dans un avenir très proche, les modèles obtiendront beaucoup, beaucoup mieux dans les tâches de cybersécurité. » Il a souligné: «Vous devez également commencer à obtenir des modèles pour faire les défenses.» Anthropic suggère que les employés entièrement de l’IA pourraient être présents dans un délai d’un an, selon un rapport.


Crédit d’image en vedette

Tags: AnthropiqueclaudeEn vedette

Related Posts

Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"

décembre 26, 2025
ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage

décembre 26, 2025
Google NotebookLM présente "Mode conférence" pour un apprentissage de l’IA de 30 minutes

Google NotebookLM présente "Mode conférence" pour un apprentissage de l’IA de 30 minutes

décembre 26, 2025
Surveillance des stocks : mises à jour Nvidia, Samsung, AMD et Intel (26 décembre)

Surveillance des stocks : mises à jour Nvidia, Samsung, AMD et Intel (26 décembre)

décembre 26, 2025
Un an à Tiangong : la Chine testera un séjour spatial de longue durée en 2026

Un an à Tiangong : la Chine testera un séjour spatial de longue durée en 2026

décembre 26, 2025
5 applications Mac essentielles pour transformer votre productivité en 2026

5 applications Mac essentielles pour transformer votre productivité en 2026

décembre 26, 2025

Recent Posts

  • Le PDG de MicroStrategy explique les fondamentaux du Bitcoin "ça ne pourrait pas être mieux"
  • ChatGPT évolue vers une suite bureautique avec de nouveaux blocs de formatage
  • Google NotebookLM présente "Mode conférence" pour un apprentissage de l’IA de 30 minutes
  • Surveillance des stocks : mises à jour Nvidia, Samsung, AMD et Intel (26 décembre)
  • Un an à Tiangong : la Chine testera un séjour spatial de longue durée en 2026

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.