Le nouveau d’OpenAI introduit L’échelle interne vise à évaluer systématiquement les progrès et les capacités de ses systèmes d’IA :
Niveau | Capacités |
Niveau 1 | S’engage dans des tâches conversationnelles simples, similaires aux chatbots actuels comme ChatGPT |
Niveau 2 | Résout des problèmes de base au niveau d’un titulaire de doctorat |
Niveau 3 | Prend des mesures au nom des utilisateurs, démontrant ainsi leur utilité pratique |
Niveau 4 | Crée des solutions et des innovations nouvelles, faisant preuve de créativité et d’adaptabilité |
Niveau 5 | AGI – Effectue des tâches équivalentes à celles d’organisations entières, surpassant les performances humaines dans diverses tâches |
Cette échelle, allant du niveau 1 au niveau 5, vise à suivre la progression vers la réalisation Intelligence artificielle générale (AGI) — le Saint Graal du développement de l’IA où les machines présentent des capacités cognitives similaires à celles des humains.
Comprendre les cinq niveaux de développement de l’IA d’OpenAI
Voici une description détaillée de la manière dont chaque niveau est défini et des critères utilisés pour évaluer la puissance des systèmes d’IA :
Niveau 1 : IA conversationnelle de base
Les systèmes d’IA à ce niveau peuvent s’engager dans des tâches conversationnelles simples, semblables aux chatbots actuels comme ChatGPT.
Critères d’évaluation:
- Compétences en traitement du langage naturel (TALN):Capacité à comprendre et à générer des réponses textuelles de type humain.
- Exécution des tâches de base:Exécution de tâches simples telles que répondre à des questions, fournir des informations et engager un dialogue de base.
- Compréhension contextuelle:Capacité limitée à maintenir le contexte lors d’une interaction courte
Niveau 2 : IA de résolution de problèmes avancée
Les systèmes d’IA à ce niveau sont capables de résoudre des problèmes de base au niveau d’une personne titulaire d’un doctorat.
Critères d’évaluation:
- Résolution de problèmes complexes:Capacité à aborder des problèmes académiques et théoriques dans des domaines spécifiques.
- Connaissances spécialisées:Profondeur de compréhension dans des domaines particuliers, démontrant une expertise similaire à celle d’un doctorat.
- Compétences analytiques:Compétence dans la réalisation d’analyses détaillées et la formulation de conclusions fondées.
Niveau 3 : IA d’action autonome
Les agents d’IA à ce niveau peuvent prendre des mesures autonomes au nom des utilisateurs.
Critères d’évaluation:
- Prise de décision:Capacité à prendre des décisions éclairées sur la base de données fournies et d’objectifs prédéfinis.
- Automatisation des tâches:Exécution de tâches sans intervention humaine, faisant preuve d’autonomie dans diverses applications.
- Interaction de l’utilisateur:Efficacité dans l’interaction avec les utilisateurs pour recueillir les informations nécessaires et effectuer les actions en conséquence.
Niveau 4 : IA innovante
Les systèmes d’IA à ce niveau peuvent créer de nouvelles innovations et faire preuve de créativité et d’adaptabilité.
Critères d’évaluation:
- Génération d’innovation:Capacité à développer des solutions et des idées nouvelles, originales et précieuses.
- Apprentissage adaptatif:Capacité à apprendre et à s’adapter à partir de nouvelles informations et expériences, en s’améliorant au fil du temps.
- Résolution créative de problèmes:Faire preuve d’ingéniosité dans l’approche et la résolution de problèmes complexes.
Niveau 5 : IA (Intelligence Artificielle Générale)
Le niveau final représente l’IA qui peut effectuer le travail d’organisations entières, surpassant les performances humaines dans les tâches les plus importantes sur le plan économique.
Critères d’évaluation:
- Large éventail de compétences:Maîtrise d’un large éventail de tâches et de domaines, démontrant polyvalence et connaissances approfondies.
- Valeur économique:Capacité à générer une valeur économique significative en effectuant des tâches complexes plus efficacement que les équipes humaines.
- Fonctionnement autonome:Degré élevé d’autonomie, gestion et exécution d’opérations à grande échelle sans surveillance humaine.
- Généralisation:Compétence dans l’application des connaissances et des compétences à des problèmes et des contextes inconnus, démontrant une véritable intelligence générale.
Comment OpenAI est-il si confiant quant à ces niveaux ?
Pour garantir l’exactitude et la fiabilité de son échelle de puissance d’IA, OpenAI prévoit de mener des évaluations internes rigoureuses de ses systèmes d’IA à travers plusieurs méthodes clés.
Tests de référence Il s’agit de tests standardisés conçus pour mesurer des capacités spécifiques et des indicateurs de performance alignés sur les critères de chaque niveau. Ces tests fournissent un cadre cohérent pour évaluer les systèmes d’IA, garantissant des évaluations objectives et identifiant les domaines à améliorer.
Avis d’expert fait appel à des experts du domaine pour évaluer les performances des systèmes d’IA dans des domaines spécialisés. Ces experts assurent des évaluations approfondies et précises, validant que l’IA répond aux normes élevées requises pour chaque niveau.
Scénarios du monde réel tester les systèmes d’IA dans des applications pratiques pour valider leur efficacité et leur fiabilité. Cette approche permet à OpenAI d’observer les performances des systèmes dans des environnements dynamiques, garantissant ainsi leur robustesse et leur utilité pratique.
Commentaires des utilisateurs Il s’agit de recueillir et d’analyser les retours d’expérience des utilisateurs qui interagissent avec les systèmes d’IA. Ces retours d’expérience permettent de mieux comprendre l’utilité pratique et la satisfaction des utilisateurs, en mettant en évidence les points forts et les domaines à améliorer.
En combinant ces méthodes, OpenAI vise à évaluer et vérifier en profondeur ses systèmes d’IA, en s’assurant qu’ils répondent aux critères de chaque niveau de l’échelle de puissance et en progressant vers l’obtention de l’intelligence artificielle générale (AGI).
Toutes les images sont générées par Eray Eliaçık/Bing