Dans le paysage dynamique de l’intelligence artificielle, la poursuite d’une intégration transparente entre les humains et la technologie constitue un objectif primordial. L’ambition est de rendre les interactions si naturelles que l’utilisation des technologies de pointe devient une seconde nature. Pour explorer vers quoi l’industrie se dirige ici, j’ai parlé à l’un des intervenants de notre Epic AI Dev Summit, Ou Gorodissky, vice-président de la recherche et du développement de la société D-ID, co-organisatrice du sommet. Or est un expert des technologies Natural User Interface (NUI) et développe l’IA générative chez D-ID depuis 2018.
Alex : Quelle est la vision fondamentale derrière le développement de l’interface utilisateur naturelle (NUI) et comment contribue-t-elle au paysage plus large des agents d’IA ?
Ou : La vision derrière le développement de l’interface utilisateur naturelle (NUI) est de révolutionner la façon dont les gens interagissent avec la technologie. NUI représente un progrès significatif par rapport aux interfaces précédentes, notamment GUI (Graphical User Interface), mettant l’accent sur les conversations naturelles en face-à-face avec les entités numériques. Notre objectif est de supprimer la souris et le clavier et de les remplacer par une interface qui vous permet de « parler » directement avec vos appareils, face à face, comme vous le feriez avec un autre être humain. Cette approche humanise les interactions numériques, les rendant plus accessibles, intuitives et inclusives. Il comble efficacement le fossé entre les domaines humain et numérique, améliorant ainsi l’engagement et la satisfaction des utilisateurs dans un large éventail de secteurs d’activité.
Alex : Quelles sont les avancées futures en matière d’IA et de génération vidéo qui vous enthousiasment le plus, et comment envisagez-vous que l’industrie se prépare à ces changements à venir ?Ou : Les avancées futures les plus passionnantes en matière d’IA et de génération vidéo concernent la création d’interfaces plus immersives, humaines et engageantes. Avec des technologies telles que l’avatar Persona d’Apple dans son VisionPro, les agents interactifs en temps réel de D-ID et le générateur texte-vidéo de Runway, l’industrie s’oriente vers un mode de communication plus interactif et plus réaliste. Cette évolution verra probablement toutes les entreprises tirer parti de ces produits d’IA générative pour améliorer l’interaction client. Je pense que se préparer à ces changements implique de rester à jour avec les évolutions technologiques, d’investir en R&D et de s’assurer que ces nouveaux outils sont accessibles et adaptables aux multiples besoins des entreprises.
Alex : Quels sont les obstacles rencontrés lors de la création de contenu vidéo généré par l’IA et les solutions potentielles qui peuvent être appliquées universellement ?
Ou : Créer des vidéos de haute qualité à l’aide de l’IA est toujours considéré comme une tâche difficile. Tous les problèmes n’ont pas été résolus et l’élaboration de solutions peut prendre du temps. De nombreuses entreprises ont du mal à produire des vidéos non seulement cohérentes dans le temps et à haute résolution, mais également créées avec une faible latence ou un débit élevé, tout en maîtrisant les coûts de calcul.
C’est un défi de diriger une entreprise de manière à garantir que les feuilles de route techniques et produits innovent et fournissent des produits percutants. Pour surmonter ce problème, nous nous concentrons sur les cycles d’innovation et d’amélioration, en donnant la priorité aux efforts efficaces et en construisant stratégiquement vers les capacités futures. L’accent mis sur la conception centrée sur l’utilisateur et l’exploitation des solutions existantes pour les aspects non essentiels contribuent à rationaliser le processus.
Alex : L’intégration des technologies d’IA dans les systèmes et plateformes existants est souvent complexe. Comment la technologie de D-ID s’intègre-t-elle aux systèmes et plates-formes existants, et quels sont les défis de ces intégrations ?
Ou : la technologie de D-ID s’intègre aux systèmes et plates-formes existants grâce à son API avancée, conçue pour être flexible et conviviale. Cette API permet une intégration transparente de nos capacités d’IA, permettant aux entreprises de personnaliser leurs expériences d’IA et de les aligner sur des besoins et des publics spécifiques. Selon nous, le principal défi de ces intégrations est d’assurer la compatibilité et de maintenir l’équilibre entre sophistication technologique et expérience utilisateur. Notre approche vise à rendre ces intégrations aussi intuitives et simples que possible, en fournissant des outils et des solutions qui adaptent nos capacités aux besoins uniques de chaque utilisateur.
Alex : Il est crucial de garder une longueur d’avance dans le domaine en évolution rapide de l’IA. Quelles stratégies générales les entreprises devraient-elles adopter pour rester à la pointe de la technologie de l’IA ?
Ou : Eh bien, il est risqué de s’appuyer uniquement sur la supériorité technique, car tout ce que vous construisez finira par devenir une marchandise. Cela peut prendre un certain temps, voire des années si vous avez de la chance, mais vous ne dormirez pas beaucoup si, chaque fois qu’un nouveau document de recherche paraît, vous remettez en question votre stratégie commerciale.
Essayez plutôt d’être axé sur le laser et centré sur l’utilisateur. Doublez la mise sur les éléments qui apportent de la valeur et exploitez les solutions existantes lorsque la valeur ne justifie pas l’effort. La technologie en elle-même n’est pas une solution miracle. Assurez-vous que les aspects produit et commerciaux sont constamment pris en compte pour garantir que vos efforts sont les plus efficaces.
Vous souhaitez que vos utilisateurs restent avec vous même lorsque la prochaine grande solution open source sortira. Pensez-y lorsque vous choisissez où investir votre attention.
Alex : Les considérations éthiques sont cruciales dans le développement de l’IA. Comment pensez-vous que l’industrie devrait garantir des pratiques éthiques dans la création et le déploiement de technologies d’IA ?
Ou : Oui, bien sûr, les pratiques éthiques doivent être une pierre de touche constante pour les développeurs d’IA. Cela signifie garantir un engagement en faveur de la transparence, du respect de la vie privée et du respect des normes éthiques. Je pense que les entreprises devraient travailler en étroite collaboration avec des experts en protection de la vie privée et des éthiciens pour établir et suivre des lignes directrices strictes. Des audits et une modération réguliers, ainsi que des collaborations avec les organismes de réglementation, peuvent garantir un développement responsable de l’IA. De plus, la mise en œuvre de systèmes de suivi, de filigranes et d’outils de modération de contenu peut contribuer à atténuer les abus. Il est crucial que les leaders de l’industrie donnent l’exemple, en créant une culture d’utilisation éthique de l’IA qui équilibre l’innovation avec la responsabilité et la confiance du public.
Alex : Pourriez-vous partager une réussite mémorable ou un cas d’utilisation particulièrement innovant de la technologie D-ID en action ?
Radio Fórmula, une entité médiatique renommée du réseau mexicain Grupo Fórmula, a exploité la technologie de D-ID pour créer des présentateurs d’informations générés par l’IA, révolutionnant ainsi leur approche de diffusion d’informations. Cette collaboration a conduit à une augmentation notable de l’engagement d’un public plus jeune, démontrant la fusion percutante des médias traditionnels avec la technologie avancée de l’IA. Pour une exploration détaillée de cette entreprise innovante, vous pouvez lire l’étude de cas complète sur le site Web de D-ID : Étude de cas Radio Fórmula et D-ID.
Le 30 janvier 2024, Or partagera davantage de ses idées sur NUI lors de notre Epic AI Dev Summit, en présentant son exposé « Crafting AI agents with a natural user interface ». Agenda complet et inscription ici!