Agora, une plate-forme de premier plan pour les API d’engagement en temps réel, a annoncé la libération publique bêta de son moteur d’IA conversationnel, une étape significative vers les développeurs pour permettre aux développeurs de créer des expériences vocales sophistiquées et interactives. Cette nouvelle plate-forme est conçue pour combler l’écart entre les modèles AI avancés et la communication naturelle et naturelle humaine à machine.
L’objectif principal du moteur d’IA conversationnel est de fournir aux développeurs les outils nécessaires pour créer des applications vocales à la fois réactives et engageantes. Au cœur de cela se trouve la capacité du moteur à faciliter les réponses à faible latence, un facteur critique dans la création de conversations réalistes et fluides. Ceci est réalisé grâce à une combinaison de traitement vocal optimisé et de technologie de réseau avancée.
Les caractéristiques technologiques clés du moteur comprennent:
- Intégration flexible du modèle d’IA: La plate-forme est conçue pour soutenir un large éventail de modèles d’IA, accordant aux développeurs la liberté de choisir entre les algorithmes sur mesure et ceux offerts par les principaux fournisseurs de modèles de grande langue (LLM). Cette flexibilité permet d’adapter les interactions IA à des besoins d’application spécifiques.
- Traitement vocal optimisé: Pour garantir la clarté et la précision, le moteur intègre des fonctionnalités avancées telles que la suppression du bruit de fond et la conversion de la parole en texte en texte (STT) en temps réel. Ces fonctionnalités sont cruciales pour offrir une expérience utilisateur de haute qualité, en particulier dans les environnements avec différents niveaux de bruit ambiant.
- Fiabilité améliorée du réseau: Tirant parti du réseau réel défini par le logiciel d’Agora (SD-RTN), le moteur est conçu pour minimiser la latence et gérer efficacement la perte de paquets. Cette infrastructure réseau est essentielle pour maintenir des performances cohérentes dans diverses conditions de réseau, garantissant que les interactions vocales restent lisses et ininterrompues.
Construit sur le Ten Framework, un projet axé sur la communauté dédié à l’IA conversationnelle, le moteur signale également l’engagement d’Agora à favoriser la collaboration et l’innovation au sein de la communauté des développeurs. En outre, la société prévoit d’intégrer le moteur avec sa plate-forme d’application Builder, visant à démocratiser l’accès au développement de l’IA de voix via des solutions sans code.
Mood Media dévoile un copilote de messagerie AI pour une création audio instantanée en magasin
Pour soutenir les performances et l’évolutivité du moteur, Agora s’est associé à Oracle, en utilisant Oracle Cloud Infrastructure (OCI). Cette collaboration souligne l’importance d’une infrastructure robuste dans la mise sous tension des applications AI avancées.
Agora envisage un large éventail d’applications pour son moteur d’IA conversationnel, y compris l’automatisation du service client, le contrôle des appareils IoT, les assistants de magasinage virtuels, le support de santé numérique, l’éducation en ligne et les expériences de jeu immersives. La version bêta publique permet aux développeurs d’explorer ces possibilités et de commencer à construire la prochaine génération d’applications vocales.
Crédit d’image en vedette: Agora