Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
Subscribe
No Result
View All Result
Dataconomy FR
No Result
View All Result

Microsoft brevète un générateur audio-image en temps réel

byKerem Gülen
octobre 15, 2024
in Artificial Intelligence
Home Artificial Intelligence

Vous participez à une autre réunion Zoom ou Teams sans fin. Les voix bourdonnent, les diapositives retiennent à peine votre attention et vos yeux sont vitreux tandis que quelqu’un débite des statistiques trimestrielles. Maintenant, imaginez si, au lieu de vous ennuyer avec des feuilles de calcul, l’IA de la réunion commençait à créer des visuels sur place, de véritables images qui donnent vie à la conversation, générées en temps réel pendant que les gens parlent. Cela semble futuriste, mais c’est exactement ce que Microsoft prépare avec un nouveau brevet.

Microsoft brevète la voix à l’image

La dernière idée de Microsoft (et oui, ce n’est encore qu’une idée pour l’instant) est de prendre des flux audio en direct (conférences, réunions, toute conversation verbale) et de les transformer en images, à la volée. L’Office américain des brevets et des marques vient juste a abandonné les détails le 10 octobre 2024après que Microsoft l’ait déposé en avril. Le système écouterait essentiellement vos appels, générerait une transcription de texte, l’alimenterait via un modèle d’IA et afficherait des images qui correspondent à ce qui est dit.

Fini le « laissez-moi afficher une diapositive pour cela ».

Microsoft brevète un générateur audio-image en temps réel
Une capture d’écran pour le brevet (Crédit image)

La fin des réunions ennuyeuses ? Peut-être pas, mais ce sera proche

La plupart des réunions virtuelles sont plutôt ennuyeuses. Et ne prétendons pas que nous ne passons pas beaucoup de temps à nous détendre.

Mais que se passerait-il si ces réunions commençaient soudainement à afficher des visuels aussi vite que la conversation avance. Quelqu’un mentionne de nouveaux concepts de produits et, en quelques secondes, des images générées par l’IA commencent à apparaître à l’écran. Les chiffres secs que les gens citent se transforment soudainement en graphiques dynamiques sans que personne ne clique sur un bouton. Qu’est ce que c’est? Un goulot d’étranglement dans la chaîne d’approvisionnement en Asie du Sud-Est ? Boum ! Une carte interactive apparaît, mettant en évidence les domaines préoccupants.

Maintenant, avant de vous enthousiasmer, soyons clairs : cela est encore en phase de brevet. Et si vous êtes dans le secteur depuis assez longtemps, vous savez que de nombreux brevets ne mènent nulle part. Déposer un brevet, c’est comme planter une graine : elle peut devenir quelque chose de génial, ou simplement rester une idée qui ne sera jamais développée.

Cela dit, si Microsoft se lance, la solution la plus évidente pour cette technologie est Équipes Microsoft. Ils ont renforcé Teams avec toutes sortes d’outils basés sur l’IA, de Copilot aux fonctionnalités améliorées de vidéoconférence, ce serait donc une étape à franchir.

Nous avons déjà vu des outils de conversion texte-image comme DALL-E et À mi-parcours époustoufler les gens. Nous pourrions désormais voir ce concept appliqué au discours en direct. C’est comme donner une voix à la créativité de l’IA en temps réel.

Mais pour l’instant, nous attendons.


Crédit image en vedette : Kerem Gülen/Milieu du voyage

Tags: En vedetteIAintelligence artificielleMicrosoft

Related Posts

Twist de l’intrigue: Google Veo 2 Ai frappe l’honneur avant Pixel

Twist de l’intrigue: Google Veo 2 Ai frappe l’honneur avant Pixel

mai 13, 2025
Google abandonne, je me sens de la chance pour la recherche d’IA

Google abandonne, je me sens de la chance pour la recherche d’IA

mai 13, 2025
WhatsApp teste les fonds d’écran de chat généré par AI sur iOS Beta

WhatsApp teste les fonds d’écran de chat généré par AI sur iOS Beta

mai 12, 2025
Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

Chrome déploie l’IA locale pour détecter de nouvelles escroqueries Web émergentes

mai 9, 2025
La mise en cache implicite vise à réduire les coûts API Gemini de 75%

La mise en cache implicite vise à réduire les coûts API Gemini de 75%

mai 9, 2025
Chatgpt peut désormais analyser vos référentiels GitHub

Chatgpt peut désormais analyser vos référentiels GitHub

mai 9, 2025

Recent Posts

  • Schneider Electric dévoile le copilote industriel à l’automatise 2025
  • Twist de l’intrigue: Google Veo 2 Ai frappe l’honneur avant Pixel
  • Votre iPhone 13 vient de recevoir une fonction de sauvetage critique avec iOS 18.5
  • Code propre par rapport au code rapide: qu’est-ce qui compte le plus?
  • La mise à niveau de l’IA de Cardano aidera-t-elle à poursuivre sa tendance à la hausse?

Recent Comments

Aucun commentaire à afficher.
Dataconomy FR

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.