Google tire parti de l’IA générative et de plusieurs modèles de fondation pour introduire Raisonnement géospatial, une initiative de recherche conçue pour accélérer la résolution de problèmes géospatiale. Cet effort intègre de grands modèles de langage comme les Gémeaux et les modèles de fondation de télédétection pour améliorer l’analyse des données dans divers secteurs.
Pendant des années, Google a compilé les données géospatiales, qui sont des informations liées à des emplacements géographiques spécifiques, pour améliorer leurs produits. Ces données sont cruciales pour relever les défis des entreprises tels que ceux de la santé publique, du développement urbain et de la résilience climatique.
Les nouveaux modèles de fondation à la télédétection sont construits sur des architectures telles que les autoencoders masqués, le siglip, la mammut et le hibou, et sont formés à l’aide d’images satellites et aériennes à haute résolution avec des descriptions de texte et des annotations de boîtes de délimitation. Ces modèles génèrent des intérêts détaillés pour les images et les objets, et peuvent être personnalisés pour des tâches telles que la cartographie des infrastructures, l’évaluation des dommages aux catastrophes et la localisation des caractéristiques spécifiques.
Ces modèles prennent en charge les interfaces en langage naturel, permettant aux utilisateurs d’effectuer des tâches telles que la recherche d’images de structures spécifiques ou l’identification des routes impraticables. Les évaluations ont démontré des performances de pointe dans diverses références de télédétection.
Le raisonnement géospatial vise à intégrer les modèles de fondation avancés de Google avec des modèles et des ensembles de données spécifiques à l’utilisateur, en s’appuyant sur le pilote existant de Gémeaux Capacités dans Google Earth. Ce framework permet aux développeurs de construire des workflows personnalisés sur Google Cloud Platform pour gérer des requêtes géospatiales complexes à l’aide de Gemini, qui orchestre l’analyse entre diverses sources de données.
L’application de démonstration montre comment un gestionnaire de crise peut utiliser le raisonnement géospatial après un ouragan par:
- Visualiser le contexte pré-catastrophe: Utilisation d’images satellites open source du moteur Earth.
- Visualiser la situation post-catastrophe: Importation d’images aériennes à haute résolution.
- Identification des zones endommagées: En utilisant des modèles de fondation à la télédétection pour analyser les images aériennes.
- Prédire les risques supplémentaires: Utilisation des prévisions météorologiques de WEATERNEXT AI.
- Poser des questions aux Gémeaux: Estimation des fractions de dommages, la valeur des dommages matériels et suggérant une hiérarchisation de secours.
L’application de démonstration comprend:
- Une application frontale Python emballée: Qui intègre des composants de cartographie et de graphique avec une fenêtre de chat.
- Un back-end agentique: Cela implémente un agent Langgraph déployé à l’aide du moteur d’agent Vertex AI.
- Outils accessibles à LLM: Pour accéder à Earth Engine, BigQuery, Google Maps Platform et Google Cloud Storage, effectuer des opérations géospatiales et en utilisant les points de terminaison d’inférence du modèle de fondation de télédétection déployés sur Vertex AI.
L’application utilise des images aériennes à haute résolution de la patrouille aérienne civile, prétraitée avec l’IA de Bellwether, X’s Moonshot pour l’adaptation climatique, ainsi que les bâtiments ouverts de Google Research et les modèles SKAI. Les indices de vulnérabilité sociale, les données sur les prix du logement et les informations Google WeatherNext sont également incorporées.
Le chorégraphe de WPP intégrera PDFM à ses données de performance multimédia pour améliorer l’intelligence du public axée sur l’IA. Airbus, Maxar et Planet Labs seront les testeurs initiaux des modèles de fondation de télédétection.
Spécifiquement:
- Airbus: Prévoit d’utiliser des modèles de fondation à la télédétection de Google pour permettre aux utilisateurs d’extraire des informations de milliards d’images satellites.
- Maxar: A l’intention d’utiliser les modèles pour aider les clients à interagir avec son «globe vivant» et à extraire plus rapidement des réponses critiques de mission.
- Planet Labs: Utilisera les modèles de fondation de télédétection pour simplifier et accélérer les informations pour leurs clients.