Dans une industrie consommée par la course à l’intelligence artificielle, les entreprises se précipitent pour éviter d’être laissées pour compte. La peur de manquer, cependant, conduit beaucoup à poursuivre les tendances flashy tout en ignorant les fondamentaux, une pratique qu’un vétéran de l’industrie appelle «fou».
Stanislav Petrovun scientifique de données senior à Capital.com Avec plus d’une décennie d’expérience, soutient que la clé du succès n’est pas d’adopter le modèle le plus récent et le plus médiatisé, mais favorisant une culture de «santé mentale». Pour les entreprises, cela signifie hiérarchiser des objectifs clairs et des données de qualité sur l’attrait du mouvement de l’IA.
Le défi est important. Selon un rapport de 2024 de Alation87% des employés citent qualité des données Les problèmes en tant que principale raison pour laquelle leurs organisations ne répondent pas à l’objectif de données et d’analyse.
« Le paradoxe central de la flèche actuelle de l’IA est notre obsession des résultats tout en négligeant la source », m’a dit Petrov. «Malgré toute l’excitation, le facteur le plus critique pour les projets de science de l’IA ou des données réussis reste la qualité et la pertinence des données d’entrée – mais comme c’est la partie non sexy et la plus difficile, elle est souvent ignorée.»
Pour contrer cela, Petrov défend un cadre simple mais rigoureux avant le début d’un projet: quel est l’objectif commercial? Quel est l’impact commercial potentiel? Et avons-nous les données pour y arriver?
« Si ceux-ci ne sont pas clairement répondus, nous n’allons pas de l’avant », a-t-il déclaré.
Un plan pour l’impact
Petrov souligne le développement d’une valeur à vie du client, ou CLV, le modèle comme un excellent exemple de cette philosophie en action. L’objectif n’est pas seulement de construire un algorithme prédictif, mais de résoudre un besoin commercial de base: optimiser les budgets marketing.
« L’objectif est de comprendre les performances prévues de la campagne ou de la création publicitaire dans les premiers stades et d’ajuster les dépenses en conséquence », a déclaré Petrov. Il a noté que ces modèles sont cruciaux pour les stratégies automatisées modernes, comme les enchères basées sur la valeur sur des plateformes comme Google Ads, qui reposent sur la valeur de l’utilisateur prévu.
Bien que l’ère actuelle de l’IA soit dominée par des réseaux de neurones complexes, Petrov a déclaré que pour les problèmes de données structurés comme la CLV, les méthodes établies fonctionnent souvent le mieux.
« Une approche de renforcement du gradient fonctionne bien pour les données structurées », a déclaré Petrov, ajoutant la mise en garde cruciale: «Bien sûr, vous devez savoir ce que vous faites et comprendre comment régler les hyperparamètres et choisir une fonction de perte appropriée en fonction de votre distribution cible.»
L’étape finale et peut-être le plus importante est de s’assurer que le modèle est réellement utilisé. Il a souligné que la mesure d’impact nécessite souvent des techniques sophistiquées comme l’analyse de l’impact causal pour prouver la valeur d’un modèle lorsque de simples tests A / B ne sont pas possibles.
« La valeur d’un tel modèle réside non seulement dans son mérite technique, mais dans sa capacité à influencer les décisions réelles, à évoluer entre les systèmes et à s’adapter aux besoins de l’entreprise », a déclaré Petrov.
Naviguer dans un paysage en évolution
Cette approche pragmatique est essentielle car les scientifiques des données sont confrontés à des vents contraires, en particulier à partir de nouvelles réglementations de confidentialité et à la mort à long terme du cookie tiers.
Google procède à son plan pour éliminer les cookies tiers pour tous les utilisateurs de Chrome, une décision qui Une étude de Lotame trouvé que 62% des spécialistes du marketing pensent avoir un impact négatif sur leur publicité.
Petrov considère cela non pas comme un seul événement, mais comme un long processus incrémentiel qui nécessite une adaptation.
« Un changement majeur se penche sur les cadres basés sur l’incrémentalité et la modélisation des mélanges de médias pour comprendre la véritable contribution des canaux, en particulier lorsque l’attribution directe du chemin se décompose », a déclaré Petrov.
Cela oblige une intégration plus stricte entre les équipes de données et le marketing, s’appuyant davantage sur des techniques comme la géo-test et la modélisation probabiliste.
L’état d’esprit qui définit un leader
Lorsqu’il s’agit de constituer des équipes capables de répondre à ces défis, Petrov pense que le différenciateur entre un scientifique de données junior et senior n’est pas une seule compétence, mais un état d’esprit centré sur la propriété.
« Alors que les juniors peuvent exceller dans l’exécution de tâches bien transformées, les seniors sont ceux qui définissent de manière proactive des problèmes, engagent les parties prenantes et voient des solutions à la livraison et à l’itération », a-t-il déclaré.
Il a décrit une réalisation cruciale pour tout professionnel qui cherche à grandir: «Un changement de mentalité clé consiste à réaliser que« personne ne viendra »pour vous dire quoi faire ou ce qui est bien. Vous devez prendre l’initiative, prendre vos propres décisions et assumer l’entière responsabilité des résultats.»
Pour Petrov, cette leçon est venue avec de l’expérience.
« Écrire du code n’est pas la partie la plus difficile du travail, même si ce n’est pas toujours facile », a-t-il déclaré. «Le vrai défi consiste à intégrer qui travaille dans un produit, à l’aligner avec les besoins de l’entreprise et à convaincre les parties prenantes de sa valeur.»
Cette philosophie de la propriété pragmatique s’étend à la construction de l’infrastructure qui soutient les modèles après leur lancement, un champ connu sous le nom de MOPL. Plutôt que de construire des «plates-formes complètes trop complexes», Petrov défend des solutions de taille droite.
« Un système robuste ne signifie pas toujours le plus complexe », a-t-il déclaré. «Dans de nombreux cas, une journalisation et une alerte simples et bien sommées sont liées aux sorties de modèle clés et aux indicateurs de dérive peuvent couvrir 80% de ce qui est nécessaire.»
En se concentrant sur les problèmes réels, les données de qualité et l’impact tangible, le message de Petrov est clair: à l’ère de l’IA, une dose de santé mentale pourrait être l’algorithme le plus précieux de tous.





