Elon Musk a récemment annoncé que les utilisateurs seront limités à voir un certain nombre de tweets quotidiennement avant de rationaliser la décision rapidement. Musk a accusé les startups de l’IA d’avoir récupéré les données de Twitter.
Désormais, seuls 600 messages peuvent être consultés quotidiennement par des comptes non vérifiés, et seuls 300 peuvent être consultés quotidiennement par de «nouveaux» comptes non vérifiés. Les restrictions pour les comptes vérifiés ne permettent toujours de lire que jusqu’à 6 000 publications par jour.
« Pour faire face à des niveaux extrêmes de récupération de données et de manipulation du système, nous avons appliqué les limites temporaires suivantes », a écrit Musk dans le premier de plusieurs tweets sur le choix. Musk a publié des articles sur les contraintes de taux à plusieurs reprises tout au long de la journée, permettant aux gens de regarder plus de publications à chaque fois.
Les comptes vérifiés pour les utilisateurs payants avaient une limite de 6 000 messages par jour à partir de 10 h samedi, les comptes non vérifiés existants avaient une restriction de 600 messages par jour ; et les nouveaux comptes non vérifiés avaient une limite de 300 publications par jour. Selon les tweets de Musk, ces chiffres sont passés respectivement à 10 000, 1 000 et 5 000 à 15 heures.
Pour faire face aux niveaux extrêmes de récupération de données et de manipulation du système, nous avons appliqué les limites temporaires suivantes :
– Les comptes vérifiés sont limités à la lecture de 6000 messages/jour
– Comptes non vérifiés jusqu’à 600 posts/jour
– Nouveaux comptes non vérifiés à 300/jour– Elon Musk (@elonmusk) 1 juillet 2023
Scraping de données Twitter : Elon Musk blâme les startups de l’IA
Pour l’intelligence artificielle (IA) formant les grands modèles de langage (LLM) comme ceux qui alimentent ChatGPT, Microsoft Bing et Google Bard, Musk critique les entreprises qui tentent d’avaler des données. Le scraping des données Twitter est la raison derrière toutes ces limites, selon Musk.
Cependant, il a omis d’expliquer que, depuis qu’il a repris l’entreprise l’automne dernier, il a décidé de licencier plus de la moitié des employés de Twitter, y compris le personnel essentiel au maintien de son infrastructure. Les gens ont souvent averti que licencier autant de personnes aurait un effet négatif sur la stabilité de Twitter, et à la suite des licenciements imprévus, l’entreprise a même dû réembaucher certains ingénieurs qui avaient été licenciés.
Elon Musk travaille sur un concurrent de ChatGPT nommé « TruthGPT »
Les bots Twitter sont l’une des principales causes
Twitter a maintenant un problème qui va au-delà des comptes de spam de crypto-monnaie : les comptes et les bots qui annoncent du contenu sexuel et infiltrent les messages directs et les conversations des utilisateurs. Il ne semble pas non plus y avoir de réponse simple en vue.
Même si le problème existe depuis longtemps, les déclarations pleines d’espoir d’Elon Musk concernant la lutte contre les robots et les comptes frauduleux sur Twitter après avoir acquis la plate-forme rendent amusante la montée des robots pornographiques.
La société de recherche en sécurité MalwareHunterTeam a révélé plusieurs comptes Twitter qui sont des spam bots dans un tweet qui s’injectent dans les discussions comme des likes. Ceci est fait dans le but d’amener les utilisateurs à consulter les profils de ces comptes de robots et à cliquer sur les liens fournis dans leur bios. Voici le tweet :
WTF, @Elon Musk? Likes de 9 comptes de bots porno d’affilée… C’est un record pour ce compte je pense.
Mais tous les problèmes de bot ont été résolus il y a des mois, n’est-ce pas ?
pic.twitter.com/gN56SPNcR7– MalwareHunterTeam (@malwrhunterteam) 27 juin 2023
Qu’est-ce que le data scraping ?
À l’aide d’outils logiciels ou de scripts, le grattage de données est le processus d’obtention de données à partir de sites Web, de bases de données ou d’autres sources. Le scraping de données Twitter en est également un exemple. Il existe plusieurs utilisations du data scraping, notamment :
- Étude de marché: Le data scraping peut aider les entreprises à en savoir plus sur leurs rivaux, clients, produits, coûts, tendances, etc. Le data scraping peut également être utilisé pour trouver des marchés, des niches ou des possibilités inexploités.
- Génération de leads : Le data scraping permet aux entreprises d’identifier les consommateurs ou clients potentiels en fonction de leurs préférences, besoins, habitudes ou intérêts. Le grattage des données peut également être utilisé pour collecter des coordonnées, notamment des profils de réseaux sociaux, des adresses e-mail et des numéros de téléphone.
- Création de contenu : Le grattage de données peut aider les producteurs de contenu à localiser des sujets, des mots clés, des photographies, des vidéos ou d’autres médias pertinents et intéressants pour leurs sites Web, blogs, plateformes de médias sociaux, etc. Le grattage de données peut également aider à créer du contenu automatiquement ou quelque peu automatiquement en utilisant des approches NLP.
- L’analyse des données: Le data scraping permet aux scientifiques et aux analystes de données de collecter des quantités substantielles de données à partir de nombreuses sources et de les organiser dans des formats utiles. De plus, l’enrichissement, le nettoyage, la validation ou la visualisation des données peuvent aider à fournir de nouvelles informations ou perspectives à partir des données.
Les données générées manuellement et automatiquement peuvent être extraites. Le grattage manuel des données consiste à copier et coller des données dans des feuilles de calcul ou d’autres documents à partir de sites Web ou d’autres sources.
Le grattage manuel des données est laborieux, chronophage et sujet aux erreurs. L’utilisation de programmes logiciels ou de scripts pour explorer, interpréter, extraire et enregistrer automatiquement des données à partir de sites Web ou d’autres sources est connue sous le nom de grattage automatique des données.
Comment effectuer une recherche de données sur le Web
Comparé au grattage humain des données, le grattage automatique des données est plus rapide, plus simple et plus précis. C’est probablement ce qui a également été utilisé pour le grattage des données Twitter.
Crédit image en vedette : Glenn Carstens-Peters sur Unsplash.