Stratégies publicitaires et désinformation, le danger croissant autour de l’élection présidentielle américaine

Avec l’élection présidentielle américaine de 2024 en pleine préparation, les techniques de Data Science révèlent un paysage publicitaire numérique profondément polarisé. L’étude ElectionGraph de l’Université de Syracuse offre un aperçu détaillé des stratégies publicitaires des candidats sur les plateformes Meta, ainsi que des dangers liés à la désinformation et aux pratiques frauduleuses par intelligence artificielle. Retour sur cette étude qui met en lumière un danger grandissant dans l’ombre du débat public. 

Le projet ElectionGraph

Le projet ElectionGraph, mené par l’Université de Syracuse, utilise des techniques avancées de Data Science pour analyser les publicités politiques sur Facebook et Instagram. Grâce aux données collectées via l’API Meta Ad Library, combinées à la technologie de base de données Neo4j, les chercheurs sont en mesure de suivre les tendances publicitaires et d’examiner les stratégies de communication numérique des deux candidats américains.

Ces données permettent d’établir un cadre visuel pour comprendre le flux d’informations – et de désinformations qui cible les électeurs. L’analyse s’étend sur une année, couvrant les dépenses publicitaires de septembre 2023 à août 2024. Les publicités sont classées selon plusieurs critères, tels que la mention d’un candidat et le ton utilisé (positif, attaque, incivilité).

La méthode utilisée s’appuie sur le machine learning, avec notamment l’usage du modèle de langage BERT pour classifier les publicités en fonction de leur contenu. Les algorithmes identifient les thèmes abordés (économie, santé, immigration, etc.) et le niveau de négativité des messages, permettant d’extraire des insights clés sur les stratégies des campagnes.

Les chercheurs ont également rencontré des défis dans l’analyse des données non structurées, notamment la diversité des formats publicitaires et la subjectivité dans la classification des messages. Toutefois, les techniques de traitement du langage naturel ont significativement amélioré l’exactitude des résultats, offrant une base solide pour l’interprétation des données.

Les stratégies publicitaires : dépenses et ciblage

Les données révèlent des écarts importants dans les dépenses publicitaires entre les candidats. Les démocrates, avec leur ticket Biden-Harri, ont dépensé environ 10 fois plus que la campagne de Donald Trump, créant ainsi un déséquilibre de visibilité sur les plateformes Meta. Les chiffres montrent également que les démocrates ont intensifié leurs dépenses au cours de l’été 2024, notamment en Pennsylvanie, un État clé pour les élections.

En utilisant des techniques de visualisation de données, telles que les cartes de chaleur et les diagrammes de flux, il est possible de cartographier les régions et les publics les plus ciblés, ce qui met en évidence les stratégies de mobilisation des électeurs.

Grâce au machine learning, il est également possible de segmenter efficacement les cibles des campagnes de communication en fonction de critères démographiques comme l’âge, le sexe et la géographie. 

Par exemple, les publicités de Trump ciblent principalement les hommes plus âgés, tandis que la campagne de la candidate Harris s’adresse davantage aux femmes et aux jeunes adultes.

Les thèmes abordés varient également en fonction des publics : l’économie reste la priorité des deux côtés, mais les données thématiques révèlent une attention accrue de la part des démocrates sur les questions de santé, notamment les droits des femmes.

Détection de comportements inauthentiques et lutte contre la désinformation

Les techniques de détection d’anomalies et les modèles de classification sont utilisés pour identifier les publicités potentiellement frauduleuses. L’étude ElectionGraph a mis en évidence l’existence de réseaux tels que « Liberty Defender », qui exploitent la crédulité des électeurs pour mener des escroqueries en ligne. Ces pratiques incluent la fausse promesse de cadeaux en échange de données personnelles ou de paiements mensuels cachés.

La détection de ces réseaux est un défi constant, car les escrocs adaptent rapidement leurs tactiques. La Data Science joue un rôle crucial en identifiant les modèles de comportement déviant et en fournissant des outils pour lutter contre la propagation de la désinformation.

 

La Data Science s’impose désormais comme un outil incontournable pour analyser les dynamiques électorales et révéler les pratiques publicitaires douteuses. En détectant les fraudes et en optimisant les stratégies publicitaires, elle contribue à une meilleure transparence des campagnes numériques.

À l’avenir, les innovations dans le domaine de l’IA devront se concentrer sur l’amélioration de la transparence et la lutte contre la désinformation. Le défi consiste à protéger la démocratie tout en permettant aux campagnes de s’adapter aux nouvelles technologiesde communication.

Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.

UAMG – Source : Deepmind.google