Publicité
Sondage 2.0
Mieux tâter le pouls politique
Par
Partager cet article
Sondage 2.0
Mieux tâter le pouls politique
Même si le sondage d’opinion est ancré dans des modèles statistiques sérieux, le fait qu’il soit inscrit dans une temporalité avec un échantillonnage restreint le limite dans ses prédictions. Or, aujourd’hui, nous avons l’intelligence artificielle et autres technologies pour des citoyens tout le temps connectés… Pulse Analytics utilise le comportement et les interactions des usagers de l’internet, sur un large éventail de plateformes digitales, afin d’en dégager des renseignements dignes de foi qui permettent d’étudier les réactions et les motivations des internautes. Une véritable usine digitale, constituée d’algorithmes divers, passe cette base de données au peigne fin, repère ce qui s’y passe, identifie des tendances et des schémas, puis catégorise et «prédit» éventuellement les comportements.
Depuis la nuit des temps, les humains ont souhaité connaître le futur.
C’est ainsi qu’Alexandre le Grand fit un détour majeur pour visiter l’oracle d’Amon, situé dans l’oasis de Siwa, en Égypte. Il avait déjà conquis les Perses et avait été proclamé pharaon d’Égypte. Mais il lui en fallait plus et à Siwa, on lui déclara qu’il était le fils de Zeus et qu’il allait conquérir le monde, ce qui le mettait certes en confiance pour la suite. Rien n’a changé depuis et, au cours des âges, une foultitude de devins, de marabouts, de fakirs et de voyants a prétendu pouvoir prédire ce qui va se passer dans l’avenir. Mais même Nostradamus, métaphores et interprétations diverses aidant, est plutôt bec dans l’eau. La crédibilité de l’oracle de Siwa dépendait, en fin de compte, clairement de combien Alexandre VOULAIT croire en ce qui lui était prédit… Rien n’a changé depuis.
Les politiciens, comme le reste de l’humanité, ne sont pas en reste et voudraient bien savoir à quelle sauce ils seront mangés. Ou s’ils mangeront l’adversaire et avec quelles épices. Cependant, on ne peut prédire l’avenir, ni même connaître le présent avec exactitude. On ne pouvait jusqu’ici que tenter d’extrapoler de ce qui s’est déjà passé pour tenter de voir l’avenir, même si flou. Le sondage d’opinion était, à cet effet, à peu près le seul outil «fiable», sur la base de certaines hypothèses, pour tenter de voir clair dans ce que pens(ai)ent les citoyens. Si l’échantillon était représentatif de la population entière et si les interrogés parlaient «vrai» bien entendu !
Mais même si le sondage d’opinion est aujourd’hui ancré dans des modèles statistiques sérieux et mathématiquement vérifiés, et même s’il est évidemment bien mieux de composer avec, plutôt que sans, il est clair que les sondages, menés des semaines entières avant leur publication et étalés sur un certain nombre de jours qui chevauchent parfois des évènements marquants (ex : le Budget), ne peuvent garantir que l’instantané qu’ils enregistrent va perdurer et encore moins qu’il pourra prédire l’avenir…
C’est sur cette toile de fond que la rédaction de l’express s’est penchée sur les promesses d’un nouvel outil disponible pour sonder ce que pensent les Mauriciens (ou tout autre peuple d’ailleurs), si l’échantillon étudié est suffisamment large et crédible.
Pulse Analytics est la création de Stéphane Adam, un Mauricien qui a eu l’intuition d’utiliser le comportement et les interactions des usagers de l’internet, sur un large éventail de plateformes digitales, afin d’en dégager des renseignements dignes de foi qui permettent alors d’étudier les réactions et les motivations des internautes. Une véritable usine digitale, constituée d’algorithmes divers, passe cette base de données au peigne fin, repère ce qui s’y passe, identifie des tendances et des schémas, puis catégorise et «prédit» éventuellement les comportements.
Ce qui différencie fondamentalement cette méthode du sondage classique peut se résumer principalement comme suit :
1/ Cette approche garantit la passivité/neutralité de l’échantillon, rendue anonyme par l’élimination de toute référence personnelle ou individuelle. Dans un sondage, on questionne et, conscient de ce fait, de nombreuses personnes sondées refusent de répondre, se rebiffent et parfois même mentent. L’internaute lui est libre de pression, d’autant qu’il est anonymement étudié. Ainsi Pulse s’est beaucoup soucié de respecter méticuleusement les règlements globaux de Data Protection, notamment ceux du GDPR (General Data Protection Regulation) et du CCPA (California Consumer Privacy Act). Des audits et des vérifications de compliance réguliers complètent ce souci constant au niveau de la protection des données collectées et établissent le contrat confiance avec ses stakeholders divers.
On n’interroge personne chez Pulse. On regarde simplement ce que font librement les internautes sur le Net et puis on analyse. Par contre, un sondage permet, de son côté, de contextualiser l’objet principal de l’exercice (disons les intentions de vote), avec d’autres questions (priorités nationales, score des leaders politiques etc.).
2/ L’échantillon que Pulse étudie regroupe environ 650 000 internautes mauriciens et des millions d’autres dans la région Afrique - Moyen Orient. Un échantillon d’une telle importance a le mérite de clore beaucoup de débats sur la représentativité de l’échantillon, même si l’échantillon qui reste, et qui est non examiné, a un profil un peu différent. Pulse peut honnêtement dire que ses résultats reflètent les sentiments de ceux qu’il suit sur le Net, une population grandissante de toute manière, au fur et à mesure qu’elle rajeunit… Les plus de 60 ans sont sous-représentés par à peu près 50 %.
3/ Pulse peut maintenant utiliser de l’intelligence artificielle (IA) et des Large Language Models (LLMs) pour analyser sa masse d’information, ce qui n’était pas possible précédemment. Une équipe expérimentée d’analystes utilise ensuite les données collectées pour identifier, à travers de puissants algorithmes analytiques, les préférences et les influences qui pilotent les choix des internautes. La méthode peut également être utilisée commercialement, politiquement ou socialement pour dégager des idées, des perceptions et une meilleure compréhension de la situation dans l’environnement étudié.
4/ La méthode Pulse est présentée comme statistiquement solide et viable, mais la rédaction de l’express n’a pas les moyens de contre-vérifier ces affirmations pour le moment. Un cadrage académique rigoureux prendra du temps et sera éventuellement nécessaire, mais au point actuel, la méthode dégage déjà des pistes intéressantes et mesurables puisque l’échantillon, constamment changeant, est accessible à tout moment, sans aucune complication additionnelle. L’outil paraît ainsi particulièrement utile pour étudier les tendances et les évolutions d’opinion ou de comportements dans le temps.
On connaît par ailleurs, tous, d’autres outils du même genre qui, ayant surveillé ce que nous faisions sur le Net, nous proposent films, marchandises ou sites compatibles selon nos comportements passés. Rien de bien nouveau, donc, sauf que l’échantillon concerné ici, politiquement, est strictement local.
Pulse est une opération indépendante aujourd’hui basée à Dubaï, à Nairobi et à Maurice qui a déjà convaincu un certain nombre de personnalités avisées à investir des fonds, à donner des conseils et à partager des modes d’emploi, notamment pour cerner, au départ, divers aspects de l’étude de marques commerciales.
La migration vers des analyses politiques cette année fut un choix naturel car coïncidant avec une année électorale particulièrement dense et riche mondialement, alors même que l’on assistait à l’avènement accéléré de l’IA et des LLMs…
Cependant, Pulse veut absolument maintenir sa crédibilité et insiste donc pour agir professionnellement et indépendamment des partis politiques locaux. Déjà sollicitée, l’équipe de Pulse souhaite n’accorder aucune exclusivité d’utilisation, qui pourrait éventuellement mener à des accusations de parti pris et de manipulations et partagera objectivement ses conseils à qui les solliciteront. Le but est d’aider les partis et même les candidats individuels à mieux comprendre le comportement des électeurs afin d’affiner les stratégies en conséquence. Stéphane Adam nous a ainsi déclaré : «Our data enables campaigns that are both informed and relatable, tailored to the needs of Mauritians and hopefully, reminding everyone that politics, is not about the politician, but more about the people.» Ce seront évidemment les électeurs, dont on ne peut prédire la décision finale d’ailleurs, qui décideront de leur choix dans le secret de l’urne.
Les résultats de juin 2024
Le modèle de PULSE, prédisait, en juin 2024 une répartition de 22 sièges au Parti travailliste (PTr), de 11 sièges au Mouvement militant mauricien (MMM), de 25 sièges au Mouvement socialiste militant (MSM) et de deux sièges au Parti mauricien social-démocrate (PMSD).
La joute étant devenue plus serrée, le modèle prédisait alors de nombreuses situations de 2 :1, seules les circonscriptions no 7 (MSM), no 8 (MSM) et no 20 (MMM) étant unicolores. La circonscription no 14 affichait même une possibilité de 1 :1 :1.
Méthodologie
Pour faire simple, Pulse dit utiliser des algorithmes puissants comme la régression logistique ou les random forests, ce qui, avec des techniques statistiques et l’advanced machine learning, permet de transformer du data brut en des connaissances exploitables. Le data brut est lui-même collecté et consolidé en utilisant des cookies, des web trackers et d’autres outils. Puis, des techniques de segmentation et de clustering permettent d’affiner l’étude qui est complétée par des analyses de textes pour établir les sujets, les préférences et les sentiments des internautes. Utilisant les algorithmes de machine learning, Pulse se dit alors en mesure de prédire la probabilité que les électeurs ou consommateurs penchent en faveur du parti X ou de la marque Z. Pulse dit aussi pouvoir assurer un taux de confiance de 95 % sur tous ses calculs statistiques, ce qui reste à déterminer par des sommités autrement mieux outillées que notre rédaction… mais qui paraît certainement possible sur un échantillon de base aussi important. Certains résultats pourraient surprendre (par exemple, la méthode reconnaît plutôt les partis que les alliances et nous ne sommes pas en mesure de vérifier indépendamment si les partis PTr et MMM s’ajouteront, même si cela paraît très probable)… Les résultats 2 :1 indiquent des courses plus serrées, mais dépendent d’hypothèses arbitraires.
Fait intéressant : les adresses IP étudiées sont sélectionnées pour correspondre exactement aux 20 circonscriptions !
Pulse Analytics a fait beaucoup de chemin et s’active grâce à un réseau de techniciens aux États-Unis, en France, aux Émirats arabes unis, en Inde et à Maurice. Les fondateurs de Pulse sont eux-mêmes des diplômés de Y Combinator, un accélérateur de start-up, grâce à qui ils ont pu échanger et collaborer avec d’autres passionnés, dont des cervelles affûtées chez Airbnb, Dropbox et Open AI. De plus, Pulse, comme un des membres du hub de Microsoft pour les fondateurs de start-up, a pu établir de fructueuses collaborations sur des sujets tels la sécurité des données, l’encryption, l’IA ou le traitement même des données.
Les méthodologies de Pulse Analytics nous ont été communiquées avec un certain degré de détail et impressionnent de prime abord, mais il est clair qu’il est du devoir de la rédaction de ne pas tout révéler ici de ce qui constitue son fonds de commerce essentiel et ses trade secrets. Nous ne prétendrons pas avoir tout compris, non plus. Nous avons, par ailleurs, pris connaissance d’un certificat de KPMG qui certifie que la base de données utilisée concernait, 639 355 unique user profiles, à fin 2022.
Évolution des sentiments des internautes
Le tableau ci-dessus montre l’évolution de l’intérêt exprimé par les internautes pour les partis politiques entre décembre 2023 et juin 2024. Selon la méthodologie de Pulse, la tendance a clairement favorisé le MSM depuis décembre, passant de 67 % à 75 % en termes de probabilité de sièges, le soutien travailliste restant stable a environ 82 % et le MMM faisant un petit progrès, de 53 % à 58 %. Consolidant le PTr au MMM, le nombre de sièges implicite à ces tendances aurait passé de 40 :20 à 33 :27.
La dernière analyse de Pulse concerne le mois de juillet 2024. Le partage de sièges en est toujours à 33 :27, même si les Travaillistes font quelques progrès, en intéressant plus d’internautes, notamment à Belle-Rose–Quatre-Bornes.
Publicité
Les plus récents