La proposition de télémétrie WordPress répond aux préoccupations de longue date en matière de confidentialité à l'approche de la date limite de conformité au RGPD

Publié: 2017-02-01

Fin octobre 2016, Morten Rand-Hendriksen a créé une proposition sur WordPress trac pour ajouter la télémétrie au noyau, une fonctionnalité opt-in qui collecterait des données anonymisées sur la façon dont les gens utilisent le logiciel. Il a proposé que la nouvelle fonctionnalité soit affichée lors de la première installation ou mise à jour, désactivée par défaut dans l'admin avec un contrôle disponible sous Paramètres->Général. Une option qu'il suggère est de l'expédier en tant que plugin qui s'installe automatiquement lors de l'opt-in et se désinstalle automatiquement lors de l'opt-out. Il a également identifié quelques exemples de données de base pouvant être suivies, notamment le nombre de thèmes et de plug-ins installés, la fréquence d'utilisation de vues spécifiques (Paramètres, Personnalisateur, etc.), la version actuelle, l'état de la mise à jour, les paramètres régionaux et la langue.

"WordPress est fier d'être une application créée par l'utilisateur pour l'utilisateur", a déclaré Rand-Hendriksen. "Le problème est avec la popularité et la portée de WordPress aujourd'hui, la distance entre WordPress 1 % (ou même 0,1 %) et l'utilisateur moyen devient si vaste que nous (les personnes qui contribuent au cœur de WordPress) ne savons presque rien sur le les personnes réelles qui utilisent WordPress ou comment elles utilisent l'application.

Au cours du cycle de développement de WordPress 4.7, Rand-Hendriksen a déclaré avoir été impliqué dans plusieurs conversations au cours desquelles les participants ont supposé l'utilisation de fonctionnalités sans aucune donnée pour étayer leurs opinions. Il soutient que les contributeurs de WordPress ne disposent pas des données nécessaires pour savoir comment les utilisateurs interagissent avec l'application et ses fonctionnalités.

"L'argument général était que, sur la base de la règle 80/20, certaines fonctionnalités devraient être ajoutées tandis que d'autres devraient être supprimées", a déclaré Rand-Hendriksen. "J'ai continué à souligner le fait bien connu que nous n'avons aucune idée des fonctionnalités que 80%, voire 20%, des utilisateurs de WordPress utilisent réellement, donc toute revendication de validité dans la règle 80/20 est au mieux une conjecture."

Sa proposition stipule que toutes les données collectées doivent être publiques pour plus de transparence et également mises à la disposition des utilisateurs finaux dans l'administration et sur WordPress.org.

L'idée a eu quelques mois pour mariner et a suscité des discussions sur ce qu'impliquerait un prototype. Ella Van Dorpe, core committer, a créé un plug-in autonome wp-data expérimental pour suivre quelques interactions simples avec l'éditeur. Les participants à la discussion ont recommandé de créer une configuration Elasticsearch/Logstash pour stocker les données, des technologies que l'équipe système de WordPress.org a déjà déployées.

"Je pense qu'un bon résumé est qu'il y a beaucoup d'obstacles sur le chemin et que personne n'a actuellement le temps d'y travailler", a déclaré Greg Brown, un Data Wrangler chez Automattic, dans une discussion de suivi sur le ticket il y a trois semaines. "En fin de compte, je pense que le plus gros obstacle est de trouver quelqu'un avec le temps, l'envie et la persévérance pour travailler là-dessus. Le déployer sur .org est la bonne chose à faire à terme, mais je soupçonne que cela prendra un certain temps.

Le développeur principal de WordPress, Dion Hulse, a confirmé que WordPress suit déjà bon nombre de ces statistiques et que la création d'un prototype sur l'infrastructure WordPress.org serait la meilleure option.

"Il serait également utile de voir comment notre système de statistiques existant peut compléter ou être remplacé par la proposition ici", a déclaré Hulse. "Je mentionne cela car la plupart des statistiques de la description originale sont déjà suivies, mais pas exposées sous quelque forme que ce soit. La seule nouveauté mentionnée ici est la fréquence d'utilisation de vues spécifiques (Paramètres, Personnalisateur, etc.) et la partie transparence (qui ne serait encore probablement que des résumés anonymisés, pas des données exactes).

Le projet de télémétrie WordPress fournit une solution aux problèmes de confidentialité de longue date

Le déplacement du suivi des données actuel de WordPress vers une fonctionnalité d'acceptation plus transparente fournirait également une solution à certains problèmes de confidentialité de longue date soulevés par les contributeurs dans un ticket de suivi vieux de six ans. WordPress suit le nombre de blogs et d'utilisateurs dans une installation donnée, ainsi que l'URL d'installation dans les en-têtes, afin de faciliter les demandes de mise à jour qui peuvent devenir problématiques, en particulier dans le cas d'installations multisites importantes.

"Même si un utilisateur sait que certaines données doivent être transmises pour une vérification de version du noyau, des plugins ou des thèmes, la quantité de données transmises à distance est évidemment plus que nécessaire pour effectuer la vérification de version", a commenté un contributeur sur le ticket. . "Mais les utilisateurs doivent être informés dès le départ afin qu'ils puissent décider librement s'ils le souhaitent au lieu d'être obligés de soutenir le projet avec leurs données d'utilisation. On pourrait leur proposer un opt-in pour le faire.

"Le nombre d'utilisateurs enregistrés que j'ai sur mon site lié à l'URL envoyée avec la demande de suivi donne des informations vitales sur la performance de mon entreprise - des informations qui m'appartiennent uniquement", a déclaré Danny van Kooten, développeur du plugin WordPress. . « À tout le moins, nous pourrions indiquer très clairement que WordPress suit ces informations et ce qu'il en fait exactement. Je ne pense vraiment pas qu'il y ait une excuse à cela."

Les développeurs peuvent filtrer les données pour répondre à leurs préoccupations en matière de confidentialité, mais cela est quelque peu inextricable du processus de mise à jour pour les installations multisites plus importantes. C'est aussi un obstacle technique trop important pour la plupart des utilisateurs réguliers qui seraient mieux servis par une simple interface utilisateur leur permettant de se retirer de la collecte de données.

La proposition de télémétrie WordPress de Rand-Hendriksen donne au projet l'occasion de formaliser les données collectées, d'indiquer le but qui les sous-tend et de permettre aux utilisateurs de choisir s'ils souhaitent être inclus.

Le règlement général européen sur la protection des données (RGPD) pourrait pousser WordPress vers une collecte de données plus transparente

Les progrès du projet de télémétrie et du ticket concernant les problèmes de confidentialité ont été lents. Ni l'un ni l'autre ne semblent être une priorité parmi les contributeurs, mais le règlement général européen sur la protection des données (RGPD) pourrait donner l'impulsion nécessaire pour pousser WordPress vers une collecte de données plus transparente et responsable.

Le GDPR est une refonte de la loi sur la protection des données en Europe avec des exigences beaucoup plus strictes que les lois précédentes. Il exige une divulgation complète pour toute collecte de données et des avis de confidentialité normalisés pour aider les utilisateurs à comprendre où et comment les données sont utilisées. Le consentement à la collecte des données doit être confirmé et les utilisateurs ont le droit d'accéder à leurs propres données. Cela inclut également le droit d'effacement ou "le droit à l'oubli", qui permet aux utilisateurs de supprimer leurs données du Web. Le RGPD entrera en vigueur en mai 2018.

Heather Burns, une spécialiste du droit numérique qui consulte et s'exprime longuement sur les lois et les politiques d'Internet, a encouragé les contributeurs de WordPress à encadrer la discussion concernant les problèmes de confidentialité en termes de travail vers la conformité à un cadre spécifique.

"Aux fins de cette discussion, le noyau devrait fonctionner selon la norme GDPR pour deux raisons", a déclaré Burns. « La première raison réside dans les différences culturelles. Les États-Unis n'ont pas de réglementation globale unique en matière de protection des données et de confidentialité, contrairement à l'Europe, où nous avons ce régime de protection des données qui s'applique à toutes les données personnelles, quels que soient leur utilisation, leur format ou leur secteur. Ainsi, le GDPR offre aux développeurs - même ceux en dehors de l'UE - un ensemble de normes robustes, saines et très strictes à suivre. Compte tenu de ce que nous avons vu sortir de la Maison Blanche la semaine dernière, le GDPR fournit également un bon point de départ pour la protection défensive des utilisateurs.

« La seconde est que le RGPD est extraterritorial. Elle s'applique aux données personnelles de toute personne en Europe, quel que soit l'endroit où se trouve le service en ligne. Si votre entreprise est aux États-Unis, en Australie ou en Israël mais que vous avez des utilisateurs européens, vous devez protéger leurs données conformément aux normes européennes GDPR.

Pricewaterhouse Coopers a récemment interrogé 200 multinationales basées aux États-Unis comptant plus de 500 employés et a constaté que 77 % prévoyaient de dépenser 1 million de dollars ou plus pour se conformer au RGPD. Plus de la moitié des personnes interrogées ont cité la préparation au RGPD comme la plus haute priorité de leurs programmes de confidentialité et de sécurité des données.

Les lourdes sanctions en cas de non-conformité sont l'un des facteurs déterminants qui poussent les entreprises américaines à dépenser des millions de dollars pour satisfaire aux exigences de cette nouvelle réglementation européenne.

"Le RGPD est une refonte complète de son prédécesseur de l'ère commutée (1995) et l'un des domaines qui a été renforcé est ses dents", a déclaré Burns. « Les entreprises jugées non conformes par l'organisme de réglementation de la protection des données d'un État membre européen, qu'il s'agisse de votre petit studio d'applications jusqu'à Automattic, pourraient faire face à des pénalités allant jusqu'à 4 % du chiffre d'affaires annuel mondial de l'entreprise. Maintenant, il y a un contexte solide pour la discussion philosophique.

Cependant, tout le monde n'est pas convaincu que le GDPR sera bénéfique pour les consommateurs. Kitty Kolding, PDG et présidente d'Infocore Inc, une société internationale spécialisée dans l'approvisionnement en données de marché, a déclaré à ExchangeWire qu'elle pensait que le RGPD saperait "le caractère sacré de la confidentialité et de la sécurité des données des consommateurs" et entraverait le marketing et la publicité dans le monde entier.

Elle soutient que des dispositions telles que le "droit à l'oubli", qui exigent que les données des clients soient conservées au-delà de la durée d'utilisation active, rendront ces données plus susceptibles d'être piratées. En outre, l'organisme chargé de l'application de la nouvelle législation revendique l'autorité sur les entreprises, avec le droit de rechercher et de saisir des dossiers, sans aucun contrôle ni appel.

"Chaque entreprise, partout dans le monde, qui traite des données sur les citoyens de l'UE est également automatiquement soumise au pouvoir absolu de ce groupe - même si tout le monde peut deviner comment l'UE pense pouvoir appliquer un mandat aussi large en dehors de ses propres frontières", a déclaré Kolding.

Actuellement, seuls deux tickets de suivi mentionnent le RGPD, il n'est donc pas encore clair comment le cœur de WordPress répondra aux exigences de la nouvelle législation. Burns recommande aux principaux contributeurs de WordPress de suivre le processus d'évaluation de l'impact sur la vie privée afin de déterminer la bonne voie à suivre.

Quelle que soit la réponse de WordPress, les entreprises et les organisations qui dépendent du logiciel devront assumer la responsabilité de leur propre conformité, car ces exigences vont bien au-delà du noyau. Le GDPR s'applique à tout ce qui est ajouté à un site Web ou à une application qui collecte les données des utilisateurs. Par exemple, de nombreux plugins de formulaire de contact stockent les soumissions dans la base de données WordPress et les propriétaires de sites voudront réexaminer la façon dont les utilisateurs en sont informés.

"L'un des principaux changements apportés au RGPD s'appelle le principe de responsabilité", a déclaré Burns. "Les entreprises qui collectent des données personnelles doivent être totalement transparentes et responsables des données qu'elles collectent, de la manière dont elles les stockent et où, à qui elles sont transmises (comme des tiers), qui y a accès et combien de temps cela dure retenu. Les utilisateurs ont également le droit de demander que toutes les données collectées à leur sujet soient supprimées.

Il n'y a pas de plugin WordPress qui rendra instantanément un site compatible GDPR. Drupal a un module GDPR qui vise à s'assurer que le site respecte les directives et la législation établies par l'UE, mais il ne couvre pas toutes les exigences. L'automatisation d'une évaluation de l'impact sur la vie privée d'un site utilisant un CMS et potentiellement des dizaines d'extensions tierces est une entreprise complexe. Il s'agit d'un règlement qui obligera les propriétaires d'entreprise à se renseigner et à mettre en œuvre des pratiques de confidentialité qui placent les intérêts des utilisateurs en premier.

Avec la date limite de conformité qui approche, WordPress a l'occasion de réévaluer la façon dont le projet gère la confidentialité des utilisateurs et de faire des pas vers une plus grande transparence. Si les contributeurs envisagent de collecter davantage de données pour faciliter la prise de décision sur les fonctionnalités, comme indiqué dans la proposition de télémétrie de Rand-Hendriksen, ce projet offre une possibilité de travailler à la conformité au RGPD. Ces problèmes de confidentialité sont particulièrement importants à résoudre lorsque vous envisagez WordPress pour le gouvernement, les soins de santé, les établissements d'enseignement et d'autres sites Web sensibles aux données.

Burns considère le délai de conformité au RGPD comme une nouvelle opportunité pour WordPress de créer de meilleures structures de confidentialité et une sécurité juridique en utilisant le règlement comme une base de référence saine pour tous les utilisateurs.

"Tout le monde doit travailler sur des implémentations pour ses propres entreprises et sites dans tous les cas avant la date limite, en plus de toutes les modifications qui doivent être apportées au code WP", a déclaré Burns. "Il est important de se rappeler que la conformité au RGPD n'est pas une case à cocher que vous pouvez cocher en avril prochain. Il s'agit de vos processus, de vos flux de travail et de vos systèmes de responsabilité. Commencez maintenant."