A proposta de telemetria do WordPress aborda questões de privacidade de longa data à medida que o prazo de conformidade com o GDPR se aproxima

Publicados: 2017-02-01

No final de outubro de 2016, Morten Rand-Hendriksen criou uma proposta no WordPress trac para adicionar telemetria ao núcleo, um recurso opcional que coletaria dados anônimos sobre como as pessoas estão usando o software. Ele propôs que o novo recurso fosse exibido na primeira instalação ou atualização, desabilitado por padrão no admin com um controle disponível em Configurações->Geral. Uma opção que ele sugere é enviá-lo como um plug-in que é instalado automaticamente ao aceitar e desinstala automaticamente ao optar por não participar. Ele também identificou alguns exemplos de dados principais que podem ser rastreados, incluindo número de temas e plugins instalados, frequência de uso de visualizações específicas (Configurações, Personalizador etc.), versão atual, status de atualização, localidade e idioma.

“O WordPress se orgulha de ser um aplicativo criado pelo usuário para o usuário”, disse Rand-Hendriksen. “O problema é com a popularidade e alcance do WordPress hoje, a distância entre o WordPress 1% (ou mesmo 0,1%) e o usuário médio está se tornando tão grande que nós (as pessoas que contribuem para o núcleo do WordPress) não sabemos quase nada sobre o pessoas reais que usam o WordPress ou como eles usam o aplicativo.”

Durante o ciclo de desenvolvimento do WordPress 4.7, Rand-Hendriksen disse que esteve envolvido em várias conversas em que os participantes assumiram o uso de recursos sem nenhum dado para respaldar suas opiniões. Ele afirma que os colaboradores do WordPress não possuem os dados necessários para saber como os usuários estão interagindo com o aplicativo e seus recursos.

“O argumento geral era que, com base na regra 80/20, certos recursos deveriam ser adicionados enquanto outros deveriam ser removidos”, disse Rand-Hendriksen. “Eu continuei ressaltando o fato bem conhecido de que não temos ideia de quais recursos 80%, ou mesmo 20%, dos usuários do WordPress realmente usam, então qualquer alegação de validade na regra 80/20 é, na melhor das hipóteses, suposição.”

Sua proposta afirma que todos os dados coletados devem ser públicos para transparência e também disponibilizados aos usuários finais no admin e no WordPress.org.

A ideia teve alguns meses para marinar e gerou alguma discussão sobre o que um protótipo implicaria. A core committer Ella Van Dorpe criou um plugin experimental wp-data autônomo para rastrear algumas interações simples com o editor. Os participantes da discussão recomendaram a criação de uma configuração Elasticsearch/Logstash para armazenar os dados, tecnologias que a equipe de sistemas do WordPress.org já implantou antes.

“Acho que um bom resumo é que há muitos obstáculos no caminho e atualmente ninguém tem tempo para trabalhar nisso”, disse Greg Brown, um Data Wrangler da Automattic, em uma discussão de acompanhamento sobre o ticket três semanas atrás. “Em última análise, acho que o maior obstáculo é conseguir alguém com tempo, inclinação e persistência para trabalhar nisso. Implementá-lo em .org é a coisa certa a fazer eventualmente, mas suspeito que levará um bom tempo.”

O desenvolvedor líder do WordPress, Dion Hulse, confirmou que o WordPress já está rastreando muitas dessas estatísticas e que criar um protótipo na infraestrutura do WordPress.org seria a melhor opção a seguir.

“Também seria valioso ver como nosso sistema de estatísticas existente pode complementar ou ser substituído pela proposta aqui”, disse Hulse. “Eu menciono isso porque a maioria das estatísticas da descrição original já são rastreadas, mas não expostas de nenhuma forma. A única novidade mencionada aqui é a frequência de uso de visualizações específicas (Configurações, Personalizador, etc) e parte de transparência (que provavelmente ainda seriam apenas resumos anônimos, não dados exatos).”

Projeto de telemetria WordPress fornece uma solução para preocupações de privacidade de longa data

Mover o rastreamento de dados atual do WordPress para um recurso opt-in mais transparente também forneceria uma solução para algumas preocupações de privacidade de longa data levantadas por contribuidores em um ticket de rastreamento de seis anos. O WordPress rastreia o número de blogs e usuários em uma determinada instalação, juntamente com o URL de instalação nos cabeçalhos, para facilitar as solicitações de atualização que podem se tornar problemáticas, principalmente no caso de grandes instalações multisite.

“Mesmo que um usuário saiba que alguns dados precisam ser passados ​​para uma verificação de versão do núcleo, plugins ou temas, a quantidade de dados passados ​​para o controle remoto é obviamente mais do que o necessário para fazer a verificação de versão”, comentou um colaborador no ticket . “Mas os usuários devem ser informados antecipadamente para que possam decidir livremente por conta própria se quiserem, em vez de serem forçados a apoiar o projeto com seus dados de uso. Eles poderiam receber um opt-in para fazê-lo.”

“O número de usuários registrados que tenho no meu site vinculados ao URL que é enviado com solicitação de rastreamento fornece informações vitais sobre o quão bem minha empresa pode estar indo – informações que são minhas e apenas minhas”, disse Danny van Kooten, desenvolvedor de plugins do WordPress. . “No mínimo, poderíamos deixar bem claro que o WordPress está rastreando essas informações e o que exatamente está fazendo com elas. Eu realmente não acho que haja qualquer desculpa para isso.”

Os desenvolvedores podem filtrar os dados para satisfazer suas preocupações com a privacidade, mas é algo inextricável do processo de atualização para instalações multisite maiores. Também é um obstáculo técnico muito grande para a maioria dos usuários regulares que seriam mais bem atendidos por uma interface do usuário simples, permitindo que eles optassem por não coletar dados.

A proposta de telemetria WordPress de Rand-Hendriksen dá ao projeto a oportunidade de formalizar quais dados estão sendo coletados, declarar o propósito por trás deles e permitir que os usuários escolham se desejam ser incluídos.

O Regulamento Geral de Proteção de Dados da Europa (GDPR) pode levar o WordPress a uma coleta de dados mais transparente

O progresso no projeto de telemetria e no tíquete em relação às questões de privacidade tem sido lento. Nem parece ser uma prioridade entre os contribuidores, mas o Regulamento Geral de Proteção de Dados da Europa (GDPR) pode fornecer o impulso necessário para empurrar o WordPress para uma coleta de dados mais transparente e responsável.

O GDPR é uma revisão da lei de proteção de dados na Europa com requisitos muito mais rigorosos do que as leis anteriores. Exige divulgação total para qualquer coleta de dados e avisos de privacidade padronizados para ajudar os usuários a entender onde e como os dados estão sendo usados. O consentimento para a coleta de dados deve ser confirmado e os usuários têm o direito de acessar seus próprios dados. Também inclui o direito de apagamento ou “o direito de ser esquecido”, que permite aos usuários remover seus dados da web. O GDPR entra em vigor em maio de 2018.

Heather Burns, especialista em direito digital que consulta e fala extensivamente sobre leis e políticas da Internet, encorajou os colaboradores do WordPress a enquadrar a discussão sobre preocupações com privacidade em termos de trabalhar em conformidade com uma estrutura específica.

“Para os propósitos desta discussão, o núcleo deve funcionar de acordo com o padrão GDPR por dois motivos”, disse Burns. “A primeira razão está nas diferenças culturais. Os EUA não têm um único regulamento abrangente de proteção de dados e privacidade, ao contrário da Europa, onde temos esse regime de proteção de dados que se aplica a todos os dados pessoais, independentemente do uso, formato ou setor. Portanto, o GDPR oferece aos desenvolvedores – mesmo aqueles fora da UE – um conjunto de padrões robusto, saudável e muito difícil de seguir. Dado o que vimos saindo da Casa Branca na semana passada, o GDPR também fornece um ponto de partida tão bom quanto qualquer outro para proteção defensiva do usuário.

“A segunda é que o GDPR é extraterritorial. Aplica-se aos dados pessoais de qualquer pessoa na Europa, independentemente de onde o serviço online esteja localizado. Se sua empresa estiver nos EUA, Austrália ou Israel, mas você tiver usuários europeus, precisará proteger os dados deles de acordo com os padrões europeus do GDPR.”

A Pricewaterhouse Coopers pesquisou recentemente 200 empresas multinacionais sediadas nos EUA com mais de 500 funcionários e descobriu que 77% planejam gastar US$ 1 milhão ou mais em conformidade com o GDPR. Mais da metade dos entrevistados citou a prontidão para GDPR como a maior prioridade em suas agendas de privacidade e segurança de dados.

As pesadas penalidades de descumprimento são um dos fatores determinantes por trás das empresas americanas gastarem milhões de dólares para satisfazer os requisitos desta nova regulamentação europeia.

“O GDPR é uma revisão completa de seu antecessor da era discada (1995) e uma das áreas que foi reforçada são seus dentes”, disse Burns. “As empresas que não estiverem em conformidade com o regulador de proteção de dados de um estado-membro europeu, seja seu pequeno estúdio de aplicativos até a Automattic, podem enfrentar penalidades de até 4% do faturamento anual global da empresa. Agora há algum contexto sólido para a discussão filosófica.”

No entanto, nem todos estão convencidos de que o GDPR será benéfico para os consumidores. Kitty Kolding, CEO e presidente da Infocore Inc, uma empresa internacional especializada em fornecimento de dados de mercado, disse ao ExchangeWire que acredita que o GDPR prejudicará “a santidade da privacidade e segurança dos dados dos consumidores” e prejudicará o marketing e a publicidade em todo o mundo.

Ela afirma que cláusulas como o “direito ao esquecimento”, que exigem que os dados do cliente sejam retidos além do tempo em que estão em uso ativo, tornarão esses dados mais suscetíveis a hackers. Além disso, o órgão de execução da nova legislação reivindica autoridade sobre as empresas, com direito de busca e apreensão de registros, sem qualquer fiscalização ou recurso.

“Toda empresa em todos os lugares que lida com dados de cidadãos da UE também está automaticamente sujeita ao poder absoluto desse grupo – embora ninguém saiba como a UE acredita que pode impor um mandato tão amplo fora de suas próprias fronteiras”, disse Kolding.

Atualmente, apenas dois tickets de trac mencionam o GDPR, então ainda não está claro como o núcleo do WordPress responderá aos requisitos da nova legislação. Burns recomenda que os principais contribuidores do WordPress passem pelo processo de conduzir uma avaliação de impacto de privacidade para determinar o caminho certo a seguir.

Independentemente da resposta do WordPress, as empresas e organizações que dependem do software precisarão assumir a responsabilidade de sua própria conformidade, pois esses requisitos vão muito além do núcleo. O GDPR se aplica a qualquer coisa adicionada a um site ou aplicativo que colete dados dos usuários. Por exemplo, muitos plugins de formulário de contato armazenam envios dentro do banco de dados do WordPress e os proprietários do site vão querer reexaminar como os usuários são notificados sobre isso.

“Uma das principais mudanças com o GDPR é chamada de princípio de responsabilidade”, disse Burns. “As empresas que coletam dados pessoais devem ser completamente transparentes e responsáveis ​​sobre quais dados estão coletando, como estão armazenando e onde, para quem estão sendo transmitidos (como terceiros), quem tem acesso a eles e quanto tempo duram. retido. Os usuários também têm o direito de solicitar que quaisquer dados coletados sobre eles sejam excluídos.”

Não há plugin do WordPress que torne instantaneamente um site compatível com GDPR. O Drupal possui um módulo GDPR que visa garantir que o site siga as diretrizes e legislação estabelecidas pela UE, mas não cobre todos os requisitos. Automatizar uma avaliação do impacto na privacidade de um site usando um CMS e potencialmente dezenas de extensões de terceiros é um empreendimento complexo. Este é um regulamento que exigirá que os proprietários de empresas se eduquem e implementem práticas de privacidade que coloquem os interesses dos usuários em primeiro lugar.

Com o prazo para a conformidade se aproximando, o WordPress tem a oportunidade de reavaliar como o projeto lida com a privacidade do usuário e dar passos em direção a uma maior transparência. Se os colaboradores estiverem buscando coletar mais dados para auxiliar na tomada de decisões sobre recursos, conforme descrito na proposta de telemetria de Rand-Hendriksen, este projeto fornece um caminho para trabalhar em conformidade com o GDPR. Essas preocupações com a privacidade são especialmente importantes ao considerar o WordPress para governo, saúde, institutos educacionais e outros sites sensíveis a dados.

Burns vê o prazo de conformidade do GDPR como uma nova oportunidade para o WordPress construir melhores estruturas de privacidade e segurança jurídica usando o regulamento como uma linha de base saudável para todos os usuários.

“Todo mundo precisa estar trabalhando em implementações para seus próprios negócios e sites antes do prazo final, além de quaisquer alterações que precisem ser feitas no código WP”, disse Burns. “É importante lembrar que a conformidade com o GDPR não é uma caixa de seleção que você pode apertar no próximo mês de abril. Trata-se de seus processos, seus fluxos de trabalho e seus sistemas de responsabilidade. Comece agora."