Controvérsia em torno de temas “populares” do WordPress.org expõe fraquezas no algoritmo
Publicados: 2016-10-27
Se você já se perguntou como o WordPress Theme Directory identifica e classifica os temas exibidos na guia popular, pode se surpreender ao saber que não tem nada a ver com classificações. A popularidade é uma qualidade um tanto subjetiva para medir em primeiro lugar, mas o WordPress.org possui um algoritmo para dar aos usuários uma ideia de quais temas estão em alta.

O número de sites que usam um tema é a primeira métrica que vem à mente para popularidade, mas não pode ser limitada a isso ou os resultados podem ser distorcidos para temas mais antigos que não são mais populares. Samuel “Otto” Wood, em resposta a um tópico no Twitter sobre como os temas parecem estar jogando no sistema, criou um vídeo para explicar como o algoritmo de popularidade funciona.
“Popular é atualmente instalações ativas divididas pela idade do tema e alguns outros fatores”, disse Wood. “As classificações atualmente não levam em conta isso. Estamos tentando elaborar um algoritmo para adicionar classificações a ele. Na maioria das vezes, é uma coisa de popularidade.”
Pedi a ele mais esclarecimentos sobre os outros fatores e ele disse que varia dependendo de quais dados eles têm e como esses dados aparecem ao longo do tempo. “Nós o ajustamos para que ele mude com bastante regularidade, mas ainda refletindo o que é popular na época”, disse Wood.
Dion Hulse, que também ajuda a manter a infraestrutura do WordPress.org, disse: “Não é publicado por design, para evitar que os autores joguem demais. Além do que Otto disse, a única outra parte pública disso é que um tema deve ter pelo menos duas semanas para ser incluído nos rankings populares.”
No final do ano passado, as contagens de download de temas foram substituídas pelo número de instalações ativas para tentar impedir que os autores do tema jogassem no sistema para aparecer na guia Popular. Jogar o sistema é muito mais difícil agora, mas existem outras maneiras de fazê-lo, devido às medidas imperfeitas para instalações ativas.
Como o WordPress.org mede instalações ativas para temas
O tópico de instalações ativas foi reacendido ontem por Matt Medeiros, proprietário de uma pequena empresa e autor do tema WordPress.org, que suspeitou do autor de um tema recentemente popular de jogos no sistema.
Os downloads/ativos do tema Gaming .org estão em alta. Este tema “já tem 10 mil instalações ativas”. DL conta aproximadamente 3k @Otto42 pic.twitter.com/aaYwWcsvu8
— Matt Medeiros (@mattmedeiros) 25 de outubro de 2016
O tema Vertex, novo no diretório este mês, já tem mais de 10.000 instalações ativas, apesar de ter uma contagem de downloads muito menor e nenhuma classificação. Medeiros fez um vídeo explicando o que ele percebeu como atividade suspeita, levando-o ao quarto lugar mais popular no WordPress.org. Isso levou Samuel Wood a filmar uma resposta, que elimina algumas das falhas no sistema que mede as instalações ativas.
“A contagem de instalação ativa é uma contagem de sites que nos informaram que estão verificando uma atualização para esse tema e que está ativo”, disse Wood. Ele explicou que mais de 10.000 neste caso e em muitos outros é uma estimativa aproximada porque o WordPress.org não tem uma medida exata de quantos sites instalaram um tema:
O que estamos contando é sim, o número de instalações ativas de um tema chamado Vertex. Isso pode incluir temas que não estão em nosso diretório, como este de Temas elegantes. Se o tema não estiver em nosso diretório, ainda receberemos relatórios sobre ele. A única maneira de não fazermos isso é fazer com que o próprio tema verifique se há atualizações em vez de nos verificar se há atualizações, o que o tema deve fazer. Eu chegaria ao ponto de dizer que qualquer tema comercial deveria estar verificando seu site comercial, seus sistemas não os nossos, mas se eles não tiverem nenhum código especial para lidar com esse caso, sim, ele reportará ao nosso servidor de API em busca de atualizações. E se tiver o nome Vertex então sim, será contado como sendo o tema Vertex.
Nesse caso, os criadores do tema Vertex foram informados de que o nome já estava em uso fora do WordPress.org. Eles se ofereceram para mudar o nome do tema para iVertex durante o processo de revisão, mas a Equipe de Revisão do Tema decidiu que não era necessário.

“Não há jogos acontecendo por trás disso”, disse Wood. “Se alguém jogar no sistema, eu o encontrarei. Eu garanto-te. No entanto, este não é o caso. Nosso algoritmo atual analisa as instalações ativas e, se você escolher um nome muito popular [fora do WordPress.org], poderá ter um grande número de instalações ativas sem que realmente seja esse tema que está sendo contado.”
Esse problema pode ser resolvido com um ID exclusivo para temas. Wood disse que há um ticket básico de seis anos que ele gostaria de implementar, mas atualmente não é uma prioridade.
“Infelizmente, não há nenhum esforço real para fazer isso”, disse ele. “Em algum momento no futuro, gostaria que todos os temas e plugins no diretório do WordPress obtivessem um ID exclusivo que eles pudessem colocar em seus cabeçalhos e, quando reportarem, ter esse ID exclusivo identificará exclusivamente esse tema ou plugin. Isso eliminaria tantos problemas para mim. Isso tornaria as atualizações muito mais fáceis. Eu seria capaz de fazer muitas coisas úteis com ele e isso me permitiria resolver esse problema aqui mesmo.”
Como o algoritmo de temas populares afeta os negócios temáticos
A instalação de IDs exclusivos não é uma solução fácil, pois os relatórios de temas precisariam ser revisados e vários sistemas que interagem entre si precisariam ser alterados. Valeria a pena, a longo prazo, obter relatórios mais precisos no WordPress.org, que é o primeiro lugar onde muitos usuários navegam quando procuram um novo tema. Se as contagens de instalações ativas não são uma representação adequada das instalações via WordPress.org, não faz sentido fixar o algoritmo popular a esse número.
Perguntei a Matt Medeiros por que ele escolheu destacar a situação com a Vertex, e ele explicou por que muitos proprietários de pequenas empresas têm um forte interesse na página de temas populares.
“Está ficando cada vez mais difícil sobreviver como uma loja temática hoje em dia”, disse Medeiros. “Os autores independentes são ofuscados por grandes lojas temáticas e megamercados. Para mim, .org é a única fonte de distribuição para meus temas, e desejo ver o repositório se tornar o local de fato para encontrar temas de qualidade. Infelizmente, nem todos os temas são enviados para 'fazer certo' e muitos surgem para ganhar dinheiro rapidamente de usuários finais desavisados. Os melhores lugares valem MUITO dinheiro (veja: Zerif) e, juntamente com um mecanismo de busca de temas envelhecido, os jogos para o topo valem a pena, mesmo no curto prazo. Usuários desavisados, que acham a pesquisa muito desafiadora, se contentam com o que está à sua frente.”
Medeiros fez referência ao Zerif Lite, que foi recentemente removido do WordPress.org, devido a violações de diretrizes que começaram a ser aplicadas após a aprovação do tema. O tema estava rendendo dezenas de milhares de dólares para o ThemeIsle, graças ao seu frequente lugar entre os temas mais populares no WordPress.org. Ionut Neagu, CEO da empresa, estima que a suspensão de Zerif Lite do diretório diminuirá a receita de US$ 70 mil/mês da empresa em 50%.
“Há um desgosto persistente no processo de revisão para upsells freemium”, disse Medeiros. “Nem todo mundo concorda que as pessoas deveriam ter um produto upsell aqui, e isso é lamentável. Como proprietário de uma pequena empresa, essa receita me ajuda a reinvestir na comunidade WordPress, WordCamps, contratar e treinar pessoas no desenvolvimento com WordPress. Às vezes, o processo de revisão, misturado com as emoções dos outros, parece um imposto crescente contra o pequeno empresário de software, como eu.”
Ao chamar a atenção para os números suspeitos de instalação ativa do tema Vertex e as falhas no algoritmo, Medeiros atraiu resistência de Wood, que não vê o diretório como um lugar onde as empresas devem esperar o retorno de seus investimentos.
“O diretório temático não é um anúncio para vender seus produtos”, disse Wood. “É exatamente esse tipo de pensamento que me faz querer banir completamente todos os temas com uma versão 'paga' do diretório. O diretório de temas não é um meio de publicidade. Esse não é o seu propósito. Se essa é sua intenção, então você está fazendo errado.”
Medeiros disse que não tem interesse em revisar todos os temas para possíveis fraudes, nem espera que Otto faça o mesmo. Vertex é apenas um exemplo entre muitos onde as falhas no algoritmo estão em exibição pública.
“Escolhi destacar essa questão porque acho que o repo pode ser uma escolha melhor para os usuários do que um mercado com fins lucrativos”, disse Medeiros. “De qualquer forma, só posso esperar que desenterrar essa conversa ajude a afetar a mudança para melhor.”
