Gawker Pasmado

Padrão

Notícias sobre a invasão e furto de dados do Gawker tendem a destacar o quanto as pessoas com contas no veículo são bobas quando da escolha de senhas, como nessa nota do Wall Street Journal.

Outro motivo de risada foi a afirmação incial do editor executivo do sítio, no Twitter, de que não haveria problemas.

Mas a pergunta mais interessante é se o banco de dados disponibilizado pelo grupo Gnostic seja capaz de fornecer informações sobre que tipo de usuário o sitio tem e como se comporta no site.

Continuo a insistir que o Gawker não passa de

um veículo de jornalismo contralado por uma agência de propaganda que promove clientes no veículo sem divulgar o conflito de interesses.

Podia-se, por exemplo, perguntar quantos usuários moram em domínios de anunciantes ou agências de propaganda, e tentar rastrear sua atividade no site. Os dados são disponibilizados em um arquivo de texto chamado lemons.rtf, com dados sobre 188.288 contas

grep -c microsoft.com lemons.rtf

São 29 os usuários com correio eletrônico de Microsoft — além de 9 de @APPLE.COM, 47 de @GOOGLE.COM, 28 de BLACKBERRY.NET e 1.754 de @MAC.COM.

A vasta maiora de usuários, no entanto, fazem uso de contas de correio eletrônico que são efetivamente anônimas:

  1. @GMAIL.COM |  50.270
  2. @YAHOO.COM | 41.333
  3. @HOTMAIL.COM | 27.079

O Jim Phelps, com conta @MAC.COM e senha “letmein” — deixa-me entrar! — esta brincando do líder do Impossible Mission Force, da série de televisão.

Não estou fazendo uma denúncia aqui, entenda bem — embora considero o Gizmodo, por exemplo, um  mero catálogo de produtos dos fabricantes-anunciantes que se esconde atrás uma farsa de comentário crítico para fazer acreditar que estaria oferecendo uma perspectiva independente ao usuário potencial.

Apenas tenho essa curiosidade, se dados deste tipo podiam ajudar na identificação dos fazeneiros daqueles latifúndios de faça-clique clandestinos que semeam a confusão em um ambiente onde a linha clara entre propaganda e jornalismo já foi apagado no nome do Novo Jornalismo.

Eu tennho um antigo colega, ex-jornalista, que agora trabalha fazendo exatamente este tipo de coisa — a gestão de redes de reportajabaganda-cidadão. A página de Facebook dele é uma vergonha!

Mas quer saber de uma coisa?

Testando meu programa de baixar arquivos .torrent, sem querer, acabei com um arquivo enorme de Tudo que a Led Zeppelin Ja Gravou.

Que maravilha!

Atacando “Communication Breakdown” com uma marreta foi o primeiro ato de tortura que eu cometi contra aquela coitada da amplificadora Fender minha.

O outro factóide do dia é o novo Estado da Blogosfera do motor de pesquisa Technorati — patrocinado pelo iPhone, hein?

Mais uma vez,  a tendência é no sentido da singularidade.

A metade dos 133 milhões de blogs conhecidos foram criados no ano passado.

Mas ausente da pesquisa de blogueiros — sobre a pergunta, “como foi montado o seu blog?” — é o censo dos blogs robôticos.

O produto acima promete, por exemplo, um faturamento de $3.000 por mês sem fazer nada — é só deixar o robô plagiar e colar no jardim de sendeiros que se bifurcam.

Já pensou se as senhas aburdamente simples não fossem geradas por um algoritmo?

Nem sei onde começar testando a hipótese, mas que precisamos do teste de Turing em alguma forma, estou achando que precisamos.

Vou fazer uma bibliografia, começando com este artigo.

A blogosfera, infelizmente, está infectada com várias formas de contéudo com propriedades de spam. Motores de pesquisas de blogs, por exemplo, são inundados com contéudo ou gerado por um algoritmo ou sequestrado cuja única finalidade é a hospedagem de propaganda ou o aumento do PageRank de sítios-alvos.

Os autores avaliam o uso de SVMs — máquinas com a abilidade de aprender — na identificação deste barulho.

Eles testaram uma amostra de 10,000 blogs que passaram por filtros anti-spam e acharam uma falha de reconhecer este tipo de conteúdo de 15%.

Factóide solto: correio eletrônico spam, em trilhões, em 2009

  1. Brazil: 7.7;
  2. USA: 6.6;
  3. India: 3.6;
  4. South Korea: 3.1;
  5. Turkey: 2.6;
  6. Vietnam: 2.5;
  7. China: 2.4;
  8. Poland: 2.4;
  9. Russia: 2.3;
  10. Argentina: 1.5.