Dever de Casa: Caçando o Círculo Fechado na Natureza Selvagem

Padrão

Algumas anotações cujo fio perdi, mas que eu quis postar.

Por mais que fico mergulhando dos aspectos técnicos de tudo isso, estou percebendo que estou ficando ainda mais chato nessas notas.

Que pena!

Mas é meu blog, não paga a conta de luz, tenho cada vez menos tempo para fazé-lo, e portanto faço com ele assim como a alma penada de Chico Xavier me manda fazer.

Se haver ângulo jornalístico nas divagações a seguir, talvez teria a ver com o contexto desse BloggerCon que está para abrir amanhã aqui no São Paulo, sob o sorriso do bom e velho Barão de Itararé — quemquiser que teria sido esse aristocrata jovial da Corte de Cosme Velho.

Eu estava pensando, ora, Brayton, qualquer calouro sabe que o modelo ideal para um círculo fechado é o modelo «lattice», acima — meu dicionário Porta Editora dá-lo como um termo de heraldria: «gelosia», «gradeado», «rótula» e — hein? — «adufa».

Quanto ao sentido matemático, sei lá.

Será que podemos captar exemplares dessa forma de organização em rede  na naturezas selvagem?

A rede diagramada acima serve de exemplo, por exemplo?

O contexto mais amplo que preciso levar em conta é a metodologia de SEO-SEM — otimização para e marketing por meio de motores de pesquisa. Dia desses vou fazer uma cola para me ajudar lembrar.

Tem dois factóides que parecem explicar muitas das observações que me deixam perplexo.

  1. Um IN-DEGREE muito além do previsto pela distribuição normal pode indicar um latífundio de laços atrás.
  2. Uma alta proporção de domínios como o mesmo IP único é um mecanismo comúm de latifúndio de spam.
Também existe a prática de «clonagem de diretórios» — o plágio de conteúdo de listas organizados de sites e tópicos, muitas vezes escondido do navegante mas visível ao robô do motor de pesquisa.
É cada vez mais comum cruzar páginas com que aparecem só consistir em um animação Flash, sem navegação para outros setores do site — embora lá nos bastidores pode haver volumes enormes de conteúdo spam.
At the same time, the most wide-spread method for creating a massive number of outgoing links is directory cloning: One can find on the World Wide Web a number of directory sites, some larger and better known (e.g.,the DMOZ Open Directory, dmoz.org, or the Yahoo! directory, dir.yahoo.com), some otherssmaller and less famous (e.g., the Librarian’s Index to the Internet, lii.org). These directories organize web content around topics and subtopics, and list relevant sites for each. Spammers then often simply replicate some or all of the pages of a directory, and thus create massive outlink structures quickly.

Mais sofisticado ainda é construir listas próprias por meio de aranhação — «crawling». Se eu quisesse me moralizar como grande torcedor do movimento neoconservador, com grande autoridade nesse mundo, seria simples simplesmente divulgar listas de samizdat pijamado colhidas pelo robô.

Esse gradeado é composto de triángulos completos — cada nó com laço recíproco com cada outro, e cada triângulo compartilhando pelo menos um nó.

Lembra a estrutura da insurgência no filme La Bataille D’Algers — já mencionado nessas notas como modelo pela organização de «marketing guerrilha». É por isso que não conhecemos os adversários de debate aberto e democrático na rede.

Algo interessante no caso da rede diagramada acima — perdi a ilustração, me desculpe — é que o «efeito Facebook» não explica a coesão da rede.

Agregadores robotizados de contéudo assim como as redes sociais têm as mesmas características que latifúndios de spam, e portanto não deveriamos dizer que interentidades A, B, e C são «ligadas» ou colaborando só pelo fato de terem páginas no Facebook.

Tirando o Facebook daquela rede, porém, ainda existe pelo menos uma rota ligando cada nó a cada outro.

Muitas vezes, uma estrutura forte desse tipo constitui uma «latífundio de laços» — um complexo de sites densamente interligados entre si que unanimamente endossa o site-alvo cujo «autoridade» é para ser estabelecida.

Estou começando a descubrir trechos de sites nos latifúndios de Multiply e Tumblr que parecem servir este fim.

O alvo desse método de criar «autoridade» enganosa — parece que o contraste entre o «Authority» e «Hub Rank» desse tipo de nó serve para desvendar o jogo — também é uma que rede coordenada por um «guardião de portal», cujos ordens são distribuidos rapidamente por ela.

Então, fiquei pensando que a rede da faculdade de direito de Harvard talvez forneça um exemplo.

Primeiro, com Pajek, tomo a «k-vizinhança» do site, da qual tiro o componente fortemente ligado — ou seja, desde cada nó do qual tem um caminho levando a qualquer outro.

Net > K-neighbours > All
Operations > Extract from Network > Partition
Clusters: 0-3

Dentro dessa rede, eu faço o censo de tricomponentes, tanto cíclicos quanto transitivos.

Net > Count > 3-Rings > Directed > All

Como isso, cada linha conectando um nó a outro recebe um valor que reflete o número de tricomponentes ao qual faz parte, que aumento o peso daquele laço na computação da «autoridade» do seu alvo.

Se eu dizer minha Neuza ser uma ótima cozinheira, e decenas de testemunhas — cada um dito um conhecedor de comida por muitas outras pessoas quem sabe de comida, confirmem, — a afirmação tem autoridade.

Reduzimos a rede tirando linhas com valor menor que 2, e depois tiramos os nós que ligam-nos.

Net > Transform > Remove > Lines With Value > Lower Than = 2
Net > Transform > Reduction > Degree > All = < 2

E agora? Perdi o fio do pensamento. Puxa!

Um método útil, como já disse, parece ser contar os triángulos da rede, o que dá um valor a cada laço que reflete o número de triángulos aos quais pertence.