Safra 47: Na Busca de Novos Sistemas Solares

Padrão

Estamos progredindo. A última iteração da minha «aranha» — programa que navega os laços de um grupo de sites iniciais, criando um banco de dados de sites relacionados e as relações descobertas — será completa em meia hora.

Ou seja: relativamente completa. O que fizemos foi lotar o Estádio Nacional de Chile com 160.000 suspeitos de subversivos para conduzir uma experiência na tradição do «mundo pequeno», que produziu a famosa hipótese de «seis graus de separação» de Stanely Milgram — que obteve seus resultados pelo bom e velho correio.

Até agora obtivemos informações sobre, digamos, 33% das interações entre os indivíduos no estádio.

Ou começamos a fuzilar todo mundo sem critério ou precisamos de mais repetições para extrair todos as 7.5 milhões de páginas conhecidas até agora, dentro de um limite teórico de 20 milhões..

O robô deve rodar até o ponto de não poder recolher as 50.000 páginas definidas como o tamanho mínimo da amostra de páginas ainda para serem perscrutadas.

Talvez faremos isso depois, mas a essa altura, uma rodada costuma durar uns quatro, cinco horas, por ter que comparar a nova amostra com a totalidade de páginas conhecidas.

A amostra obtida, entretanto, é suficiente para identificar algumas configurações gerais interessantes. Segundo o «power law», aliás, uma subrede mantém a mesma estrutura que a rede como um todo.

  • Começo: [2010/07/15 08:05]
  • Fim: [2010/07/22 08:24]

Minha pesquisa pretende descobrir a cibergeografia e as estratégias em rede — SEO-SEM — da indústria de democracia para exportação.

Essa indústria está interexistente em inúmeras ONGs, tal com IDEA.INT, que brotam do National Endowment for Democracy et caterva.

Nessa a quinta versão da experiênica, eu tomei nota de que o NED tem quatro divisões representando

  1. O partido Republicano
  2. O partido Democrata
  3. O patronato (CIPE)
  4. Trabalhismo (Solidarity Center, AFL-CIO)

Portanto, essa vez eu incluí o CUT entre as sementes para chegar à interexistencia do sindicalismo brasileiro — prévias observações anotaram laços de cooperação internacional nesse pilar do continuismo também, assim como vemos no mudancismo. Isso dará, eu espero, uma melhor simetria aos resultados.

Em tempo: o algoritmo, que avalia a «importância» de um site para determinar sua posição na fila, descubruiu ete site cedo — é site 4.189 de 160.000 — mas só voltou ao conteúdo do componente trabalista do NED no fim da exploração, sem completar a tarefa de obter seu IP.

Ou seja, tem pouca «importância» — medida como o número citaçãoes e outros fatores, assim como se todo mundo citasse meu ensaio sobre o Polifemo de Góngora, este seria uma «autoridade» sobre a obra.

Para comparar: o site NDIPARTIDOS.ORG — colaborção do partido Democrata com partidos afins em paises que falam espanhol, como, por exemplo, os EUA — é descoberto dentro dos primeiros 500 e indexado intensivamente, com acréscimos em cada rodada do mapeamento, indicando bastante citação por outros sites.

Não quero tirar conclusões de antemaõ, mas o componente trabalhista do NED parece isolado, contra uma triangulação forte bipartidária-empresarial.

Em favor do palpite é o fato do Solidarity Center ter apoiado um único projeto no Brasil no ano pasado — uma bolsa de $500.000 para uma campanha de publicidade, acho, contra condições de trabalho análogas à escravidão.

Existe um mito de apoio maciço de «liberais» norteamericanos à candidatura associada com trabalhismo em Brasil 2010, mas os fatos recolhidos até agora apontam uma participação pífia de sindicalismo internacional no nativo, segundo o critério que fala mais alto: $$$$$$$$$.

Corretoras de Novas Ideías: A Rede de Transaçóes

Além disso, nesse estudo pretendo identficar atores importantes — meus estimado admiráveis internautas novos — por estarem posicionados para servir nos cinco papeis de «corretagem» em uma rede enxergada como uma plataforma pela realização de transações.

Estes são o «corretor», o «zelador» ou «leão de chácara», o «coordenador», o «liaison» — eu sugiro «mensageiro de bicicleta» ou outro canal terceirizado — e o «representante».

Será interessante identificar  pessoas virtuais “importantes” atuando nesses papeis no comércio entre produtores dessa indústria de democracia como pipoca de microondas e suas distribuidoras, nesse caso — uma vez que não falo tcheco, slováco, servo, russo ou a língua persa — brasileiras.

Digo “importante” entre aspas, nota bene, uma vez que o processo de preparar a experiência me levou à hipótese da falta de importância de todo esse fúria e barulho em rede na campaha desse ano.

Medidas de importâncias são relativas à soma de relações dentro da rede, mas nada dizem sobre a relativa importância desse meio de comunicação entre outros.

A bugiganga mais estratégica no ámbito tupiniquim não é o iPhone, estou começando a achar.

Continua sendo o radinho de pilhas — assim como este ainda não perdeu relevância até nos EUA.

Qual a maior preocupação, de longe, por exemplo, de nosso corretor do estilo neocon, Vera Dextra?

Montando uma lista extensa de rádios locais e regionais que programam locutores como Dick Morris, Rush Limbaugh, Oliver North, G. Gordon Liddy, e Glenn Beck.

Ainda assim, o estudo da rede guerillha-miliciana dos Pais da Pátria fornece dados de grande interesse técnico para um aprendiz na grande arte do censo e análise de interentidades.

Por exemplo, o blog Vera Dextra é um exemplo confessado de um grupo de anoniminternavegantes com a missão de se posicionarem como «zeladores» — «doormen», «leões de chácara», «guardiões do portal», «portavozes», ou que seja — por ter a missão explícita de «traduzir o melhor da mídia de direita dos EUA» para Índio Not Tupy ler.

Outrosssim, quando a colunista Miriam Leitão foi selecionada pelo jornal The Washington Post para seu caderno Vozes Globais –editado por aquele bonitão Fareed Zakaria da rede CNN — servia de representante e portavoz da imprensa brasileira perante a audiência norteamericana.

Infelizmente, e levando à conclusão de que talvez o Planeta Brasil não sustentasse vida inteligente, como esperavamos. Uma nação capaz de produzir bossa nova e enriquecer urânio deveria haver.

Se bem que a imprensa nativa deveria ser representada por alguém típico do seu conservadorismo reinante, Celso Ming teria sido a melhor escolha, digamos. Pode-se discordar dele, mas em geral trabalha segundo o princípio de realidade recomendado pelo Freud e facilmente passa o teste de Turing, sendo um ser pensante de verdade.

É por isso que sempre recomendo certos cadernos do Estadão — que não sejam o LINK — para quem quer saber quais as fontes jornalísticas mais úteis desse país.

Globos e Carneiros: O Carnavelesco da Rede

Outra questão fundamental será quando e como é possível disfarçar o papel assumido — como no caso de «corretores», ou seja, intermediários aparentemente isentos — que na verdade são «coordenadores».

Isso acontece no caso de uma proliferação de agremiações espúrias que faz aparecer, quanto ao grupo A e grupo B, que

G(A,B) | A ∪ B =0

O seguinte, embora, também é verdade: que

G(A,B) | A ⊂ C ∧ B ⊂ C

Para todos nós, isso quer dizer que as fontes aparentemente independentes entre sim são orquestradas dentro do grupo ABC — com C fantasiada da porta-estandarte de outra escola de samba.

O sociólogos falam de «role strain» — a pressão de papeis contraditórios sobre um ator que despempenha ambos — enquanto os juristas e politicólogos falam de «conflitos de interesse».

A exploração de ambiguedades deste tipo, se continuemos com a metáfora financeira, é um tipo de ágio ético. O maior casuista do qual deve ser o Carlos Alberto di Franco, que se diz representante do New York Times no Brasil.

Já mostrei um caso-limite dessa estratégia com meu nem tão famoso guia para a montagem de um «bloco de eu sozinho».

Resumindo a técnica: as 999 contas de e-mail na minha conta de hospedagem viram 999 tuiteiros identificados por uma conta de Gmail, cada um com nome próprio mas cada um na verdade orquestrado por mim, cada um sendo eu. Sozinho.

Tem um certo Andrew Warhull, cidadão das Ilhas Bouvet, falando mal de mim no seu blog, por exemplo. Warhull sou eu. Falo mal de mim mesmo para aumentar o «zumbido» em relação ao meu nome, me fazendo uma figura mais supostamente polêmica.

Voltamos, com isso, ao modelo L.I.A.R. de confiabilidade em rede [pegue a citação].

Basicamente, trata-se de uma versão daquela velha regra de jornalismo: deve haver duas fontes independentes corroborando as afirmações de uma fonte tipo Garganta Profunda.

Não é por ocaso que o triángulo — na engenharia a estrutura mais sólida, pelo qual os eqípcios construriam pirámides em vez de cubos — é o elemento mais importante de nossas pontes metafórica, pelas quais passam informações em vez de caminhões cheio de iPhones e fita isolante para abastecer a praça.

Ou seja, o elemento básico é o «circúito crítico»:

Veja também

Algo dito no guia de Pajek resume o cenário muito bem: se bem que o triángulo completo é o componente fundamental do circúito critico, triángulos incompletos, chamados de «buracos estruturais», abrem espaço por um estratégia conhecido de tertius gaudens — «o intermediário aproveitador», digamos.

Uma variação muito comun dessa estratégia sendo divide et impera — divide e reina.

Um exemplo simples no texto vem de um análise de negociações durante um greve envolvendo trabalhadores hispanofalantes e gringos e gestores gringos. Deixamos aparte por enquanto o fato de idade, também importante.

A dupla Alejandro-Bob é chamada de uma «ponte». Alejandro é um representante dos outros mexicanos perante Bob e funciona como «ponto de engarrafamento» perante os compatriotas quanto às informaçôes vindas do representante Bob. Se

ele não entende bem o que fica dito pelo Bob, os quatro não entenderão direto.

Se Alejandro fosse pelêgo, vamos supor, podia até distorcer as informações vindas de Bob, um colega de sindicato — sendo assim um «corretor itinerante» disfarçado e de má-fe, que na verdade representa o patronato.

De Reductionibus Reticularam

Aguardando um resultado, então, estou estudando meu manual de processamento de dados de Pajek, ensaiando os vários jeitos de trabalhar com reduções em escala industrial de redes enormes.

cbrayton@macunaimachine:~/crawls$ sh pajek.sh

Aqui extraimos núcleos forte como «ilhas», despindo a rede de ligações tênues.

Tambèm ùtil è

root@macunaimachine:~:/wiredata$ wire-info-shell

Lembre-se de que nossa amostra foi recolhida a partir de um censo de 160.000 URLs únicos e acima de 7.3 milhões de documentos, por exemplo.

A estrela mais distante nessa nébula em deteriminado momento foi um arquivo contendo as notas divulgadas um dia em 2007 da blogueira ultradireitista Michelle Malkin.

Michelle representa uma bem-sucedida campanha de criar um efeito viral — o manual fal de «contágio» — ligado com o nome de um indivíduo que funciona como agente provocador.

O Indivíduo — ô barata ironia, com grande infraestrutura institucional semi-clandestina atrás dele, muitas vezes — vira tipo um astro de hroque na mídia corporativa, com convites a participar nas programas de debate de domingo de manhã nos Quatro Grandes Redes — ABC, NBC, CBS e Fox.

Andrew Sullivan — eu sou gay mas sou careta! —  é um caso notável. Gosto da revista onde ele trabalha como o que equivale o Azevedo de Veja, mas Andrew mesmo eu acho um pagagaio insuportável de discurso alheio, por quão incoerente que seja.

Nós chamamos esse tipo de figura de «pundit» — a palavra vem da língua hindi.

root@macunaimachine:/media/lixao-1/var/wiredata# grep pundit log/*harvester* > pundit

A aranha fica sabendo de uns 5.000 blogs com a palavra «pundit» no nome de domínio. Powerpundit, Daily Pundit, Megapundit, Right Pundit, Pundits.TheHill.com — este último um veículo para o consultor político Dick Morriso, o homem que César Maia gostaria ser quando crescer.

Um «pundit» podia ser definido como uma cabeça-falante que fala pelos cotovelos em um estilo bem acirrado, externando opiniões inflamatórias que dá maior apelo emocional ao programa. No sentido negativo, é alguém que tem opinião forte pronta até na ausência de fatos.

Lusófonos, me escreve com sugestões de um termo paralelo.

Leitões? Mainardóides?

Acho que a Veja inventou um termo bom quando deu como a senha para acesso ao contéudo da revista online, alguns anos atrás, a frase NOVOLACERDA. Pundits são Novos Lacerdas.

Ou talvez «portavoz-representante» seria mais elucidante.

O pundit encarna o movimento, dando-lhe cara humana, nome e biografia, e serve de duto para mensagens institucionais coordenadas por uma coletividade escondida.

Teatro.
El tuyo es puro teatro

Esta modalidade de blog está na moda no Brasil agora — DIOGOCHIUSO.COM, de certo jeito, embora este permanecer no anonimato, que o impede de virar «pundit», que acima de tudo precisa de credibilidade e a aparência de ser transparente.

Na verdade, e espero que tem pesquisas nesse sentido, a tentativa de vender o vício de covardanonimato como uma virtude não é muito bem-sucedida perante o grande público.

Ou assim aposta o continuismo Tupy desse ano, na minha observação. O admirável internauta novo DILMA13.COM.BR é assinado por DILMA VANA ROUSSEFF, por exemplo, para livrar a cara de Dilma Neuzona Maria Rousseff de Salgado da responsibilidade pelo conteúdo do servidor.

Outrossim, o Grande Berzoini aparece como o responsável para o PT.ORG.BR. Faça um WHOIS. Confira.

Na vasta maioria das vezes, porém, as versões brasileiras faltam, de longe, a massa crítica necessária para um bom desempenho, segundo minhas observações informais.

Se realmente queiram imitar os grandes Nomes Ponto Com de Gringolândia, deveriam observar que tipo um Malkin ou Volhokh ou Daily Kos ou Huffington construiu-se muito paulatinamente, durante uma década.

Tenho a impressão de que os virologistas brasileiras andam vendendo o mito de que uma marca se constrói quase instantaneamente — assim como, por exemplo, o personagem Rafa Define conseguiu 186.000 seguidores no Twitter no primeiro dia após o lançamento dessa campanha publicitária idealizada provindo, se me lembre bem, da ESPM, Anhembi-Morumbi, e Martha.

Isso não foi um exemplo emergente, onde costuma-se observar o «power law» em ação: 2 vira 4 vira 8 vira 16 vira … até uma massa crítca.

Entre as explicações possíveis para este passe de mágica: o bom e velho jabaculê, puro e simples.

Preparando a Cozinha de Dados

Então, eu passei parte do dia de ontem brincando com uma coletânea de dados com 375.000 URLs, feito por pesquisadores da universidade Notre Dame. Se consigo lidar com esse volume de dados, estou bem de mexer com uma amostra de 160.000.

Bem, algumas cálculos — «alcance média de influência» — demoram meia hora para completar, é verdade.

Como detectar e extrair subredes e grupos coesos? Os sistemas solares dessa galáxia? Aquele tipo de coisa.

O diagrama a seguir foi de longe meu maior sucesso, mais honestamente, nem me lembro de como cheguei àquele ponto!

Mal consigo ler minha própria mão no caderno de árvores mortas que mantenho ao lado do teclado, caso de apagão.

Deixa ver …

Os nós levam apenas um número, aliás.

Não há nada de semântica nessa rede.

Se bem que estou lembrando certo, para obter rede N16 fiz uma redução da rede segundo o grau de relacionamento — ou seja, um cálculo envolvendo as citações recebidas e feitas. Tiriamos assim os nós isolados ou moribundos.

C28 obtive não sei como. É uma particição com vários núcleos, talvez extraido do análise de «bi-componentes» forttes, seguindo o método do texto.

Consultei a hierarquia produzida por este análise e descubri a função «ponte» dos nós v3478 e v3479. Fiz um análise dos vizinhos dentro de um grau de separação destes dois elementos.

Se não estivesse presente o v3645, os dois podiam juntar forças para monopolizar os fluxos de informação entre os três componentes. Com ele, os integrantes do círculo superior à esquerda têm como confirmar o que os corretores estão dizendo, diretamente ou por meio de corretores coordenados por eles — v12600 e v12601.

Existe um circúito crítico.

Tudo isso dever ser metafísica grega pré-socrátia — tudo flui, como disse Heráclito — para o leitor que nem a gente, eu sei.

Estou preparando uma apostilha de todas as operações útis com instruções detalhadas como

Net > Transform > Reduction > Degree > All (Minimum Degree = x)

Net > Partitition > Degree > All

Info > Partition

Este último dá o número e parámetros de vários núcleos, que podem ser incluidos ou excluidos durante um

Operations > Extract From Network > Partition

O que há de mais?

Net > Components > Bicomponents

Operations > Shrink Net > Partition

Preciso organizar isso, inspirado na documentação de WIRED por C. Castillo, et al.

Eles apresentam exatamente o que deve ser feito, e em qual ordem, para com que um macaco mutante como eu possa fazer o trabalho até sem entendendo o significado de passos tomados. Disso aprendo fazendo.

E o seguinte? Como foi que eu fiz para fazer essa beleza?