Caderno de Laboratório: Enfocando Os Alemão

Padrão

Como já contei, eu fiz besteira.

O que era para ser o glossário-sociometria definitiva do «estilo neocon» tropical falhou porque me esqueci de mudar um parâmetro no WIRE, criando matriz maior que os 40.000 endereços IP únicos da rodada anterior.

Gol contra. Vou recomeçar, e rezar que a NET consiga manter uma conexaõ constante pelas 72 horas necessárias. Eu diria que as chances são de 88.8888% — muito longe do 99.9999% desejado.

Um primeiro índice da insufiência da amostra é a ausencia total de qualquer PSDB na blogosfera obtida.

E o  PMDB, o outro partido de coronelismo eletrônico maciço, em rede?

Ainda é cedo para concluir que os DEM-PFL — que correm risco de perder o segundo lugar na chapa de mudancismo, li hoje — são mais comprometidos com o estilo Dick Morris de existir em rede que seus colegas, mas é discutível, e haverá dados para resolver a questão, espero.

Ainda assim, estou navegando em uma riqueza de dados para alimentar meus brinquedos de análise, na tentativa de descobrir alguma grande tendência nova.

Decerto a memeologia da «força de novas idéias» tem assinatura inegalável da Rua K, a Avenida Madison, e o Instituto Hoover. Mas o que acabei achando é que há outro componente que eu deveria ponderar com mais ponderação: os alemão.

Considere a Juventude Democrata, como multiplicam-se no campo virtual. São bem-articulada por caralho, muito além do «shopping de inovação» de um MobilizaPSDB ou Ciberdilma, me parece a mim.

E o que fiquei anotando hoje é o quanto tem de domínio ponto Deutschland nessa mistura.

Como leitor assíduo do ur-DEMo 2.0, Ceśar Maia, já vi o quanto o ex-blogueiro ex-prefeito tira os factóides de cada dia da Fundaçõ Adenauer, que possui uma trajetoria de ingerências políticas desastrosas na América Latina que só perde para a Bahia de Cochinos.

Werner Herzog Só Dança Mambo

O quê que há com o alemão nos trópicos? O marido de uma colega ofereceria a oportunidade de observar a espécie de perto, no mato grosso — se não fosse tão grosseiro tratar um amigo como cobaia em conversas de botequim.

Também tenho o caso de Frank, executivo de telecom bavariano cujo duplex no Upper East Side eu cheguei a habitar por um tempo, em circustâncias confusas.

Frank é gente fina, mais havia dois fatos que achei curioso. Primeiro, ele vivia mandando casais bavarianos dos mais bavarianos a ficar no andar de baixo, e eles sempre queriam fazer a mesma coisa: frequentar uma igreja gospel de Harlem daqueles onde a banda antigamente tocava atrás de James Brown.

Me lembravam daquele filme sobre o Alemão do Acordeão bmbeiro que perde-se no bayou de Louisiana atrás de um som de zeydeco que ele ouviu na rádio no dia da sua aposentadoria. Frank também.

Ele tinha um aparelho de som maravilhoso, eu nunca vi igual, encarregado com 2.000 CDs e tocando faixas aleatoriamente dia e noite.

E cada santo disco foi de música cubana. E nada de Buena Vista Social Club e as Dez Maiores de Célia Cruz. Som primitivo de guajira-caipira.

Leni Reifenstahl fechou a carreira fotografando tribalistas africanos.

Não somos racistas.

A linha dura israelense, certa ou errada.

Mas estou viajando demais agora.

Deixe-me anotar alguns detalhes técnicos antes de perder o fio.

Depois, voltaremos ao Insituto Goethe e os prussianos anarcocapitalistas do sul gaúcho.

Resultados das Quartas de Final

De novo, a proporção de páginas encontradas em português foi muito pequena, apesar de sites lusófonos aparecerem entre as sementes e de grandes sites de contéudo, como iG, Terra, UOL, Globo, et al, aparecerem logo no começo da exploração.

Nos arredores de 4% das páginas recolhidas são em português.

Algo como 0,5% dos sites tem domínio .BR.

Este dado podia ser enviesado pela preferência da blogueirada Tupi para BLOGSPOT.COM, porém.

grep blogspot.com sites.csv > blogspot.csv

São 7.800 dos 40.000 na amostra, ou 19,5%.

Não sabendo exatamemente como funciona o identificador de idiomas — acho que mede contra uma amostra de palavras em cada linguagem — não sei exatamente dizer o que signifique o fato, porém.

Além disso, a proporção de lusofonia na «fronteira» da expedicão — sites identificados mais ainda não explorados — é muito maior, tal como é dos sites identificados como componentes MAIN_MAIN, MAIN_IN e MAIN_OUT.

Que quer dizer isso? Explico quando eu entendo. Com TUNNEL, TIN e TOUT estou muito intrigado, mas parece envolver mistérios dos caminhos de pacotes de dados nos quais ainda não sou iniciado.

Não está documentado bem por Castillo e os outros chilenos autores de WIRE, o robô bacana utilizado para recolher os dados.

Aqui ô: um estudo da Internet argentina em inglês por C. Castillo et al, 2006.

Gosto deste El Chato. Me é muito útil e tem blog legal.

Puxa, é muito bem-explicado isso.

Não há “tentáculos” em nossa amostra, mas os túneis incluem Edu Guimarães e o governo estadual de Nova Jersey. Vá saber porque.

O ponto geral é que todos os indícios são que precisamos de uma amostra maior para alcançar o «estilo neocon» e a contradição mudança-continuação desse ano eleitoral  em português sem mesóclise.

Esperamos ver um nível muito menor de “ilhas” com uma amostra maior.

A Horda Dourada de PHP

PHP, sistema código-aberto para gestão dinámica de conteúdo, vence no primeiro turno.

ASP, proprietário de Microsoft, perde cada vez mais peso no mercado livre.

(CFM — Cold Fusion, de Macromedia-Adobe — também.

Eu trabalhava num servidor Windows NT com CFM em 2000-1. Não era tão mal assim.)

Em minha experiência, isso é porque a conectividade com bancos de dados em ASP é um pesadelo — fui treinado no sistema pelo banco de investimentos onde eu trabalhava — enquanto PHP-MySQL é tão simples que até eu posso conifgurar e fazer funcionar.

Quer um exemplo?

O Diário Oficial de São Paulo. Quantas vezes já fez uma busca para receber o equivalente da tela azul de morte na forma de um erro de ODBC — conectividade aberta aos bancos de dados?

Além do absurdo de receber os dados de pesquisa na forma de uma versão da página impressa em formato PDF, que tem que ser processado de novo?

Por exemplo, eu estava pesquisando o promotor Blat, as causas que pleitava no passado, no caderno jurídico. Vamos ver processo 2005/4747-666.

Retorna uma página de decenas, senão centenas, de notas breves sobre processos em andamento. Em formato PDF, apesar de ser texto simples. Tenho que fazer uma Ctl-F Blat para achar a informação desejada.

Pretendendo recolher fatos sobre um grande número de processos, eu fico meio furioso. Transparência um ova! PRODESP pisou na bola. Feio.

Mais uma divagação, desculpe.

O Relatório da Santa Inquisição

Vamos fazer o seguinte: aqui tem o relatório estatístico de site em formato PDF:

O fato geral mais notável, eu achei, e o seguinte: Sites brasileiros não entram na lista dos sites mais citados — COMPONENT_IN — mais entram sim na lista de sites que mais citam outros sites — COMPONENT_OUT.

Quer dizer que, nessa amostra, o blogueiro brasileiro é um agregador admirável de fontes, provavelmente por ser adepto de uma certa teologia de otimização para motores de pesquisa — SEO, na sigls em inglês.

Construindo seu ideário, ele consulta uma grande variedade de fontes, entre outros blogueiros brasileiros e o movimentarianismo gringo.

wire-info-shell

Até agora, eu fico desperdiçando muito tempo com

wire-info-shell

Este é um interface básico aos dados que permite, entre outras coisas, o rastreamento de cadeias, ou correntes, de tolos.

Exemplo: Qual o primeiro site em português a ser descoberto pelo robô, começando com as sementes?

Como já disse, as sementes são

  1. Institutos de pesquisa e fábricas de ideologia gringas, como CATO, ATLAS, HOOVER, ENDEAVOR, AEI …
  2. Agentes exportadores de democracia de Tio Sam — NED.ORG, NDI.ORG, IRI.ORG ….
  3. Apaniguados lusófonos e hispanofalantes assumidos destas, como OrdemLivre.org e IMIL.ORG.BR
  4. Agregadores de informaçãoes gerais sobre filantropia, propaganda e relações públicas, como o wiki de SourceWatch
  5. Afiliados internacionais da Federalist Society, por este ser de tamanha influência ideológica

Começo explorando os laços indo e vindo — IN e OUT — das sementes, que são nós 1 a 25.

(info) sitelinks 1
(info) siterevlinks 1

Caimos imediatamente no mundo de econoblogueiros peruvianos na tradição de Hernando de Soto.

O primeiro luśofono, entretanto, é O Sinico, de Macão.

Observar-emos o uso de mesóclise!

Este chega a ser citado por um dos agregadores mais significativos do anglolusosfera — o Consenso Velho de Vinho de Porto — O Amigo do Povo.

Este por sua vez é citado pesadamente por Águia Con[t]rária [sic], mas não tem grande número de multiplicadores.

Agora, qual o site brasileiro descoberto mais cedo no processo, com o menor número de registro?

Parece ser número 95, IEE.COM.BR, mais temos que levar em consideração o modismo de sites estilo JOAONINGUEM.COM e SENADORAPELIDO.COM.

Número 96 — de 40.000 — é Juventude Democratas, pontocom.

O pontorg da JD é 37714. O pontorgbra partidário dos DEM-PFL é 37713.

O JUVENTUDEDEMOCRATAS.NING.COM é 37715, bem na fronteira paraguaya.

Então, a Juventude Pontocom parece ser muito bem otimizada para motores de pesquisa, apesar de ter só um laço chegando: No. 6, RELIAL.ORG, uma das sementes originais, e organizado pela fábrica ideológica ATLAS ECONOMIC RESEARCH FOUNDATION, este patrocinador do INSTITUTO MILLENIUM (562).

Era para pôr o IMIL como semente, mas um erro de digitação deixou ele fora.

Agora estou meramente chutando e correndo atrás de fantasmas.

É divertido mas não muito substantivo. Você foi avisado.

Perfurações na Pré-Sal

Sites interessantes escolhidas mais ou menos à toa incluem 1171: REDPARTIDOS.ORG.

Dono: NDI.ORG, esta a fundação apartidária do partido Democratas dos EUA, esta parte de NED.ORG, o exportador de democracia oficial de Tio Sam, subsidiado pelo contribuinte.

Aqui seria um bom ponto para um «drilldown» — uma expedição de um robô menor para perfurar o conteúdo e afilaçãoes do site na camada pré-sal.

Outro é 2515, BLOG.LUISPEDRO.ORG, porque abre a porta a uma blogosfera prtuguesa  de prtugaw no estilo neocon.

O 249, OINSURGENTE.ORG, é um exemplo de um site com alto índice de HUB e AUTHORITY — centralidade e autoridade — por ter muitos laços indos e vindos que são de maior qualidade.

Qualidade, disse? Como assim?

Se Luis Nassif falasse bem de mim, seria legal.

Ele tem uma audiência boa e de qualidade quantativa.

Se Andrew Warhull do blog Propaganda Clandestina Inexiste — montado por mim como demostração de como é trivialmente fácil brincar como identidades virtuais — fala mal de mim, não importa. Ele não tem seguidores e tampouco agrega e organiza múltiplas fontes de informação e opinião.

Inútil.

O Andy Warhull somos inútil.

Mas O Insurgente tem tudo para ser um guardião de portal, repercutindo o conteúdo da Midião de Tio Sam — O Washington Times, do Reverendo Sun Myung Moon, é muito citado — para Índio Tupi ver.

Por isso, uma perfuração de teste aqui também podia ser interessante.

Queremos saber quem seria o ur-blogueiro no estilo neocon no Brasil, além dos óbvios: César Maia, Aluizio Amorim, O Coronel de Coturno Noturno …

DILMANAWEB: 34.703

DILMA13.BLOGSPOT.COM: 32.292.

E assim por diante na biblioteca de Babel Gilberto.