Domingo no Laboratório: O Velho Rei e o Novo Nassif

Padrão

As coisas foram bem no laboratório este domingo.

Fiquei tão envolvido em minhas gambiarras caseiras que perdi por inteiro o crise do dossiê.

Acreditam ou não, a diagrama seguinte representa uma fatiada de realidade, e quase representa uma ordem compreensível. Eu chamo isso de progresso.

O que foi que eu fiz?

Recolhi dados sobre a ecologia digital de Reinaldo Azevedo e o master do Master em Jornalismo, utilizando Navicrawler.

Cada nó tem seus referentes e seus referidos.

Eu não sabia que o responsável pelo Opinião e Nóticia era de Diego Casagrande. O site é destacado pelo Instituto Millenium na sua página de entrada.Lembro de uma entrevista de vídeo que ele fez com Diogo Mainardi uma vez.

A Veja chamou ele de uns dos mais importantes vozes da oposição em Rio Grande do Sul. A página dele recebia 500 visitantes por dia na época.

Todas as referências da página de entrada são ao governo do RS.

Salvei os dados no formato CVS — valores separados por vírgulas.

Traduzi este arquivo em formato XLS — Excel 2007– utilizando OOCalc, a planilha de Open Office.

É muito parecido com a técnica de criar diagramas dentro do Excel e OOCalc.

Li o arquivo XLS com yEd.

Criei um «edge list», uma tabela simples de duas colunas: fontes e alvos. Selecionei as fontes e os alvos com a ferramenta de gestão de dados de yEd — algo que ao Gephi e GUESS, outros editores de diagramas, ainda lhes falta.

Passei a tarde fazendo várias transformações, análises e mudanças manuais dentro da visualização criada pelo yEd.

Alguns tem jardinagem. Eu fabrico gambiarras.Acima, o mundo virtual do Tio Rei. Os pontos menores são samizdat — Twitter, WordPress e Blogspot — codificado em cores distintas. Vermelho é a Editora Abril. Azul é a Folha. Grisalha, o Estadão.

Outrossim consequi separar, fisicamente,a rede inteira de Twitter associada com esse complexo.

Pode-se descartar o resto da rede para enfocar esses dados, se quiser.

Em tempo: Foi engraçado durante o processo de mapear a rede vislumbrar minha própria cara:

Meu Fordismo Pessoal

Agora, tenho pelo menos um método seguro para trabalhar com dados em formato CVS, embora yEd se roda com lentidão enquanto mastiga grande volume de dados.

Está demorando uns vinte minutos para fazer a diagramação de 2.250 dados tirados do mundo virtual de Carlos Alberto de Franco — casuista medieval do Século 21 — por exemplo.

Toda aquela nébula consiste no universo da Universia, Masters e a Univerdad de Navarra, com samizdat e multiplicadores associados.

Ser um mero  multiplicador do conhecimento agregado por autoridades consagradas foi a vida do escrivão medieval.

Assim, eu resolvo cortar todos os nós com um único laço — uma nuvem de contas de Twitter e Blogspot, na maioria — para enfocar o cerne da coisa, o círcuito fechado.

Fui capaz de selecionar e tirar dados visualmente, editando a diagrama intuitivamente em vez de ser obrigado a manipular e filtrar os dados crus.

O yED produz uma visão da vizinhança de cada nó. Assim, vemos o nó original — Consultor Di Franco, com o New York Times entre os clientes, segundo ela — em relação ao curso Masters, a Navarra, e Universia e o IICS.

Agora seria legal juntar a rede da IICS com essa para acrescentar as ligações espessas deste instituto de pesquisa com Opus Dei. Pode-se fazer isso com Pajek. O formato .NET produzido, por exemplo, pelo Network Workbench, presta para este fim.

O Novo Nassif

Ou para tomar outro exemplo, eu tenho aqui o resultado de um análise curto do novo mundo virtual de Luis Nassif, que acaba de se juntar ao mundo da caixa de «faça clique e multiplique».

O blog mora agora no site da empresa do jornalista e produtor, a Agência Dinheiro Vivo.

Eu divulgo que assinei o serviço por um tempo, mas macroeconomia não tinha muito a ver com meu trabalho — fusões e «distressed equity» — pois fui obrigado assinar o Relatório Reservado, Valor e DCI.

Parece que os consultores trabalhando no novo site são muito afins de Yahoo. O robô imediatemente começa a vagar pelos dutos de Pipes, o interface de programação do concorrente ás vezes esquecido de Google.

Não deixei o robô rodando por tempo suficiente para voltar ao conteúdo da comunidade Ning do jornalista ou do blog.

Tive que reiniciar no meio do censo, mas dá para ver aqui os elementos básicos do site: um servidor de publicidade, enlaços aos dois velhos projetos comerciais de Nassif, Dinheiro Vivo e Jornal Cash, e os elementos da «plataforma social» como Facebook, Twitter e Delicious.

Estou muito interessado nesse tal de IG.ATMO.PREDICTA.COM.BR.

Embora a falta de resultado desde Los Angeles, desde a Vila:

Lá acharão alojados também a Juventude Democratas, por exemplo, em servidor virtual. Se me lembro bem.

ruby traceviz.rb URLS > predicta.dot
alt-F2 + tulip > File> Import > Network > Dot (Graphviz) > predicta.dot

Acho que entre os laços captados aqui deve ser a agência contratada para fazer a reforma da presença virtual nassifiana-Brasiliana.

Gosto do fato de nada ter mudado muito na aparência do site, só embaixo da capota, e sem capotar muito no processo de transição.

Nassif também entrou na moda de manter uma comunidade de Ning referido por nome de domínio próprio estilo MeuNome.com.

LUISNASSIF.COM manda o navegante à comunidade de Ning enquanto LUISNASSIF.COM.BR manda-o ao novo endereço do blog, também conhecido como ADVIVO.COM.BR/LUISNASSIF.

Em termos de divulgação de autora — como se EU.COM ão fosse suficiente — o site a mesma estrutura que meu site — anonimidade transparente.

Os dados do responsável são disponíveis na página WHOIS de LocaWeb. Assim, evita-se alguns problemas como robôs de spam. .

Compare a página do Blog do Aze(ve)(ja)do, no entanto. Cada nota está embutida numa página com quase 500 laços, a vasta maioria levando a destinos dentro do domínio ABRIL.COM.BR

Ainda aproveitando essa «câmara de eco» enorme, porém, vocês talvez se lembrem de que o Nassif 1.0 consegui uma audiência maior e mais diversa, segundo algumas métricas comúns do SEO que tenho instaladas aqui no Chrome.

Blogosferas Entrecruzadas

Estou começando aprender a fazer operações de combinação e filtração sobre várias redes utilizando Pajek.

Por exemplo, utilizando um método mais simples, eu resolvi medir o grau de entrecruzamento entre os blogs referentes referidos pela TERNUMA, o Aluizio Amorim — uma fonte principal e interlocutor do Tio Rei — e o Instituto Millenium.

A correlação é alta.

Estes dados podem ser utilizados como sementes em uma exploração mais funda de uma rede. Eu, por exemplo, estou fazendo uma baita de um arquivo da turba do Tio Rei.

Só falta aprender a trabalhar com Nutchwax-WERA, ferramenta pela extração de dados dos arquivos ARC e os «logs» criado pelo software do Internet Archive.

Outros Caminhos

Outro sucesso preliminar foi importar a estrutura de um diretório de arquivos no Network Workbench, para depois exportar os dados no formato.NET para Pajek– legível tanto no Gephi quanto no Pajek mesmo.

Prometedor, isso. Dia desses farei uma diagrama tipo UML do fluxo de trabalho utilizado — sem componentes comerciais além de Java. Um belo dia espero poder dispensar com esta também. Eu não tenho nada contra, mais a Macunaimachine tem, sim.

Feito automaticamente.

Feito à mão com dados de Pajek.