En pièce jointe, les codes utilisés pour exploiter les données
Questions
- quels sont les faux comptes (utilisés pour les tests, par exemple) ?
- quelles sont les personnes influentes du réseau ?
- pourquoi le réseau a-t-il été un échec ?
- isoler les sous groupes
- quelle est la typologie des sous-groupes ?
- dresser un panneau statistique complet (distributions, trucs « de base »)
- qui sont les people (personnalités « connues »qui ont écrit sur le réseau)?
- Les liens de suivi sont-ils réciproques ?
Idées du 19 février 2009 :
- tracer l'histogramme des inscriptions avec seulement les utilisateurs qui ont un des liens
- avoir une idée de la dynamique en regardant les dates d'inscription de ceux à qui on souscrit
- vérifier que les phases de souscription correspondent à quelque chose
- regarder le truc de nestedness
- analyse en composante principale ? ou clustering ?
- y-a-t-il des doublons: plusieurs dates pour le même compte ?
- plotter le nombre de messages en fonction du degré
Un papier de Huberman sur le réseau social twitter et sa structure:
http://www.hpl.hp.com/research/scl/papers/twitter/twitter.pdf
Une autre analyse de twitter
Un papier sur la "nestedness", sur l'exemple d'un réseau écologique :

.