Knowtex Blog

Cartographier les réseaux sociaux

Le 25 mars 2011 par Raphaël Velt

Pour Norman Thrower, professeur de Géographie et auteur d’un ouvrage de référence sur la cartographie (1), une carte est « une représentation, habituellement sur une surface plane, de tout ou partie de la terre ou d’un autre corps présentant un groupe d’éléments caractéristiques selon leurs tailles et positions relatives » (2).

Partir de cette définition pour représenter de l’information implique de définir quels sont les éléments caractéristiques à représenter et d’évaluer leurs tailles et les distances relatives. Ces questions sont intimement liées. Explorons-les à travers une série d’exemples pour lesquels nous verrons les outils à notre disposition pour produire ces points et ces « distances informationnelles ».

Si nous choisissons comme points à représenter des individus, nous pouvons calculer les distances entre ceux-ci en fonction de leur lien social. Dans cet article, je présenterai les aspects théoriques de la représentation des graphes sociaux. Vous pourrez retrouver des exemples que j’ai réalisés pour Knowtex sur ce même blog.

Lien social et sociologie des réseaux

L’étude d’ensembles d’individus et des liens sociaux qui existent entre eux, nommés réseaux sociaux, fait l’objet d’une branche de la sociologie (3). Le précurseur de cette approche a été le sociologue Georg Simmel, qui se focalisait sur ce qu’il nommait la « forme », c’est à dire la structure des interactions sociales.

Mais l’un des premiers à avoir employé le terme de réseau a été le britannique John Barnes, qui étudia au début des années 1950 l’organisation des habitants de l’île norvégienne de Bremnes, et s’intéressa particulièrement à la structure des relations informelles, constatant que tous les individus étaient reliés entre eux par ce réseau. Dans l’article tiré de cette étude (4), Barnes présente le réseau social de Bremnes comme « un système de liens entre des paires de personnes qui se voient l’une l’autre comme approximativement égaux socialement » et « l’image [qu'il a] de celui-ci est un ensemble de points dont certains sont reliés par des lignes ».

Quels types de lien ?

La diversité des relations que nous pouvons avoir avec d’autres individus (relations d’amitié, de simple connaissance, de rivalité, hiérarchiques, de famille, etc.) a pour conséquence qu’il est possible de tracer des réseaux sociaux sur la base de liens tout aussi divers. Par exemple, l’organigramme d’une entreprise est un graphe social représentant les liens de subordination hiérarchique entre employés ou entre groupes d’employés (directions, services, divisions, etc.) et l’arbre généalogique représente les liens de parenté.

Tous les liens d’un même graphe ne sont pas non plus équivalents : certains peuvent correspondre à des liens forts : amis proches ou famille et d’autres à des liens plus faibles. Dans le cas de la scientométrie, il peut s’agir de relations de citations entre chercheurs. Dans ce cas, le graphe social est dit « dirigé », car il n’y a pas nécessairement de réciprocité et que la direction du lien est importante pour comprendre la dynamique sociale entre chercheurs.

Quelles personnes choisir ? L’échantillonnage

Lorsqu’on veut représenter un réseau social se pose la question de savoir quel échantillon à étudier, c’est à dire savoir où tracer la frontière de celui-ci. La première solution, celle du « réseau complet » consiste à étudier l’ensemble d’un groupe déjà constitué, par exemple l’ensemble des habitants d’une paroisse choisie par Barnes, une entreprise, une association. La deuxième approche, dite du « réseau personnel » est de partir d’un individu et de s’intéresser à tous les contacts de celui-ci.

Le passage à la surface : spatialisation du graphe

Les individus forment ce que l’on nomme les sommets ou nœuds (« nodes » en anglais) et leurs relations les arêtes (« edges » en anglais, aussi nommés « arcs » dans les graphes dirigés) d’un graphe. Tracer un graphe, c’est dessiner un point pour chaque nœud et un segment pour chaque arête. Mais c’est également disposer les nœuds d’une manière à faire apparaître le plus clairement possible la structure du graphe étudié. Pour cela, le choix du tracé doit notamment minimiser les distances entre nœuds connectés et les recoupements entre arêtes.

Cette spatialisation du graphe peut être réalisée de manière logicielle. L’un des algorithmes les plus utilisés simule des interactions physiques : les arêtes se comportent comme des ressorts qui tendent à rapprocher les nœuds et ces derniers se comportent comme des charges électriques qui se repoussent mutuellement.

Gephi est l’un des logiciels les plus employés à l’heure actuelle pour tracer et étudier des graphes. Il se distingue par sa facilité d’utilisation. Il propose différents algorithmes de spatialisation paramétrables et permet également de travailler l’aspect du graphe (couleur et taille des nœuds et des arêtes), manuellement ou en fonction de données numériques.

Quelles mesures et statistiques pour les réseaux ?

Ce logiciel propose également un certain nombre d’analyses statistiques propres à l’analyse des réseaux pour caractériser un graphe et ses nœuds. Les sociologues des réseaux sociaux utilisent ce type d’analyses pour caractériser certaines notions telles que la cohésion sociale ou le capital social.

La densité d’un réseau est le rapport entre le nombre de liens existants et le nombre total de liens possibles. Elle varie de 0 si tous les points sont isolés, à 1 si chaque sommet est connecté à tous les autres. Sa connexité est déterminée par l’existence ou non un d’un chemin reliant, de proche en proche, l’ensemble des nœuds entre eux.

Un nœud peut tout d’abord être caractérisé par son degré, c’est à dire le nombre de connexions, qui vont vers le nœud ou qui en repartent. Des calculs plus complexes ont été élaborés, qui prennent en compte la structure du reste du graphe, comme les scores d’autorité et de « hub » (5), la mesure de la centralité, ou enfin le PageRank, correspondant à la probabilité qu’un utilisateur tombe sur un nœud en parcourant le graphe de lien en lien de manière aléatoire. Cette notion est issue des travaux de recherche de Larry Page, co-fondateur de Google, à l’université de Stanford. Enfin, la modularité est une fonction permettant de quantifier la division d’un réseau et donc de détecter (ou de confirmer par le calcul ce que la visualisation montre plus facilement) la présence de communautés, caractérisées par une densité de connexions entre ses nœuds plus élevée que la moyenne.

Ces zones de forte densité correspondent généralement à des groupes liés entre eux par des liens forts, par exemple les amis proches ou la famille. Les liens entre communautés sont du domaine des liens faibles et servent de ponts, cruciaux pour la diffusion de l’information, comme l’a montré le sociologue Mark Granovetter (6).

Trouver des liens par internet : l’autre acception de « réseaux sociaux »

Ce n’est pas un hasard si des sites comme Facebook, LinkedIn, Twitter ou encore Knowtex portent le même nom de « réseaux sociaux » que le concept sociologique que nous avons étudié. Ceux-ci disposent, dans leurs bases de données, d’enregistrements correspondant à des individus et des relations entre ceux-ci.

Suivant les interfaces de programmation (ou APIs) disponibles pour ces services, il est plus ou moins facile d’extraire ces données et d’en tirer un graphe social. Les considérations de vie privée et les enjeux commerciaux liés à la connaissance des graphes sociaux font que, pour la plupart de ces services, il n’est possible d’obtenir que le réseau social personnel du compte à travers lequel la requête a été faite.

Sur Facebook, l’application Netvizz, développée par Bernhard Rieder, maître de conférences à l’Université Paris-8 (7), permet à tout utilisateur d’obtenir son graphe social au format GDF, qui peut être visualisé avec Gephi.

LinkedIn a développé en interne (grâce au recrutement de Mathieu Bastian, ingénieur à l’origine de Gephi) un outil de visualisation de graphe social personnel, qui permet un affichage directement dans le navigateur.

Sur Twitter, l’ensemble des liens entre comptes est disponible, sauf pour les comptes protégés, largement minoritaires. De plus, le graphe social est dirigé : un compte peut s’abonner à un autre sans que cela soit réciproque. L’existence de fonctionnalités comme les Retweets (RT) et les Mentions (@…), issues des usages des utilisateurs (8), permet la création de graphes sociaux basées sur celles-ci. Au lieu de s’intéresser au lien constitué par les abonnements entre comptes, ces graphes sont constitués par les actions de mentionner d’autres comptes.

Dans un prochain article, je parlerai d’autres graphes qui peuvent être tracés à partir de données issues du web, comme les cartographies de liens hypertextes.

En attendant, mes premiers essais de visualisations autour de Knowtex peuvent être consultés sur cet autre article du blog.

Notes

  1. [retour] Maps and Civilization: Cartography in Society, Norman Thrower, University of Chicago Press, 1996
  2. [retour] Retrouvez cette définition ainsi que 320 autres sur le site Making Maps
  3. [retour] Pour aller plus loin : La lecture de Sociologie des réseaux sociaux, Pierre Mercklé, Ed. La Découverte, coll. Repères, 2004
  4. [retour] Class and committees in a Norwegian island parish (« classe sociale et comités dans une paroisse insulaire norvégienne »)
  5. [retour] La force des liens faibles, Mark Granovetter, 1973.
  6. [retour] définis par l’algorithme HITS
  7. [retour] Bernhard Rieder a été mon enseignant et m’a permis de connaître une grande partie des ressources qui m’ont aidé à la rédaction de cet article.
  8. [retour] Lire à ce sujet l’article de Nikos Smyrnaios, maître de conférences à l’Université Toulouse 3 sur INA Global : « Twitter, un réseau d’information sociale »

>> Illustrations : Portulan de Jorge de Aguiar, 1492, Wikimedia Commons, Foules, Tokyo et Lomé, Raphaël Velt (licence CC), Captures d’écran de Gephi, LinkedIn Maps

1 commentaire

  1. Timothée Poisot le 25 mars 2011 à 15:37

    Pas mal, mais ça me semble être très en dessous de ce qu’on peut dire sur les réseaux écologiques. Deux références pour commencer :

    Bersier, L.F., Banazek-Richter, C. & Cattin, M.F. (2002) Quantitative descriptors of food-web matrices. Ecology, 83, 2394-2407.
    Dunne, J.A. (2006) The network structure of food webs. Ecological Networks: Linking Structure to Dynamics in Food Webs. (eds M. Pascual & J.A. Dunne), pp. 27-86. Oxford University Press, Oxford.

    Je parle ici : http://www.scefi.fr/2011/02/quapprendre-de-la-structure-des-reseaux-dinteraction/ d’un très bon lien entre structure et fonction…

Ajoutez un commentaire

Pas encore membre ? Inscrivez-vous pour laisser un commentaire ! Déjà membre ? Connectez-vous

Tous les contenus, sauf exception signalée, sont sous licence Creative Commons BY-NC-SA