Analyse réseaux complexes — Jour 3
J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité. Voici quelques notes.
Détecter des communautés scientifiques, à grande et petite échelle – Yves Gingras & Béatrice Milard
Yves Gingras & la grande échelle
Prof. Gingras propose un survol de ses résultats qui sont disponibles sur la plateforme DigitalHistoryOfScience.org pour le domaine économique. Il utilise des données bibliographiques pour représenter l’agglomération de diverses entités autour de disciplines. Ces entités peuvent être les auteurs ou certaines de leurs propriétés tels leur institution d’attachement, leur ville… Les liens sont surtout les co-auteurs d’articles, les citations.
Béatrice Milard & la petite échelle
À partir d’entretiens et d’un corpus de leurs publications internationales, prof. Milard vise à découvrir les entourages sociocognitifs et la structure des mondes scientifiques. Entre autres éléments, elle désire explorer les liens affectifs entre les auteurs des articles cités (connaissez-ils – car c’est surtout des hommes – ceux que vous citez).
Détecter les communautés disciplinaires et les ponts inter-disciplinaires – Pablo Jensen
Titre réel: Limites des communautés scientifiques
Quelle unité pour les systèmes complexes? « faire des patates » – de beaux réseaux avec des sommets en tailles variées. Qu’est-ce qui fait lien entre ses communautés? voir: Grauwin et al, JASIST (2012)
Atelier 1 – statistiques des réseaux
Hypothèse globale des statistiques: indépendance des observation
Hypo de la stat des réseaux: traquer la dépendance => on inverse l’hypo de base. Pauvreté des données (une seule vague de données), grandeur (nombre de dyades)
Avant les outils, 3 questions: que veut-on expliquer?; Quelles sont les variables explicatives Variables indépendantes) c-a-d lien, attributs, les deux?; 3. réseauxdynamiques ou statiques
Outils statistiques
- Analyse descriptives
- mesures de centralité sur l’acteur => source de centralité
- étude sur la structure globale => modèles de blocs ou blockmodels (voir première partie de la présentation)
- Analyse explicatifs (stochastique) – c.f. QUANTITATIVE MODELING
- étude de la variable performance selon les attributs des acteurs et leurs relations (modèles ALAAM)
- Étude des effets d’attributs non structuraux sur l’existence d’un lien entre acteurs (modèles LRQAP) => voir 2e partie de la présentation (logistical regression)
- Étude de la structure globale par un positionnement à l’échelle du voisinage relationnel (modèle ERGM)
- Demain, autre atelier: modèle SCIENA: dynamique, mélange, le réseau est la variable
Avantage des modèles longitudinaux: on capte beaucoup de données et on décide ensuite les variables dépendantes ou indépendantes.
Blockmodeling et équivalence structurale
Mesure descriptive (de moins en moins présente) mais que le présentateur veut défendre
Simplifier et dégager les caractéristiques fondamentales des réseaux (un peu comme l’analyse factorielle)… enlever le bruit et de garder la structure essentielle
Sources du blockmodel
- Lorrain & White : structural equivalence
- White, Boorman, Breiger
- R. Burt : positions in networks
- Interprétation: Borgatti & Everett (1992) / Faust Wasseman (1992)
Logiciels
- Pajek.imfm.sl/doku.php
- Packages R
- blockmodeling (un peu ancien
- blockmodels (JB Leger)
- Celui de pierre barbillon à Paris…
- Blocks (Snijders)
L’équivalence structurale:
- des noeuds ont la même position dans le réseau;
- identifier des rôles sociaux, des groupes. Regrouper les acteurs en blocks (ou positions).
- De Lorrain & White, 71
- Exemple: deux individus ont les mêmes relations, mêmes amis et ennemies = ces noeuds sont équivalents
- Simplification des noeuds par classe de participants homogènes; structurellement équivalents; mêmes flux de relations; fonctionne bien sur les réseaux dirigés mais peut s’appliquer au non-dirigé
2 notions (faust et wasserman) ppour sortir du paradigme de la dynamique du centre et de la périphérie
- position
- rôle
Exemple: Doreian et al. 2005 pour un salon de chaîne de télévision en Afrique
- Ceux qui ont des relations « entre eux » permettent de distinguer les groupes entre eux
- On représente ces relations « entre eux » par une boucle récursive entre les entités du réseau blockmodelisé
- Un peu comme de « Analyse factorielle sur le clustering «
Super pour faire émerger des domaines sémantiques dans un corpus de documents se citant en appliquant le « blockmodeling général » plutôt que la branche stochastique
Blockmodeling vs détection de communautés == pas utile pour détecter communautés
The Louvain algorithm
Deux types d’équivalence: voir Beaugritte 2011
Étapes: 1. Matrice d’adjacente; 2. permutation algorithmique; 3. matrice image
Batagelj 2002 == types de blocs
Interprétation du blockmodel, 3 possibilités (Faust & Wasserman 1992), aussi utilisé par Lazega en 2001 pour parler de niches sociales, positions denses
- Description des attributs des acteurs dans chaque block
- Description des positions (comment chacune des positions est reliée aux autres?), c-a-d est-ce que les block reçoivent ou envoient des liens
- Description de l’ensemble du blockmodel, description de sa structure
L’autre présentation de Julien
Trois trucs
- Tests statistiques simples: est-ce que mes données collent à un modèle? Par exemple, le tirage d’un dé est-il aléatoire? Hypothèse est oui. Est-ce que les observations sont significativement différentes d’un modèle => suivent la loi normale (ou non). On connaît déjà la loi/distribution que l’on veut utiliser (chi-2, student, poisson…)
- LRQAP test: on ne connaît pas la loi de probabilité – il faut « deviner » la loi de dépendance car on ne la connaît pas exactement
- voir Krackardt 1987
- Modèle de régression logistique
- variable dyadique
- permutation des variables pour obtenir des coefficients de beta pour voir si on a un effet significatif
- on tente de créer de l’aléatoire pour dessiner la dépendance
- voir Krackardt 1987
Ce contenu a été mis à jour le 2018-09-28 à 3 h 58 min.