Analyse réseaux complexes — Jour 1
J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité. Voici quelques notes.
Pierre Mercklé – Introduction à l’analyse en réseaux
Surtout, la perspective sociologique des réseaux sociaux [personnels], son histoire et son émergence:
Pierre Bourdieux, La Distinction 1979 p.140-141; Raisons pratiques
Blogue: mondegeonumérique.wordpress.com Thierry Joliveau
John Scott, 2012, Social Network Analysis: A Handbook, Sage, p.12
Freeman, Development of Social Network Analysis: a Study in the Sociology of Science, Empirical Press, 2004, p.131
Moreno, Who Shall Survive, 1934
John Barnes, Classes sociales et réseaux dans une Île de Norvège, Réseaux, 2013 [1954], p.217 : pour une distinction terminologique entre web et réseau, « tisser » et réseau social, réseau informel, points reliés par des lignes
S. Milgram, 1967, « the small world problem » Psychology Today, 1, pp. 62-67
Merklé, Sociologie des réseaux sociaux, Paris, La Découverte
Bertrand Jouve – Introduction à l’analyse des réseaux complexes
« Ce que j’ai envie de faire » « comme matheu » : s’attacher à comprendre la structure et sa dynamique, en mesurant, en construisant des modèles qui les reproduisent: variables pertinentes, dépendances…
1. Introduction
Mathématicien et physicien: apportent des outils différents
Math sont moyens pour simplifier un problème avec des outils génériques: approche formelle suppose des hypothèses même bien cachées derrière des équations
Un système complexe est constitué de nombreuses entités dont les interactions conduisent à l’apparition d’un comportement global dit « émergeant » qui peut être expliqué en considérant uniquement les propriétés individuelles de ses constituants. Nécessité d’identifier: des interactions multi-échelles, des boucles de rétroaction, des bifurcations, des phénomènes en cascade.
Par ailleurs,
Réseau complexe: système complexe dont les interactions interindividuelles sont dyadiques
Et
Réseau social (complexe) : réseau complexe dont les interactions sont régies par des liens sociaux
(Green & Sadedin, 2014)
(Alan Kirman)
Les SHS [sciences humaines et sociales], SDV [science de la vie], SPI [sciences pour ingénieurs] abordent différemment le traitement de la complexité ; l’objectif doit maintenant être de construire la continuité des concepts, méthodes et outils sur des objets partagés.
L’objet est de comprendre les logiques qui sous-tendent la dynamique du réseau et d’en construire un modèle simplifié
Que doit-on disposer pour étudier un réseau cokmplexe
- Identifier et décrire l’hétérogénéité des noeuds (sommets, vertex)
- Identifier et décrire la diversité des interactions entre les noeuds
- Analyser la structure du réseau et identifier les échelles perfinentes
- Caractériser la dynamique et les logiques qui la sous-tend
(3) et (4) sont fortement liés: la structure des interactions entre les individus est une contrainte importante sur la dynamique et donc l’existence de comportement émergents du système. (épidémies)
2. Réseaux complexes
- Ce qui nous intéresse c’est quand la structure globale d’un réseau observé s’écarte d’une structure « classique » , appelé modèle nul
- Un modèle nul est un ensemble de graphes qui ont le même nombre de sommets que le graphe étudié et qui conservent un certain nombre de caractéristiques locales (degré, clustering, …)
- Il faut donc être capable de produire des graphes avec ces propriétés voulues
- et de les comparer au graphe initial (en général, on vérifie seulement si la propriété globale est conservée)
Donc, on se trouve à générer une multitude de graphes ayant les mêmes propriétés pour les sommets afin de voir si notre graphe est « surprenant » ou non. Il s’agit de
- « modèles de référence » ou graphes élémentaires:
- réseau réguliers; graph Erdos-Rényi (nombre de sommets fixés, les arêtes sont tirées indépendamment suivant une loi uniforme de paramètre p) dans ce cas, on obtient une distribution des probabilités des degrés.
- The configuraiton model: nombre de sommets fixés, distribution de degrés fixés [Fosdick, 2018, SIAM]
3. Des modèles statistiques des réseaux sociaux
En fixant de plu en plus de contraintes sur les modèles nuls, on va in fine basculer dans une autre logique qui est de chercher un modèle statistique générique qui explique assez bien l’observation qu’on a. On s’intéresse au codage, dans le modèle, de configuration récurrentes (ie. dépendances dans des données relationnelles)
[il saute le reste de la partie 3 et blitz la partie 4]
4. Quid des modèles génériques?
Small world, scale free, …
Watts-Strogatz model
Barabasi model
5. Big data
bertrand stigler sur canal-u.tv
On fouille pour trouver ce qu’on cherche – La data Science doit servir la science (des concepts).
Atelier 1 – Claire Lemercier
Format du fichier « classique » en réseau: entité 1 + entité 2 + lien + source
Deux inspirations:
- réfléchir aux classes distinctes d’entités au-delà du classique personne, place, temps, objet. Pour mes recherches, je crois que les liens sémantiques en droit sont très pertinents
- explorer et chercher le moment « woah hoo » donc, viser l’itération d’hypothèses ou de versions de réseaux sans trop s’embêter avec la conceptualisation théorique de l’approche. Peut-être une approche inductive en amont.
Suggestions de lecture personnelles par Claire pour l’idée de l’analyse en réseau du droit :
- BARENOT, De quelle pensée juridique faisons-nous l’histoire ? Réflexions autour de quelques données bibliométriques
- « La jurisprudence et la doctrine : retour sur une relation clef de la pensée juridique française contemporaine », Quaderni fiorentini per la storia del pensiero giuridico moderno, n°41, 2012, p.251-297 (en collaboration avec Pierre-Nicolas Barénot).
Atelier 2 – Guillaume Cabanac et Gilles Hubert
Récupération de données bibliographiques du web.
- Données par tabulation: base bibliographique Web of Science tout est payant, sauf si votre institution est abonné; limite de 500 notices à la fois; téléchargement et utilisation de la fonction de « text to columns » de votre tableur préféré; utiliser l’outil Voyant Tools pour traiter rapidement le corpus rapidement.
- Données structurées JSON, outil http://www.altmetric.com : permet de générer certaines de mesures de popularité pour un article scientifique selon une certaine quantité de sources de données; permet d’interroger le système via l’API selon le DOI d’un article; utilisation de « ./jq » pour interroger l’arbre JSON pour les données que l’on désire dans le schéma
- « Web scraping » (sic) ou moissonnage ou aspirateur de site web. Structure des pages: Document Object Model; idée: demander à archive.org d’indexer une page web pour avoir un permalien afin de publier celui-ci comme source dans une bibliographie d’un article; visualisation des chercheurs dans un labo de recherche oeuvrant dans divers thèmes et axes avec Gephi
Question de la salle:
- Pour extraire les citation de documents:
Ce contenu a été mis à jour le 2018-09-28 à 3 h 59 min.