Logo du CNRS      Logo du conseil régional         Logo de l'Université Lille 2

           

Logo du Ceraps

 

Ecole d'été de Lille
en Méthodes Quantitatives des Sciences Sociales

Organisée par Jean-Gabriel Contamin, Julie¨Pagis, Etienne Penissat et Alexandre Mairot

 

 

 

 

 

 

Pour remplir
le dossier de candidature 2016
: ici

 

Pour télécharger
l'affiche 2016 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Programme 2016


En 2016, l'école d'été de Lille aura lieu du jeudi 30 juin au matin au jeudi 7 juillet dans l'après-midi.

Elle sera organisée autour de deux modules :
- l'un sur "L'analyse des correspondances
- l'autre sur "Méthodes numériques pour les sciences sociales

Chaque module accueille 20 personnes. Il est demandé aux participants au second module de venir avec un ordinateur portable.

Les deux modules se déroulent en parallèle. Les participants doivent donc choisir l'un ou l'autre des modules. Les enseignements ont lieu exclusivement en français.

Un repas de début de formation est offert aux participants le 30 juin à midi. Un repas de fin de formation leur est offert le 6 juillet au soir. Un petit déjeuner 'minimal' est proposé tous les matins.

 

MODULE n°1 : L'ANALYSE DES CORRESPONDANCES

(co-organisé par Bruno Cautrès et Jean-Gabriel Contamin)

Présentation :


L’analyse des correspondances est l’une des deux principales méthodes d’analyses de données multivariées avec l’analyse en composantes principales. Davantage employée dans les pays francophones, elle vise à réduire un grand nombre de variables à quelques facteurs structurants. Soit dans une perspective exploratoire, lorsqu’on ne sait pas comment les données sont organisées. Soit dans une perspective confirmatoire, pour tester des hypothèses précises de recherche.

Ce module aura pour projet de présenter les principes de ce mode d’analyse, puis d’en démontrer à partir de cas pratiques l’intérêt, les limites et les nouveaux usages. Il débutera par une présentation théorique de l’analyse des correspondances à laquelle succéderont plusieurs séances de mise en pratiques. La suite du module sera consacrée à des cas pratiques issus d’univers différents. Une journée sera aussi consacrée aux analyses typologiques qui, en permettant de synthétiser l’information contenue dans de nombreuses variables par la constitution de groupes à forte homogénéité interne, peuvent être lues comme un complément des analyses factorielles. Le module finira par une réarticulation de l’analyse des correspondances avec les autres méthodes d’analyse factorielle.

Remarque : la participation à ce module n’exige aucun pré requis statistique.


Intervenants :

Bruno Cautres (politiste, CNRS, Cevipof) ; Frédéric Lebaron (sociologue, Printemps, UVSQ) ; Viviane Le Hay (politiste, CNRS, Centre Emile Durkheim), Claire Lemercier (historienne, CNRS, CSO) ; Sebastien Michon (sociologue, CNRS, Strasbourg/SAGE) ; Emmanuel Pierru (politiste, CNRS, CURAPP).


Programme provisoire
(certains titres seront affinés ultérieurement) 

 

Jour

Enseignants

Objet

Jeudi 30 juin
matin 9h30-12h30

Collectif

Accueil, présentation de la Plateforme universitaire des données de Lille (PUDL)

Jeudi 30 juin
14h00-17h00

Bruno Cautrès

Du tableau à double entrée aux données multiples

Vendredi 1er juillet
matin
 

Bruno Cautrès

Suite

Vendredi 1er juillet
après-midi

Frédéric Lebaron

L’analyse des correspondances : présentation théorique

Samedi 2 juillet
matin

Frédéric Lebaron

L’analyse des correspondances : exercices
pratiques sur ordinateur

Lundi 4 juillet
matin 9h30-12h30

Viviane Le Hay

Introduction à l’ACM spécifique

Lundi 4 juillet
après midi 14h30-17h30

Viviane Le Hay

Ateliers pratiques

Mardi 5 juillet
matin 9h30-12h30

Claire Lemercier

La pertinence de l’analyse des correspondances
pour une approche historique

Mardi 5 juillet
après-midi 14h00-17h00

Claire Lemercier

Exercices pratiques sur ordinateur

Mercredi 6 juillet
matin 9h30-12h30

Sebastien Michon

 

L’articulation entre ACM et CAH : L’exemple de l’étude des membres du gouvernement

Mercredi 6 juillet
après-midi 14h00-17h00

Sebastien Michon

 

Ateliers pratiques

Jeudi 7 juillet
matin

Emmanuel Pierru

Panorama historique des différentes méthodes d’analyse factorielle et de leur enchaînement

Jeudi 7 juillet
après-midi

Emmanuel Pierru

Suite

  

 

 

MODULE n°2 : METHODES NUMERIQUES POUR LES SCIENCES SOCIALES

(co-organisé par Julien Boelaert, Etienne Ollion et Julie Pagis)

Présentation :

Données de l’internet, big data, données numérique, web sémantique, … ces termes ont fait une fulgurante apparition dans les sciences sociales. Dans les discours d'abord, où ils sont régulièrement convoqués pour évoquer le futur de la recherche. Dans les pratiques ensuite, puisque les chercheurs sont régulièrement confrontés à des données de ce type, sans toujours pouvoir saisir les opportunités empiriques qu’elles offrent. Qu’il s’agisse d’informations issues de l’internet, de bases de données ou d’informations stockées sur un disque dur, ou même de textes papiers scannés, un matériau parfois extrêmement riche est à portée de main, à condition de le repérer et savoir le traiter. Ces données intéressent les chercheurs en sciences sociales dans leur ensemble, car qu’ils fassent des traitements quantitatifs ou non, tous peuvent avoir recours aux méthodes numériques pour collecter, stocker et traiter ces données.

L’objectif de cette formation est de proposer une introduction à la collecte et à la curation de ces diverses données numériques. Il s’agira d’apprendre à les localiser, à mettre en place une stratégie pour les collecter, les nettoyer et les préparer en vue d’un traitement. Cet apprentissage ne sera pas dissocié d’une réflexion sur les enjeux que pose leur utilisation. L’accent sera mis sur les divers types de données, leurs avantages et leurs limites. L'atelier alternera cours et mises en pratique, afin de présenter les techniques qui permettent simplement de tirer profit des différentes informations. Concrètement, il s’agira  :
-de présenter les enjeux scientifiques qui entourent la multiplication des données numériques dans nos pratiques de recherche
-d'identifier les diverses données numériques utilisables pour mener à bien un projet
-d'élaborer une stratégie simple de collecte et de nettoyage de ces données

Le module sera articulé autour d’un apprentissage concret des techniques en deux temps : d’abord un cours qui introduit les principales méthodes, puis un atelier qui permet son application à des cas concrets. Cette formule sera complétée par une introduction à différentes techniques de traitement des données (réseaux, analyse de données, lexicométrie, machine learning). Une séance sera consacrée aux aspects juridiques de la collecte des données.

La majorité des tâches sera menée avec le logiciel R. Libre, multiplateforme et utile aux chercheurs en sciences sociales pour d’autres tâches, il sera présenté progressivement.

Pré-requis : La participation à ce module n’exige aucune connaissance préalable en informatique ou en statistique.

 
Intervenants :

Marie Bergström (Sociologue, INED), Julien Boelaert (Economiste, Post-Doctorant, SAGE), Milan Bouchet-Valat (Sociologue, OSC, Université Paris 8), Dominique Cardon (Sociologue, Orange Lab), Samuel Coavoux (Sociologue, Centre Max Weber), Baptiste Coulmont (Sociologue, CSU, Université Paris 8), Etienne Ollion (Sociologue, CNRS, Sage), Thomas Soubiran (Méthodes Statistiques, CNRS, CERAPS), Fabien Tarissan (Informatique, CNRS, ISP), Jean-Luc Tessier (Responsable du service SPIN et Correspondant Informatique et Libertés, Université Lille 2).


Programme provisoire (certains titres seront affinés ultérieurement) :  

 

Jours

Enseignants

Objet

Jeudi 30 juin
matin 9h30-12h30

Collectif

Accueil, présentation de la Plateforme universitaire des données de Lille (PUDL)

Jeudi 30 juin
après midi 14h-17h

Julien Boelaert & Étienne Ollion

Cours 1 : Stratégies numériques pour les sciences sociales et prise en main du logiciel

Vendredi 1er juillet
matin

Julien Boelaert & Étienne Ollion

 Cours 2 : Comment s’écrit le web (et comment le lire) ?

Vendredi 1er juillet
après-midi

Dominique Cardon

 

Présentation invitée: sur le projet Algopol et la gouvernance des algorithmes

Samedi 2 juillet
matin

Marie Bergström

Présentation invitée : Faire de la sociologie du couple avec des données numériques

Lundi 4 juillet
matin

Julien Boelaert & Étienne Ollion

Cours 3 : Comment sélectionner des données (1) : Xpath

Lundi 4 juillet
après-midi

Jean-Luc Tessier et Thomas Soubiran

Enjeux juridiques de la collecte de données numériques

Mardi 5 juillet
matin

Julien Boelaert & Étienne Ollion

Cours 4 : Automatisation et stockage

Mardi 5 juillet
après-midi

Fabien Tarissan

Présentation invitée : Analyse de réseaux pour les sciences sociales

Mercredi 6 juillet
matin

Julien Boelaert & Étienne Ollion

Cours 5 : Comment sélectionner des données (2) : Expressions régulières

Mercredi 6 juillet
après-midi

Milan Bouchet-Valat et Samuel Coavoux

Présentations invitées : Analyses lexicométriques

Jeudi 7 juillet
matin

Baptiste Coulmont

Présentation invitée : Cartographier sous R

Jeudi 7 juillet
après-midi

Julien Boelaert & Étienne Ollion

Introduction raisonnée à l’apprentissage statistique (machine learning)

 

  

 

 

dernière modification : 24/05/2016