Logo du CNRS               Logo de l'Université Lille 2   

           

Logo du Ceraps

 

Ecole d'été de Lille
en Méthodes Quantitatives des Sciences Sociales

Organisée par Jean-Gabriel Contamin, Julie¨Pagis, Etienne Penissat, Alexandre Mairot et Thomas Soubiran

 

 

 

 

 

 

Pour remplir
le dossier de candidature 2018
: ici

 

Pour télécharger
l'affiche 2018 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Programme 2018


En 2018, l'école d'été de Lille aura lieu du jeudi 28 juin au matin au jeudi 5 juillet dans l'après-midi.

Elle sera organisée autour de deux modules :
- l'un sur "Méthodes Numériques dans les Sciences Sociales
- l'autre sur "La construction quantitative des typologies : méthodes de classification et analyses factorielles

Chaque module accueille traditionnellement une vingtaine de personnes. Il sera possible d'en accueillir un peu plus cette année dans le premier module. Mais, il est demandé aux participants à ce module de venir avec un ordinateur portable.

Les deux modules se déroulent en parallèle. Les participants doivent donc choisir l'un ou l'autre des modules. Les enseignements ont lieu exclusivement en français.

Un repas de début de formation est offert aux participants le 28 juin à midi. Un repas de fin de formation leur est offert le 4 juillet au soir. Un petit déjeuner 'minimal' est proposé tous les matins.

 

MODULE n°1 : METHODES NUMERIQUES POUR LES SCIENCES SOCIALES

(co-organisé par Julien Boelaert, Etienne Ollion et Julie Pagis)

Présentation :

Comment utiliser des données de l'internet dans le cadre d'une recherche en sciences sociales? L’objectif de cette formation est de proposer une introduction à la collecte automatisée et à la curation de ces données numériques. Il s’agira d’apprendre à les localiser, à mettre en place une stratégie pour les collecter, les nettoyer et les préparer en vue d’un traitement. Cet apprentissage ne sera pas dissocié d’une réflexion sur les enjeux que pose leur utilisation. L’accent sera mis sur la diversité des types de données, leurs avantages comme leurs limites.

Le module sera articulé autour d’un apprentissage des techniques en deux temps : d’abord un cours qui introduit les principales méthodes, puis un atelier qui permet son application à des cas pratiques. Des présentations invitées de chercheurs ayant eu recours à ces données viendront compléter la formation (réseaux, analyse de données, lexicométrie). Une séance sera consacrée aux aspects juridiques de la collecte des données.

Concrètement, l'objectif de cette école d'été est :

- D'aider les étudiants à identifier les diverses données numériques utilisables pour mener à bien un projet

-De présenter des techniques simples de collecte et de nettoyage de ces données

-De discuter les enjeux scientifiques qui entourent l'utilisation et la multiplication des données numériques dans les pratiques de recherche

Les savoirs acquis ne sont pas limités aux données d'internet, car les techniques présentées sont transposables à d'autres situations, dont des bases de données ou d’informations stockées sur un disque dur, des textes papiers scannés, une série d’articles stockées en PDF. Avec la numérisation du quotidien, un matériau parfois extrêmement riche est à portée de main, à condition de le repérer et savoir le traiter. Ces données intéressent donc les chercheurs en sciences sociales dans leur ensemble, car qu’ils fassent des traitements quantitatifs ou non, tous peuvent avoir recours aux méthodes numériques pour collecter, stocker et traiter ces données.

Pré-requis : La participation à ce module n’exige pas de connaissances préalables en informatique et encore moins en statistique, mais une aisance minimale avec un ordinateur est bienvenue. La majorité des tâches sera menée avec le logiciel de programmation R, pour lequel une rapide introduction sera proposée.

 
Intervenants :
 
Marie Bergström (Sociologue, INED), Julien Boelaert (Economiste, SAGE-Strasbourg), Samuel Coavoux (Sociologue, Centre Max Weber), Etienne Ollion (Sociologue, CNRS, SAGE-Strasbourg), Julie Pagis (Science politique, IRIS, EHESS), Thomas Soubiran (Méthodes Statistiques, CNRS, CERAPS), Fabien Tarissan (Informatique, CNRS, ISP), Jean-Luc Tessier (Responsable du service SPIN et Correspondant Informatique et Libertés, Université de Lille).


Programme provisoire (certains titres seront affinés ultérieurement) :  

 

Jours

Intervenants

Intitulé des séances 

Jeudi 28 juin
matin

PUDL

Accès aux données de la statistique publique et ressources de données en ligne

Jeudi 28 juin
après-midi

Julien Boelaert, Etienne Ollion, Julie Pagis

Stratégies numériques pour les sciences sociales

Vendredi 29 juin
matin

Julien Boelaert, Etienne Ollion, Julie Pagis

Introduction à R et prise en main du logiciel

 

Vendredi 29 juin
après-midi

Julien Boelaert, Etienne Ollion, Julie Pagis

 Comment s’écrit le web (et comment le lire) ?

Samedi 30 juin
matin

Marie Bergström

De quoi l'écart d'âge est-il le nombre?
Croiser données d'enquête et big data pour faire de la sociologie du couple

Lundi 2 juillet
matin

Julien Boelaert, Etienne Ollion, Julie Pagis

Sélection de données

Xpath

Lundi 2 juillet
après midi

Jean-Luc Tessier, Thomas Soubiran

La réglementation relative aux données personnelles en SHS

Mardi 3 juillet
matin 

  Fabien Tarissan

Introduction à Selenium
L’éthique des algorithmes

Mardi 3 juillet
après-midi

Fabien Tarissan

Analyse de réseaux sur un corpus de texte de lois

Mercredi 4 juillet
matin

Julien Boelaert, Etienne Ollion, Julie Pagis

Automatisation et stockage (1)

Mercredi 4 juillet
après-midi

Samuel Coavoux

Big Corpus. Classifier des données textuelles

Jeudi 5 juillet
matin

Julien Boelaert, Etienne Ollion, Julie Pagis

Sélection et nettoyage de données:

Les expressions régulières

Jeudi 5 juillet
après-midi

Julien Boelaert, Etienne Ollion, Julie Pagis

Automatisation et stockage (2)

 

 

  

 

MODULE n°2 : LA CONSTRUCTION QUANTITATIVE DES TYPOLOGIES : méthodes de classification et analyses factorielles

(co-organisé par Nicolas Robette et Thomas Soubiran)

Présentation :

Comment construire des typologies ou des classifications à partir de données quantitatives? La démarche typologique ou classificatoire est au fondement même du projet scientifique, tant dans les sciences sociales que dans les sciences de la nature. Pourtant, les méthodes quantitatives permettant d’encadrer empiriquement la construction de ces typologies ne sont pas toujours bien connues des chercheurs. Or, ces dernières années, ont émergé un ensemble de méthodes nouvelles pour créer des typologies ou des classements à partir de l’analyse géométrique des données (AGD) et des méthodes de classification.

L’objectif de ce module sera précisément de se centrer sur cette opération de classification centrale dans les travaux de sciences humaines et sociales en présentant les principes épistémologiques qui fondent chacune de ces méthodes de classification, leur mode d’articulation avec l’analyse géométrique des données (AGD), l’intérêt et les limites de chacune d’elles ainsi que les outils qui permettent d’en faire un usage judicieux.

Le module sera articulé autour d’un apprentissage des différentes méthodes de classification articulée avec celles de l’analyse des correspondances. Un cours présentera chaque méthode puis elle sera mise en œuvres par les stagiaires sur des cas pratiques.

Pré-requis : La participation à ce module n’exige aucun pré-requis statistique, mais la lecture d’une ou plusieurs des références bibliographiques qui seront envoyées à l’avance aux stagiaires est souhaitable.


Intervenants :

Germain Barré (Sociologue, LABERS, UBO), Julien Boelaert (Economiste, SAGE-Strasbourg), Samuel Coavoux (Sociologue, Centre Max Weber), Frédéric Lebaron (Sociologue, ENS-Saclay), Ivaylo Petev (Sociologue, CNRS, LSQ-CREST), Nicolas Robette (Sociologue, LSQ-CREST), Thomas Soubiran (Méthodes Statistiques, CNRS, CERAPS).


Programme provisoire (certains titres seront affinés ultérieurement) :  

Jours

Intervenants

Intitulés des séances 

Jeudi 28 juin
matin

PUDL

Accès aux données de la statistique publique et ressources de données en ligne

Jeudi 28 juin
après-midi

Nicolas Robette et Thomas Soubiran

Un panorama des méthodes de classification

Vendredi 29 juin
matin
 

Nicolas Robette et Thomas Soubiran

Un panorama des méthodes de classification (suite)

Vendredi 29 juin
après-midi

Samuel Coavoux

L’analyse des correspondances : présentation théorique

Samedi 30 juin
matin

Samuel Coavoux

Mise en pratique sur poste

Lundi 2 juillet
matin

Frédéric Lebaron

 Analyse des correspondances et classification ascendante hiérarchique : l’exemple du banquier central

Lundi 2 juillet
après midi

Frédéric Lebaron

Mise en pratique sur poste

Mardi 3 juillet
matin 

Ivaylo Petev

Tests d'hypothèses et classification avec les méthodes d'Analyse en Classes Latentes

Mardi 3 juillet
après-midi

Ivaylo Petev

Mise en pratique sur poste

Mercredi 4 juillet
matin

Germain Barré

Les classifications en analyse des réseaux sociaux

Mercredi 4 juillet
après-midi

Germain Barré

Mise en pratique sur poste

Jeudi 5 juillet
matin

Julien Boelaert

Les algorithmes de "clustering" en "machine learning": les cartes de Kohonen

Jeudi 5 juillet
après-midi

Julien Boelaert

Mise en pratique sur poste

 

 

dernière modification : 26/02/2018