Logo du CNRS               Logo de l'Université Lille 2   

           

Logo du Ceraps

 

Ecole d'été de Lille
en Méthodes Quantitatives des Sciences Sociales

Organisée par Jean-Gabriel Contamin, Julie¨Pagis, Etienne Penissat, Alexandre Mairot et Thomas Soubiran

 

 

 

 

 

 

Pour remplir
le dossier de candidature 2017
: ici

 

Pour télécharger
l'affiche 2017 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Programme 2017


En 2017, l'école d'été de Lille aura lieu du jeudi 22 juin au matin au jeudi 29 juin dans l'après-midi.

Elle sera organisée autour de deux modules :
- l'un sur "Analyses quantitatives des données en SHS : Diversité et complémentarité. Mesurer, analyser, visualiser les données en SHS
- l'autre sur "Analyse quantitative et visualisation des données textuelles

Chaque module accueille une vingtaine de personnes. Il est demandé aux participants au premier module de venir avec un ordinateur portable.

Les deux modules se déroulent en parallèle. Les participants doivent donc choisir l'un ou l'autre des modules. Les enseignements ont lieu exclusivement en français.

Un repas de début de formation est offert aux participants le 22 juin à midi. Un repas de fin de formation leur est offert le 28 juin au soir. Un petit déjeuner 'minimal' est proposé tous les matins.

 

MODULE n°1 : Analyses quantitatives des données en SHS : diversité et complémentarité
Mesurer, analyser, visualiser les données en SHS

(co-organisé par Laurent Beauguitte et Etienne Penissat)

Présentation :


Au-delà de la présentation de techniques particulières propres à chaque session, le module aura pour objectif et pour intérêt de présenter dans un même module un large éventail des techniques d'analyse quantitative des données, dans leur diversité et dans leur complémentarité. Il est en effet de plus en plus nécessaire, dans les travaux de sciences sociales, de recourir à des techniques d'analyse croisées, ce qui suppose tout à la fois la connaissance et la maîtrise de ces techniques, mais aussi la possibilité de les appliquer à partir d'un même logiciel. C'est ce que ce module aura pour objet de proposer en proposant une formation à la fois théorique et pratique à un ensemble de techniques de recueil et d'analyse, des plus simples aux plus élaborées (des statistiques multivariées à la cartographie) à partir du logiciel libre R.

Le module est destiné à un public de praticien.ne.s des sciences humaines et sociales (ingénieur.e, doctorant.e, post-doctorant.e) intéressé par le potentiel des méthodes statistiques mais n'ayant jamais pu bénéficier de formations dignes de ce nom. La démarche proposée est progressive et commence par un rappel historique sur l'utilisation des statistiques en sciences humaines et sociales. Les manipulations de base relatives aux données (codage, tri, description) sont détaillées et mises en œuvre avant de poursuivre en présentant des méthodes de traitements bi et mulitivariés. Les aspects relatifs à la visualisation des données, cruciaux aujourd'hui dans la communication scientifique, sont abordés en fin de module (analyse de réseaux, cartographie).

La pluralité disciplinaire des intervenant.e.s (géographie, informatique, histoire, statistiques) vise à montrer la diversité et la richesse des approches statistiques disponibles.


A l'issue de la formation, les participant.e.s doivent pouvoir :
- choisir un mode de traitement adapté 1) aux données 2) à la problématique
- réaliser les traitements et interpréter les résultats de manière autonome dans un environnement logiciel libre
- réaliser des visualisations attrayantes et sémiologiquement correctes de leurs données

Pré-requis : La participation à ce module n’exige aucun pré-requis statistique, mais la lecture d’une ou plusieurs des références bibliographiques qui seront envoyées à l’avance aux stagiaires est souhaitable.

Intervenants :

Julien Barnier (Informaticien, Centre Max Weber, ENS Lyon), Laurent Beauguitte (Géographe, CNRS, UMR IDEES), Hadrien Commenges (Géographe, Université Denis Diderot Paris 7, UMR Géographie-cités), Bénédicte Garnier (Statisticienne, INED), Diane Le Luyer (géographe, UMR IDEES), Marion Le Texier (géographe, UMR IDEES, Rouen), Rosemonde Letricot (Historienne, LARHRA Université Lyon 3)


Programme provisoire
(certains titres pourront être affinés ultérieurement) 

Jours

Intervenants

 Objet

Jeudi 22 juin
matin 9h30-12h30

PUDL

Accès aux données de la statistique publique et ressources de données en ligne

Jeudi 22 juin
après-midi 14h30-17h30

Hadrien Commenges

Histoire et vocabulaire des statistiques

Prise en main de R et Rstudio

Vendredi 23 juin
matin
 

Marion Le Texier et Julien Barnier

Des données à l’analyse : codage, découpage, manipulations et indicateurs de base

Vendredi 23 juin
après-midi

Julien Barnier

Manipuler les données avec R

Samedi 24 juin
matin

Marion Le Texier et Julien Barnier

Analyse bivariée : corrélation et régression

Lundi 26 juin
matin

Diane le Luyer

 Analyse multivariée (AFC, ACP, CAH)

 

Lundi  26 juin
après midi 

Diane le Luyer

Analyse multivariée : exercices pratiques

Mardi 27 juin
matin 

Rosemonde Letricot

Initiation à l’analyse de réseaux

Mardi 27 juin
après-midi 

Rosemonde Letricot

Analyse de réseaux avec R

Mercredi 28 juin
matin

Bénédicte Garnier

Principes de l’analyse textuelle

Mercredi 28 juin
après-midi 

Bénédicte Garnier et Laurent Beauguitte

Analyse textuelle avec R

Jeudi 29 juin
matin

Laurent Beauguitte

Cartographier les données (1)

Jeudi 29 juin
après-midi

Laurent Beauguitte

Cartographier les données (2)

  

 

MODULE n°2 : Analyse quantitative et visualisation des données textuelles

(co-organisé par Jean-Marc Leblanc et Jean-Gabriel Contamin)

Présentation :

Ce module constitue une introduction à l’analyse quantitative et qualitative des corpus textuels et à la sémantique discursive. Il s’adresse à tous les chercheurs dont les préoccupations scientifiques portent sur le dépouillement d’enquêtes et de formulaires, l’analyse des discours sociaux et politiques, l'exploration de corpus textuels. Il aura pour projet de présenter les principes de l’analyse et la visualisation des données textuelles, puis d’en démontrer à partir de cas pratiques l’intérêt, les limites et les nouveaux usages.

Chaque atelier, outre la prise en main d’un logiciel et des problématiques théoriques qui s’y rattachent, comprend des exercices pratiques en linguistique de corpus et en statistique textuelle qui permettent de tester les fonctionnalités et de répondre aux questions concrètes des chercheurs.

Les résultats produits par les outils textométriques intègrent désormais divers modules de mises en forme des données et des résultats demandant aux utilisateurs une maîtrise des outils de codage et de visualisation et une réflexion ergonomique. De nombreux outils de visualisation se développent sans être directement dédiés à la textométrie. Ils introduisent de nouveaux modèles, souvent esthétiques mais qui nécessitent de nouveaux apprentissages pour la lecture et l’interprétation. Les ateliers seront l'occasion de proposer une réflexion sur ces modèles de visualisation.

Pré-requis : La participation à ce module n’exige aucun pré-requis statistique, mais la lecture d’une ou plusieurs des références bibliographiques qui seront envoyées à l’avance aux stagiaires est souhaitable.


Intervenants :

Philippe Gambette (LIGM, Marne-La-Vallée), Tita Kyriacopoulou (LIGM, Marne-La-Vallée), Jean-Marc Leblanc (CEDITEC-UPEC, Créteil) , Claude Martineau (LIGM, Marne-La-Vallée), Marie Pérès  (CEDITEC-UPEC, Créteil).


Programme provisoire (certains titres seront affinés ultérieurement) :  

 

Jours

Intervenants

  Objet

Jeudi 22 juin
matin 9h30-12h30

PUDL

Accès aux données de la statistique publique et ressources de données en ligne

Jeudi 22 juin
après-midi 14h30-17h30

Jean-Marc Leblanc

Présentation générale: approches textométriques des discours. Présentation et typologie pratique des outils. Options théoriques, principes méthodologiques, limites interprétatives

Vendredi 23 juin
matin
 

Marie Pérès

 Atelier: balisage de corpus, catégorisation

Vendredi 23 juin
après-midi

Jean-Marc Leblanc

Atelier: Prise en main des outils Lexico 3/5

Samedi 24 juin
matin

Jean-Marc Leblanc

Atelier : Prise en main des outils Lexico 3/5

Lundi 26 juin
matin 

Jean-Marc Leblanc

Atelier : Présentation et prise en main de TextObserver: l'analyse factorielle des correspondances

Lundi  26 juin
après midi 

Philippe Gambette

Atelier : Les nuages arborées dans TextObserver et TreeCloud

Mardi 27 juin
matin 

Jean-Marc Leblanc

Atelier : Cooccurrences associées à un pôle, cooccurrences généralisées et mondes lexicaux. Prise en main d'Iramuteq et présentation d'Alceste

Mardi 27 juin
après-midi 

Tita Kyriacopoulou et Claude Martineau

Atelier : Visualisation des données textuelles, grammaires, requêtes: présentation de l'outil Unitex 1/2

Mercredi 28 juin
matin 

Tita Kyriacopoulou et Claude Martineau

Atelier : présentation de l'outil Unitex 2/2

Mercredi 28 juin
après-midi 

Jean-Marc Leblanc

Ateliers pratiques

Jeudi 29 juin
matin

Marie Pérès

Modèles de représentation des connaissances et visualisation des données

Jeudi 29 juin
après-midi

Jean-Marc Leblanc

Ateliers pratiques

 

 

dernière modification : 07/02/2017