Ecole de Lille en Méthodes Quantitatives des Sciences Sociales-Quantilille-Programme

Ecole d'été de Lille
en Méthodes Quantitatives des Sciences Sociales

Organisée par Jean-Gabriel Contamin, Julie¨Pagis, Etienne Penissat, Alexandre Mairot et Thomas Soubiran

Présentation de l'école

Programme 2017

Modalités d'inscription

Financement

Organisation pratique

Archives

Pour remplir
le dossier de candidature 2017 : ici

Pour télécharger
l'affiche 2017 :

Programme 2017

• En 2017, l'école d'été de Lille aura lieu du jeudi 22 juin au matin au jeudi 29 juin dans l'après-midi.

• Elle sera organisée autour de deux modules :
- l'un sur "Analyses quantitatives des données en SHS : Diversité et complémentarité. Mesurer, analyser, visualiser les données en SHS "
- l'autre sur "Analyse quantitative et visualisation des données textuelles "

• Chaque module accueille une vingtaine de personnes. Il est demandé aux participants au premier module de venir avec un ordinateur portable.

• Les deux modules se déroulent en parallèle. Les participants doivent donc choisir l'un ou l'autre des modules. Les enseignements ont lieu exclusivement en français.

• Un repas de début de formation est offert aux participants le 22 juin à midi. Un repas de fin de formation leur est offert le 28 juin au soir. Un petit déjeuner 'minimal' est proposé tous les matins.

MODULE n°1 : Analyses quantitatives des données en SHS : diversité et complémentarité
Mesurer, analyser, visualiser les données en SHS

(co-organisé par Laurent Beauguitte et Etienne Penissat)

Présentation :

• Au-delà de la présentation de techniques particulières propres à chaque session, le module aura pour objectif et pour intérêt de présenter dans un même module un large éventail des techniques d'analyse quantitative des données, dans leur diversité et dans leur complémentarité. Il est en effet de plus en plus nécessaire, dans les travaux de sciences sociales, de recourir à des techniques d'analyse croisées, ce qui suppose tout à la fois la connaissance et la maîtrise de ces techniques, mais aussi la possibilité de les appliquer à partir d'un même logiciel. C'est ce que ce module aura pour objet de proposer en proposant une formation à la fois théorique et pratique à un ensemble de techniques de recueil et d'analyse, des plus simples aux plus élaborées (des statistiques multivariées à la cartographie) à partir du logiciel libre R.

• Le module est destiné à un public de praticien.ne.s des sciences humaines et sociales (ingénieur.e, doctorant.e, post-doctorant.e) intéressé par le potentiel des méthodes statistiques mais n'ayant jamais pu bénéficier de formations dignes de ce nom. La démarche proposée est progressive et commence par un rappel historique sur l'utilisation des statistiques en sciences humaines et sociales. Les manipulations de base relatives aux données (codage, tri, description) sont détaillées et mises en œuvre avant de poursuivre en présentant des méthodes de traitements bi et mulitivariés. Les aspects relatifs à la visualisation des données, cruciaux aujourd'hui dans la communication scientifique, sont abordés en fin de module (analyse de réseaux, cartographie).

• La pluralité disciplinaire des intervenant.e.s (géographie, informatique, histoire, statistiques) vise à montrer la diversité et la richesse des approches statistiques disponibles.

A l'issue de la formation, les participant.e.s doivent pouvoir :
- choisir un mode de traitement adapté 1) aux données 2) à la problématique
- réaliser les traitements et interpréter les résultats de manière autonome dans un environnement logiciel libre
- réaliser des visualisations attrayantes et sémiologiquement correctes de leurs données

Pré-requis : La participation à ce module n’exige aucun pré-requis statistique, mais la lecture d’une ou plusieurs des références bibliographiques qui seront envoyées à l’avance aux stagiaires est souhaitable.

Intervenants :

• Julien Barnier (Informaticien, Centre Max Weber, ENS Lyon), Laurent Beauguitte (Géographe, CNRS, UMR IDEES), Hadrien Commenges (Géographe, Université Denis Diderot Paris 7, UMR Géographie-cités), Bénédicte Garnier (Statisticienne, INED), Diane Le Luyer (géographe, UMR IDEES), Marion Le Texier (géographe, UMR IDEES, Rouen), Rosemonde Letricot (Historienne, LARHRA Université Lyon 3)

Programme provisoire (certains titres pourront être affinés ultérieurement)

Jours	Intervenants	Objet
Jeudi 22 juin matin 9h30-12h30	PUDL	Accès aux données de la statistique publique et ressources de données en ligne
Jeudi 22 juin après-midi 14h30-17h30	Hadrien Commenges	Histoire et vocabulaire des statistiques Prise en main de R et Rstudio
Vendredi 23 juin matin	Marion Le Texier et Julien Barnier	Des données à l’analyse : codage, découpage, manipulations et indicateurs de base
Vendredi 23 juin après-midi	Julien Barnier	Manipuler les données avec R
Samedi 24 juin matin	Marion Le Texier et Julien Barnier	Analyse bivariée : corrélation et régression
Lundi 26 juin matin	Diane le Luyer	Analyse multivariée (AFC, ACP, CAH)
Lundi 26 juin après midi	Diane le Luyer	Analyse multivariée : exercices pratiques
Mardi 27 juin matin	Rosemonde Letricot	Initiation à l’analyse de réseaux
Mardi 27 juin après-midi	Rosemonde Letricot	Analyse de réseaux avec R
Mercredi 28 juin matin	Bénédicte Garnier	Principes de l’analyse textuelle
Mercredi 28 juin après-midi	Bénédicte Garnier et Laurent Beauguitte	Analyse textuelle avec R
Jeudi 29 juin matin	Laurent Beauguitte	Cartographier les données (1)
Jeudi 29 juin après-midi	Laurent Beauguitte	Cartographier les données (2)

MODULE n°2 : Analyse quantitative et visualisation des données textuelles

(co-organisé par Jean-Marc Leblanc et Jean-Gabriel Contamin)

Présentation :

• Ce module constitue une introduction à l’analyse quantitative et qualitative des corpus textuels et à la sémantique discursive. Il s’adresse à tous les chercheurs dont les préoccupations scientifiques portent sur le dépouillement d’enquêtes et de formulaires, l’analyse des discours sociaux et politiques, l'exploration de corpus textuels. Il aura pour projet de présenter les principes de l’analyse et la visualisation des données textuelles, puis d’en démontrer à partir de cas pratiques l’intérêt, les limites et les nouveaux usages.

• Chaque atelier, outre la prise en main d’un logiciel et des problématiques théoriques qui s’y rattachent, comprend des exercices pratiques en linguistique de corpus et en statistique textuelle qui permettent de tester les fonctionnalités et de répondre aux questions concrètes des chercheurs.

• Les résultats produits par les outils textométriques intègrent désormais divers modules de mises en forme des données et des résultats demandant aux utilisateurs une maîtrise des outils de codage et de visualisation et une réflexion ergonomique. De nombreux outils de visualisation se développent sans être directement dédiés à la textométrie. Ils introduisent de nouveaux modèles, souvent esthétiques mais qui nécessitent de nouveaux apprentissages pour la lecture et l’interprétation. Les ateliers seront l'occasion de proposer une réflexion sur ces modèles de visualisation.

Pré-requis : La participation à ce module n’exige aucun pré-requis statistique, mais la lecture d’une ou plusieurs des références bibliographiques qui seront envoyées à l’avance aux stagiaires est souhaitable.

Intervenants :

• Philippe Gambette (LIGM, Marne-La-Vallée), Tita Kyriacopoulou (LIGM, Marne-La-Vallée), Jean-Marc Leblanc (CEDITEC-UPEC, Créteil) , Claude Martineau (LIGM, Marne-La-Vallée), Marie Pérès (CEDITEC-UPEC, Créteil).

Programme provisoire (certains titres seront affinés ultérieurement) :

Jours	Intervenants	Objet
Jeudi 22 juin matin 9h30-12h30	PUDL	Accès aux données de la statistique publique et ressources de données en ligne
Jeudi 22 juin après-midi 14h30-17h30	Jean-Marc Leblanc	Présentation générale: approches textométriques des discours. Présentation et typologie pratique des outils. Options théoriques, principes méthodologiques, limites interprétatives
Vendredi 23 juin matin	Marie Pérès	Atelier: balisage de corpus, catégorisation
Vendredi 23 juin après-midi	Jean-Marc Leblanc	Atelier: Prise en main des outils Lexico 3/5
Samedi 24 juin matin	Jean-Marc Leblanc	Atelier : Prise en main des outils Lexico 3/5
Lundi 26 juin matin	Jean-Marc Leblanc	Atelier : Présentation et prise en main de TextObserver: l'analyse factorielle des correspondances
Lundi 26 juin après midi	Philippe Gambette	Atelier : Les nuages arborées dans TextObserver et TreeCloud
Mardi 27 juin matin	Jean-Marc Leblanc	Atelier : Cooccurrences associées à un pôle, cooccurrences généralisées et mondes lexicaux. Prise en main d'Iramuteq et présentation d'Alceste
Mardi 27 juin après-midi	Tita Kyriacopoulou et Claude Martineau	Atelier : Visualisation des données textuelles, grammaires, requêtes: présentation de l'outil Unitex 1/2
Mercredi 28 juin matin	Tita Kyriacopoulou et Claude Martineau	Atelier : présentation de l'outil Unitex 2/2
Mercredi 28 juin après-midi	Jean-Marc Leblanc	Ateliers pratiques
Jeudi 29 juin matin	Marie Pérès	Modèles de représentation des connaissances et visualisation des données
Jeudi 29 juin après-midi	Jean-Marc Leblanc	Ateliers pratiques

dernière modification : 07/02/2017