MODULE
n°1 : Analyses
quantitatives des données en SHS : diversité et
complémentarité
Mesurer, analyser, visualiser les données en SHS
(co-organisé
par Laurent
Beauguitte et Etienne
Penissat)
Présentation :
•
Au-delà de la présentation de techniques particulières
propres à chaque session, le module aura pour
objectif et pour intérêt de présenter dans un même
module un large éventail des techniques d'analyse
quantitative des données, dans leur diversité et
dans leur complémentarité. Il est en effet de plus
en plus nécessaire, dans les travaux de sciences
sociales, de recourir à des techniques d'analyse
croisées, ce qui suppose tout à la fois la
connaissance et la maîtrise de ces techniques, mais
aussi la possibilité de les appliquer à partir
d'un même logiciel. C'est ce que ce module aura
pour objet de proposer en proposant une formation
à la fois théorique et pratique à un ensemble de
techniques de recueil et d'analyse, des plus simples
aux plus élaborées (des statistiques multivariées
à la cartographie) à partir du logiciel libre R.
•
Le module est destiné à un public de
praticien.ne.s des sciences humaines et sociales
(ingénieur.e, doctorant.e, post-doctorant.e) intéressé
par le potentiel des méthodes statistiques mais
n'ayant jamais pu bénéficier de formations dignes
de ce nom. La démarche proposée est progressive et
commence par un rappel historique sur l'utilisation
des statistiques en sciences humaines et sociales.
Les manipulations de base relatives aux données
(codage, tri, description) sont détaillées et
mises en œuvre avant de poursuivre en présentant
des méthodes de traitements bi et mulitivariés.
Les aspects relatifs à la visualisation des données,
cruciaux aujourd'hui dans la communication
scientifique, sont abordés en fin de module
(analyse de réseaux, cartographie).
•
La pluralité disciplinaire des intervenant.e.s (géographie,
informatique, histoire, statistiques) vise à
montrer la diversité et la richesse des approches
statistiques disponibles.
A l'issue de la formation, les participant.e.s
doivent pouvoir :
- choisir un mode de traitement adapté 1) aux données
2) à la problématique
- réaliser les traitements et interpréter les résultats
de manière autonome dans un environnement logiciel
libre
- réaliser des visualisations attrayantes et sémiologiquement
correctes de leurs données
Pré-requis
: La participation à ce module n’exige aucun pré-requis statistique,
mais la lecture d’une ou plusieurs des références
bibliographiques qui seront envoyées à l’avance
aux stagiaires est souhaitable.
Intervenants :
•
Julien
Barnier (Informaticien, Centre Max Weber, ENS
Lyon),
Laurent Beauguitte (Géographe, CNRS, UMR IDEES),
Hadrien
Commenges (Géographe, Université Denis Diderot
Paris 7, UMR Géographie-cités), Bénédicte
Garnier (Statisticienne, INED), Diane
Le Luyer (géographe, UMR IDEES), Marion
Le Texier (géographe, UMR IDEES, Rouen), Rosemonde
Letricot (Historienne, LARHRA Université Lyon 3)
Programme provisoire (certains
titres pourront être affinés ultérieurement)
|
|
Objet
|
|
PUDL
|
Accès aux données de la
statistique publique et ressources de données
en ligne
|
Jeudi 22 juin
après-midi 14h30-17h30
|
Hadrien Commenges
|
Histoire et vocabulaire des
statistiques
Prise en main de R et
Rstudio
|
Vendredi 23 juin
matin
|
Marion Le Texier et Julien
Barnier
|
Des données à l’analyse :
codage, découpage, manipulations et
indicateurs de base
|
Vendredi 23 juin
après-midi
|
Julien Barnier
|
Manipuler les données avec R
|
Samedi 24 juin
matin
|
Marion Le Texier et Julien Barnier
|
Analyse bivariée : corrélation et régression
|
Lundi 26 juin
matin
|
Diane le Luyer
|
Analyse
multivariée (AFC, ACP, CAH)
|
Lundi 26
juin
après midi
|
Diane le Luyer
|
Analyse multivariée : exercices pratiques
|
Mardi 27 juin
matin
|
Rosemonde
Letricot
|
Initiation
à l’analyse de réseaux
|
Mardi 27 juin
après-midi
|
Rosemonde Letricot
|
Analyse de réseaux avec R
|
Mercredi 28 juin
matin
|
|
Principes de l’analyse textuelle
|
Mercredi 28 juin
après-midi
|
Bénédicte Garnier et Laurent Beauguitte
|
Analyse textuelle avec R
|
Jeudi 29 juin
matin
|
Laurent Beauguitte
|
Cartographier les données (1)
|
Jeudi 29 juin
après-midi
|
Laurent Beauguitte
|
Cartographier les données (2)
|
|
MODULE
n°2 : Analyse
quantitative et visualisation des données
textuelles
(co-organisé par Jean-Marc
Leblanc et Jean-Gabriel
Contamin)
Présentation :
•
Ce module constitue une introduction à l’analyse quantitative et
qualitative des corpus textuels et à la sémantique
discursive. Il s’adresse à tous les chercheurs
dont les préoccupations scientifiques portent sur
le dépouillement d’enquêtes et de formulaires,
l’analyse des discours sociaux et politiques,
l'exploration de corpus textuels. Il aura
pour projet de présenter les principes de
l’analyse et la visualisation des données
textuelles, puis d’en démontrer à partir de cas
pratiques l’intérêt, les limites et les nouveaux
usages.
•
Chaque atelier, outre la prise en main d’un logiciel et des problématiques
théoriques qui s’y rattachent, comprend des
exercices pratiques en linguistique de corpus et en
statistique textuelle qui permettent de tester les
fonctionnalités et de répondre aux questions concrètes
des chercheurs.
•
Les résultats produits par les outils textométriques intègrent désormais
divers modules de mises en forme des données et des
résultats demandant aux utilisateurs une maîtrise
des outils de codage et de visualisation et une réflexion
ergonomique. De nombreux outils de
visualisation se développent sans être directement
dédiés à la textométrie. Ils introduisent de
nouveaux modèles, souvent esthétiques mais qui nécessitent
de nouveaux apprentissages pour la lecture et
l’interprétation. Les ateliers seront l'occasion
de proposer une réflexion sur ces modèles de
visualisation.
Pré-requis : La
participation à ce module n’exige aucun pré-requis
statistique, mais la lecture d’une ou plusieurs
des références bibliographiques qui seront envoyées
à l’avance aux stagiaires est souhaitable.
Intervenants :
• Philippe
Gambette (LIGM, Marne-La-Vallée), Tita
Kyriacopoulou (LIGM, Marne-La-Vallée), Jean-Marc
Leblanc (CEDITEC-UPEC, Créteil)
, Claude Martineau
(LIGM, Marne-La-Vallée), Marie
Pérès
(CEDITEC-UPEC,
Créteil).
Programme provisoire (certains
titres seront affinés ultérieurement) :
|
|
Objet
|
|
PUDL
|
Accès aux données de la statistique publique et ressources de données
en ligne
|
Jeudi 22 juin
après-midi 14h30-17h30
|
Jean-Marc Leblanc
|
Présentation générale: approches textométriques des discours. Présentation
et typologie pratique des outils. Options théoriques,
principes méthodologiques, limites interprétatives
|
Vendredi 23 juin
matin
|
Marie
Pérès
|
Atelier:
balisage de corpus, catégorisation
|
Vendredi 23
juin
après-midi
|
Jean-Marc
Leblanc
|
Atelier:
Prise en main des outils Lexico 3/5
|
Samedi 24 juin
matin
|
Jean-Marc
Leblanc
|
Atelier
: Prise en main des outils Lexico 3/5
|
Lundi 26 juin
matin
|
Jean-Marc
Leblanc
|
Atelier
: Présentation et prise en main de
TextObserver: l'analyse factorielle des
correspondances
|
Lundi
26 juin
après midi
|
Philippe
Gambette
|
Atelier
: Les nuages arborées dans TextObserver et
TreeCloud
|
Mardi 27 juin
matin
|
Jean-Marc
Leblanc
|
Atelier
: Cooccurrences associées à un pôle,
cooccurrences généralisées et mondes
lexicaux. Prise en main d'Iramuteq et présentation
d'Alceste
|
Mardi 27 juin
après-midi
|
Tita
Kyriacopoulou et Claude Martineau
|
Atelier
: Visualisation des données textuelles,
grammaires, requêtes: présentation de
l'outil Unitex 1/2
|
Mercredi 28
juin
matin
|
Tita
Kyriacopoulou et Claude Martineau
|
Atelier
: présentation de l'outil Unitex 2/2
|
Mercredi 28
juin
après-midi
|
Jean-Marc
Leblanc
|
Ateliers
pratiques
|
Jeudi 29 juin
matin
|
Marie
Pérès
|
Modèles
de représentation des connaissances et
visualisation des données
|
Jeudi 29 juin
après-midi
|
Jean-Marc
Leblanc
|
Ateliers
pratiques
|
|