Accès direct au contenu

Stef

Version anglaise

aide

Accueil > Séminaires et colloques > Séminaires > Séminaire sur R

Séminaire sur le traitement, la gestion et l’analyse de données avec R



Objectif

La popularité croissante du langage R (www.r-project.org), comme outil de traitement de données quantitatives et qualitatives, conduit à de nouvelles et nombreuses pratiques de programmation dans des domaines variés. Ces pratiques sont rarement partagées hors ligne ou en dehors de situations d'enseignement. Afin d'offrir un espace de discussion et de partage autour des multiples usages de R, nous proposons d'organiser un séminaire sur le traitement et l'analyse de données avec R.

Y sera abordé l'ensemble des aspects de l'utilisation/manipulation de données : nettoyage, préparation, traitement, analyse, communication, partage... Le séminaire, plutôt orienté vers les sciences humaines et sociales, mais sans exclusive, a pour but de favoriser l'échange de pratiques effectives, autour de données réelles, en réponse à des problèmes, quelle que soit leur complexité.

Activité

Présenter dans les détails des scripts R pour le nettoyage, la préparation, le traitement, l'analyse, la présentation, la visualisation, le partage de données de recherches... D'autres langages ou applications sont susceptibles d'intervenir dans ces préoccupations et faire l'objet de présentations (Python, C, Matlab, SPSS, Modalisa...).

Exemples : présentation d'un algorithme particulier (comme Random Forest), un package (comme ggplot2), un instrument particulier (Shiny ou Rmarkdown) ou sur des techniques plus classiques (tests statistiques, régressions, analyse des correspondances...). Il est aussi possible de présenter des scripts produits pour l'enseignement.

Public visé

Étudiants, doctorants, chercheurs, ingénieurs, techniciens... ayant une pratique de R.

Organisation

Mensuellement ou bimensuellement pour une durée de 2 ou 3 heures sur le plateau du Moulon.

Données

Idéalement, dans l'esprit de l'open data, les participants peuvent utiliser des données qui leur sont propres, ou les jeux de données ouvertes ci-dessous :

  • Réponses à un questionnaire de motivation dans un Mooc
  • Résultats au brevet des collèges en Aquitaine entre 1998 et 2011

Programme 2015-2016


  • Séance 2 19 mai 2016

    - Réaliser une carte choroplèthe avec R, Françoise Tort (MCF au laboratoire STEF, ENS de Cachan)
    - Analyse de données d’étudiants en Python et R avec les notebooks Jupyter, Jill Jênn Vie (Doctorant au LRI, Orsay, CentraleSupélec et STEF, ENS de Cachan)

  • Séance 1 12 janvier 2016

    - Traitement automatique d'une question ouverte dans un questionnaire, Mehdi Khaneboubi (MCF au laboratoire STEF, ENS de Lyon)
    - Exploration de données de logs : visualisation des actions des apprenants d'un MOOC, Mattias Mano (Doctorant au i3-CRG, École Polytechnique et École Centrale Supélec)