Archive
Statistique et économétrie avec R : ressources utiles
GNU R (ou simplement R) est un langage puissant de programmation utilisé pour le traitement de données et l’analyse statistique. R est un logiciel libre distribué selon les termes de la licence GNU GPL. Il est disponible sous GNU/Linux, FreeBSD, NetBSD, OpenBSD, Mac OS X et Windows. R est utilisé dans de nombreuses disciplines comme la biologie, la psychologie, l’économie…
Voici quelques ressources utiles pour apprendre à utiliser R, pour lequel l’Urfist PacaC propose une formation ouverte aux enseignants-chercheurs et doctorants :
Le site officiel (ang): http://www.r-project.org
Il contient bien sûr une présentation de R, les sites de téléchargements du logiciel, les manuels, The R Journal (revue en accès libre), un wiki, etc.
La page wikipedia (fr) : http://fr.wikipedia.org/wiki/GNU_R
Interfaces graphiques pour R
Guides, manuels, cours
- An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics (ang, pdf) : manuel du site officiel.
- Le site du Zéro (fr) : Effectuez vos études statistiques avec R : apprentissage du language.
- R pour les statophones (fr, pdf), utilisation de R pour les statistiques de base, Denis Poinsot.
- R pour les débutants (fr, pdf), Emmanuel Paradis.
- Statistiques avec R. (ang) : Vincent Zoonekynd (une version française non mise à jour est également disponible)
- Econométrie des marchés financiers avec R (fr), Daniel Herlemont.
- Introduction à l’analyse des statistiques des données : travaux pratiques avec le logiciel "R" (fr), Christophe Pallier, Christophe Lalanne.
- Introduction au logiciel R (fr, pdf), Camelia Goga et Catherine Labruère.
- Support de cours sur le logiciel R (fr, pdf), Pierre-André Cornillon.
- R & Statistiques (fr), supports de formation aux statistiques appliquées, André Bouchier.
Aides-mémoire
- R Reference card (ang, pdf), Tom Short, très synthétique (4 pages).
- Aide mémoire R. Référence des fonctions de R les plus courantes (fr, pdf), Mayeul Kauffmann (traduction en grande partie de Tom Short).
- R Reference card (ang, pdf), Robison-Cox, plus short que Short (2 pages).
- Fonctions courantes du logiciel R (fr, pdf), Jérôme Mathieu.
- Aide mémoire (fr), Aymeric Duclert
- R: A Language and Environment for Statistical Computing – Reference index (ang, pdf), The R Core Development team. Fichier d’aide complet (attention : fichier volumineux, plus de 3000 pages)
- Un minidictionnaire pour comprendre R en français
Autres ressources
- Abcd’R (fr) : site collaboratif de partage de scripts, de codes et d’astuces sur le logiciel R (GNU-R).
- R-bloggers (ang): un agrégateur de blogs qui rassemble tous les articles parlant de R.
- Open directory project (ang) : liens internet pour R.
- Ressources pour R (fr) rassemblées par Ricco Rakotomalala.
- Resources to help you learn and use R (ang), UCLA.
- The Econometrics Journal Online : liens pour le logiciel R.
- Forum Web du Groupe des utilisateurs du logiciel R.
- Forum Web consacré à R sur developpez.net.
Vidéos
- Videos on Data Analysis with R: Introductory, Intermediate, and Advanced Resources : nombreux liens
- R Tutorials (Intromediate Microeconomics)
- R Tutorials (Tutorlol)
- Chaîne de F. Carlier sur YouTube : quelques tutoriels en français
Compléments pour l’analyse de données avec Excel
Si l’analyse de données avec tableur vous intéresse (voir également à ce sujet "La régression linéaire multiple (automatique) sur EXCEL"), je vous signale la présence au sein de la revue en ligne MODULAD (Le Monde des Utilisateurs de L’Analyse de Données) de la page Excel’Ense.
Présentation :
"Excel’Ense est un cahier d’information et d’échanges, ciblé sur l’exploitation des données et l’enseignement de la statistique avec un tableur, le prototype étant Excel™. Cette partie est animée par une équipe de statisticiens, réunis sous la bannière "Le Cercle d’Excel’Ense", auteurs et coordinateurs du manuel :
« L’analyse statistique des données – Apprendre, comprendre et réaliser avec Excel » Henry AUBERT, Kathy CHAPELAIN, Yves-Marie CHATELIN, Bernard GOLDFARB, Hélène GOUET, Jacques GOUPY, Emmanuel GRENIER, Olivier MARTIN, Alain MORINEAU, Catherine PARDOUX, Jacques VAILLÉ. Editions ELLIPSES, Paris, 2005 (413 pages) [Contenu du manuel]. Consulter les Editions ELLIPSES."

Une alternative à certains logiciels de statistique et d'économétrie, grâce aux feuilles et aux macros Excel proposées.cel et des macros pour Excel
Dans la rubrique "Feuilles et macros" vous trouverez notamment :
- La Statistique au service des Données : quelques macros Excel pour faire de l’analyse exploratoire des données.
- Pour calculer les coefficients d’autocorrélation d’une série chronologique.
- Une introduction à la démarche bayésienne sans formule mathématique.
- Effectuer une régression linéaire : deux fonctions personnalisées pour Excel
et bien d’autres…
Toutes ces ressources sont libres et modifiables par les utilisateurs, afin de les améliorer. Mais toute réutilisation des documents implique bien sûr l’obligation de citer leur origine (date et numéro de la Revue MODULAD avec son URL) et les noms des auteurs
Comment ajouter des étiquettes dans un graphique à nuages de points (XY) sur EXCEL ?
Voici une question qui m’a souvent été posée par des étudiants soucieux de faire figurer sur leur graphique EXCEL en nuage de points les étiquettes de texte associées aux valeurs XY représentées. Inutile de chercher dans les options de graphique d’EXCEL, une telle commande intégrée au logiciel n’existe pas. Heureusement, une macro Microsoft Visual Basic pour Applications est disponible sur le support de Microsoft à l’adresse :
http://support.microsoft.com/kb/213750/fr
En suivant les instructions pas à pas (pour EXCEL 2003 ou 2007) vous obtiendrez le résultat désiré, comme dans l’exemple ci-dessous :

Avant - après l’exécution de la macro. Les étiquettes des noms de pays apparaissent.
La régression linéaire multiple (automatique) sur EXCEL
Ricco Rakotomalala est maître de conférences à l’Université de Lyon 2 et membre du laboratoire ERIC (Equipe de Recherche en Ingénierie des Connaissances). A l’appui de ses enseignements de programmation et de traitement de données (data mining, économétrie et statistique), il met en ligne un nombre important de ressources : supports de cours, références en ligne, fichiers d’exemples, logiciels gratuits.
En parcourant la page consacrée à l’économétrie, j’ai découvert la manière d’exécuter automatiquement les principales opérations de la régression linéaire multiple (statistiques descriptives, estimation des paramètres, analyse des résidus, étude des points atypiques, étude la colinéarité) avec EXCEL.

Les résultats d'une régression sur une feuille EXCEL, avec les tests classiques de signification des coefficients
En téléchargeant gratuitement une collection de macros EXCEL qui est le fruit d’un travail de stage de M1 (réalisé en 2005 par Mlle NGUYEN LAO Bao Truc), vous pouvez donc vous passer d’un logiciel d’économétrie pour ces opérations. Un guide au format pdf accompagne ce fichier et vous guidera dans les (rapides) étapes de réalisation.
Téléchargements :
Voir aussi :
Econométrie : tous les logiciels

Voici quatre sites utiles pour trouver le logiciel adapté :
- Resources for Economists on the Internet : computational and statistical software
- Internet Resources for Economists : econometric software
- Econometric software links (Econometrics Journal)
- Logiciels gratuits de statistique et d’économétrie
Avec toutes les réserves habituelles concernant l’exactitude des informations, Wikipedia propose un comparatif des logiciels en terme de capacités mais aussi de prix : comparatif Wikipedia.
Gretl, logiciel d’économétrie libre
Gretl (acronyme de Gnu Regression, Econometrics and Time-series Library) appartient à la famille des logiciels d’économétrie libres (dont une liste intéressante est présentée sur http://www.freestatistics.info).
Le site de Framasoft (logiciels libres) présente les caractéristiques principale de Gretl :
"Au niveau des fonctionnalités on retrouve entre autre :
- La méthode des moindres carrés : ordinaire, pondérée, à deux étapes (two-stage least squares), non-linéaire
- Variables dépendantes discrètes ou tronquées : Logit, Probit, Tobit, Poisson
- Séries chronologiques : VAR, GARCH, Cochrane-Orcutt, …
- Statistiques descriptives
- Graphiques
- Possibilité d’implémenter la méthode de Monte Carlo, et le bootstrap
- Exportation des résulats vers LaTeX
Dans le monde du logiciel libre, Gretl est assez unique dans son genre. Ses concurrents directs se trouvent plutôt dans le monde des logiciels commerciaux (et payants) tel que TSP, RATS, EViews, Microfit, SHAZAM. Par rapport à la "concurrence", on pourrait reprocher à Gretl un certain manque de fonctionnalités. L’auteur de Gretl a néanmoins prévu cette éventualité, et il propose deux solutions. Tout d’abord, il offre la possibilité de lancer le logiciel R (si installé) à partir de Gretl en chargeant directement le jeux de données que l’on est en train d’analyser. Ensuite, on peut soumettre directement les routines que l’on souhaite avoir implémentées à l’auteur. Si l’on ne parle pas le C, on peut soumettre des suggestions écrites dans d’autres langages tels Fortran, C plus plus, Ox, Gauss, Octave, Matlab, R, ou bien du Pseudo-code."

Une copie d'écran de Gretl
Le téléchargement et de nombreuses ressources (guide, commandes, liens, etc.) sont disponibles à partir du site officiel de Gretl : http://gretl.sourceforge.net
Voici quelques autres liens utiles :
- Lee Adkin’s Gretl Page : ressources pour Gretl (e-book avec exemples).
- Gretl Wiki : site web collaboratif.
- Gretl User’s Guide (pdf), Allin Cottrell et Riccardo "Jack" Lucchetti.
- Gretl Command Reference (pdf), Allin Cottrell et Riccardo "Jack" Lucchetti.
- GRETL: Econometric software for the GNU generation, Giovanni Baiocchi et Walter Distaso, Journal of Applied Econometrics, Vol. 18, Issue 1, 2003, p. 105–110.
- GRETL 1.6.0 and its numerical accuracy, A. Talha Yalta et A. Yasemin Yalta, Journal of Applied Econometrics, Vol. 22, Issue 4, 2007, p. 849–854.
- Teaching undergraduate econometrics with Gretl, J. Wilson Mixon Jr et Ryan J. Smith, Journal of Applied Econometrics, Vol. 21, Issue 7, 2006, p. 1103-1107.
- Gretl 1.7.3, Andreas Rosenblad, Journal of Statistical Softare, Vol. 25, Software Review 1, 2008, p. 1103-1107.

