Avec le buzz actuel autour de la data science, de nouveaux outils arrivent sur le devant de la scène. Quand je dis « nouveaux » c’est un peu une exagération car la plupart existaient déjà, mais ils deviennent très visibles et populaires. Parmi ceux-ci, il y a R, un logiciel d’analyse statistique, qui permet de faire du traitement de données, de la visualisation. R est gratuit, R est plein de fonctionnalités grâce à une communauté très active qui release de nombreux packages.
Bref, vous devinez que pour moi R est un outil indispensable, et à vrai dire je m’en sers intensivement, quotidiennement, pour faire du prototypage mais aussi des outils qui sont en production.
Apprendre R, c’est facile quand on est informaticien, mais c’est facile aussi dès qu’on a l’habitude de l’outil informatique (vous remarquez la nuance), ce qui est par exemple le cas de beaucoup de webmasters et webmarketeurs. Il n’y a pas vraiment besoin de suivre des cours, il suffit d’avoir les bons bouquins et de prendre du temps pour apprendre.
Voici donc mon avis sur quelques livres utiles pour apprendre R, que vous pouvez mettre sur votre liste au gros barbu qui mets des paquets au pied du sapin (et en plus, j’ai mis mes liens d’affiliation^^).
R in action
Il s’agit d’après moi d’un des meilleurs livres pour apprendre à se servir de R. Édité par Manning, qui est sans doute l’un des meilleurs éditeurs de livres techniques en anglais, ce bouquin vous mènera de l’installation jusqu’à une utilisation très correcte de l’outil. Rien que pour les chapitres de la partie I il vaut le coup, ensuite les sujets sont plus orientés statistiques que outils pour le web, mais c’est quand même à lire.
Practical Data Science with R
Toujours chez Manning, il s’agit d’un livre que j’ai beaucoup apprécié car il est structuré « par l’exemple », une démarche appréciable pour la plupart des praticiens de R. Même si vous n’êtes pas un statisticien, même si vous avez appris l’informatique sur le tas, ou encore même si vous êtes encore étudiant, vous pourrez résoudre des problèmes intéressants, vous pourrez faire des visualisations au top en étant guidé. Certains chapitres sont vraiment au top, c’est par exemple le cas de celui sur le clustering, qui est très clair et utile.
Initiation à la statistique avec R
Voici un livre en français qui introduit R rapidement, et qui est ensuite plus un cours de statistique pour les étudiants de licence avec un soutien informatique en R. J’en parle principalement parce qu’il est facile à lire, mais ce n’est pas celui que je vous conseille si vous êtes dans le web.
R for everyone
Ce livre là est clairement en compétition avec « R in action » proposé plus haut. Un livre d’excellente tenue, et qui a le bon goût d’être basé sur ggplot2 pour la réalisation des visualisations de données, ce qui est bienvenue car il s’agit de très loin du meilleur package pour faire les graphiques en R.
Voilà, avec ça vous avez de quoi vous occuper pendant un petit moment 😉 Si vous ne devez en prendre qu’un : prenez R in action ou R for everyone, avec peut-être une préférence pour le second.