Le book log de juillet 2018

Autant j’ai été en retard sur le book log précédent, autant pour celui de juillet je peux me rattraper facilement : c’est le mois d’août – plus tranquille – et en plus je suis dans un endroit où à l’heure où j’écris il fait 19° et il pleut à verse…

Bref, le mois de juillet à été très chargé point de vue boulot et j’ai eu moins de temps que d’habitude pour bouquiner. Je vais donc avoir moins de livres à vous proposer.
Business as usual : les liens amazon c’est de l’affiliation, pas la peine de râler vous n’êtes pas obligé de cliquer ?

Le booklog

  • Toujours des livres de la black library (warhammer 40k) – plein d’auteurs, certains qui savent à peine écrire, d’autres qui sont vraiment bons (sur Amazon).
    Parmi ceux que j’ai lu durant le mois de juillet, il y en a deux qui pour moi se démarquent. Le premier est Imperium Sombre de Guy Haley, qui nous parle du retour de Roboute Guilliman et donc naturellement des ultramarines. C’est l’occasion pour la franchise W40K d’intégrer les nouveaux éléments du jeu : les primaris, des technologies plus modernes, etc. Le second que je vous conseille est un recueil de nouvelles sur 4 primarques, intitulé (quelle surprise) Les primarques.
  • Apprendre R en un jour – Steven Murray (sur Amazon)
    C’est un ebook qui vaut 99 centimes, et vous ne prenez aucun risque à l’acheter, mais vous serez déçu car objectivement pas de quoi casser trois pattes à un canard.
  • Decision trees, a visual introduction for beginners – Chris Smith (sur Amazon)
    Là encore un livre direct to kindle, ce coup-ci à 2.99 euros et sur les arbres de décisions, pour les débutants. Pour le coup, je vous le conseille si vous êtes débutant car tout est plutôt bien expliqué.

Voilà, je vous l’avais dit : c’est court !

 

Le plein de formations aux ix-labs – 108 !

Depuis mi-juillet nous avons ouvert notre centre de formation, connu sous le sobriquet de « ix-labs – 108 » car il est au 108 avenue de Fontainebleau, métro bicêtre ligne 7. C’est pour nous l’opportunité de voir plus grand sur une activité qui est notre coeur de métier avec la R&D. En conséquence, nous allons ouvrir un très grand nombre de formations au fur et à mesure des mois, et je suis en mesure de vous annoncer 15 formations différentes dès le 1er septembre, dont voici un descriptif rapide.

Nous annonçons tout cela durant l’été, et les premières sessions sont en septembre, pour vous « pousser » à venir vite, une partie des sessions de septembre bénéficient d’un prix promotionnel. Dans tous les cas, il faut s’inscrire assez vite, entre l’annonce twitter d’il y a quelques jours et la publication de ce billet, nous avons eu plus d’une dizaine d’inscriptions !

Voilà, je vous laisse lire les petites descriptifs, et si vous avez des questions, les commentaires sont ouverts 😉

Pour les SEOs

Que dire ? nous formons des SEOs depuis juin 2013 et notre offre s’étoffe un peu plus chaque jour 😉

Masterclass moteurs+SEO étendue (2 jours)

C’est notre formation « star », déjà suivie par probablement plus de 400 SEOs. On y parle de comment fonctionne un moteur de recherche et de l’impact de la connaissance de ce fonctionnement sur les pratiques SEO. La prochaine session est les 15/16 octobre, et la suivante les 29/30 novembre. Si vous voulez la suivre, je vous conseille de vous y prendre en avance, ça simplifie les prises en charge au niveau des OPCA, et les places partent généralement assez vite.

Les essentiels de la masterclass (1 journée)

Parce que tout le monde n’a pas la possibilité de faire deux jours de formation complets sur Paris, nous avons mis en place début juillet ce nouveau format (déjà suivi par une vingtaine de SEOs) qui contient les parties indispensables de la masterclass dont les différents pageranks et surfeurs aléatoires, la pertinence et les algos associés (cosinus de Salton, Rocchio, etc.) et le learning-to-rank. Si vous ne connaissez pas certains des mots de la phrase précédente et que vous êtes SEO, il faut venir !
Prochaine session le 13 septembre, avec un prix promo, ensuite ce sera le 11 octobre, puis le 23 novembre.

Atelier data pour les SEOs (1 journée)

La data science fait son entrée dans tous les domaines. En référencement web, l’analyse des data permet de découvrir de nombreux leviers à actionner. Cependant, si le métier de référenceur web est parfois technique, il est avant tout polyvalent.
Dans ce cadre, la data science est avant tout un outil et non pas un nouveau métier à apprendre.

Nous avons codé plusieurs outils de data science pour le SEO. Nous allons vous les donner en début  de formation.Vous allez être formés à leur utilisation ainsi qu’à la compréhension des résultats qu’ils donnent. Vous pourrez alors les utiliser quotidiennement dans le cadre de vos actions SEO (audits ou pratiques).

Il ne s’agit donc pas d’apprendre la data science (on a des formations dédiées pour cela), mais bien d’apprendre à utiliser des outils « data » pour le SEO. Je le redis : vous partirez avec des outils fonctionnels, pour capitaliser de suite sur ce que vous aurez appris.

Nous avons déjà fait 4 sessions, et la prochaine est le 20 septembre (en promo) et la suivante le 25 octobre.

Faire un audit algorithmique complet (1 journée)

Au fur et à mesure des derniers mois, durant lesquels nous avons conjointement coaché quelques agences sur les audits algorithmiques, et en même temps vendu des outils pour faire ces audits (voir l’atelier data par exemple), nous avons pu voir que les jeunes SEOs (et parfois les anciens aussi) n’étaient pas toujours au fait de ce qu’ils pouvaient offrir au client en matière d’audit très avancée. Cette formation vous explique comment nous faisons nos audits algorithmiques, et ce que nous y mettons.

Il y aura peu de sessions, car nous ne voulons pas noyer le marché sous les audits algorithmiques 😉 Dépêchez vous donc de vous inscrire à la session du 7 novembre, la seule programmée pour l’instant.

Pour ceux qui veulent devenir data scientist et/ou développeur

Savoir développer c’est aujourd’hui l’assurance de ne jamais manquer de travail, mais aussi d’être capable de réaliser soi-même un certain nombres d’outils pour se faciliter la vie ou pour créer une traction commerciale. Parmi les profils « un peu » développeur, il y a également le profil du data scientist, qui est très demandé.

Nous proposons des formations à court ou moyen terme pour vous permettre de monter en compétences en développement R et Python, et pour vous mettre le pied à l’étrier pour devenir data scientist.

Devenir Data Scientist (1 journée)

Data scientist est un métier qui fait rêver. Cette « formation » a pour but de démystifier le métier, et d’en expliquer en détail toute les méthodologies et les outils utilisés. Des exemples concrets issus de nos propres travaux et prestations servent de fil rouge tout au long de la journée.

En sortant, vous ne serez pas data scientist, mais vous pourrez mettre en place une stratégie personnelle pour le devenir à court/moyen terme selon votre profil.

Une seule session est programmée pour l’instant, le 15 novembre, et le prix est modique, dépêchez vous !

Apprendre Python : les bases (1 journée)

Python est un langage simple à lire et à écrire idéal pour débuter en programmation, et c’est devenu un must have pour tous les développeurs, et pour une bonne partie des data scientists. Cette formation a pour but de permettre aux novices de découvrir la programmation avec le langage Python et de pouvoir suivre ensuite nos modules additionnels (voir un peu plus loin).

Parce que c’est un prérequis de plusieurs de nos autres formations, nous faisons le tarif le moins cher possible (300 euros HT pour celle de septembre, 375 euros HT ensuite). Vous pouvez venir aux autres formations « avancées » sans l’avoir suivi si vous avez déjà une maitrise suffisante de Python.

Voici un lien pour celle du 27/09/2018, un lien pour celle du 26/10/2018 et un lien pour celle du 08/11/2018.

Apprendre R : les bases (1 journée)

R est un langage très facile d’utilisation grâce à sa banque de packages et sa syntaxe très permissive. C’est aussi un langage de choix pour faire de l’analyse de données.

Comme pour la formation Python ci-dessus, cette formation aux bases de R permet de suivre ensuite de nombreux modules spécifiques que nous sortirons au fur et à mesure.

La première session est le 26 septembre, la suivante le 8 novembre.

Manipuler les logs et l’API Analytics avec R (1/2 journée)
Data wrangling et python
Machine learning et python
Scrapy et beautifulsoup

Je groupe mon descriptif de ces quatre formations, qui sont toutes basées sur le même principe : il s’agit de modules additionnels aux formations de bases de développement. Si vous êtes déjà familier avec R ou Python, pas besoin de suivre la journée de base vous pouvez venir directement.
Direction le site pour s’inscrire à l’une de ces formations.

ELK Stack: Elasticsearch, Logstash, Kibana

La stack ELK est la stack de choix pour faire de l’analyse de logs, pour faire un moteur interne, etc. Cette formation vous transmets les bases d’ELK : installation, utilisation et quelques petits cas pratiques.

Pour l’instant une seule date : le 22 novembre.

Pour les éditeurs de sites

En dehors du seo et de la data science, il y a une vie 😉 Nous vous proposons trois formations qui sont destinées à un public encore plus large : pour la première toutes les personnes qui font de près ou de loin du webmarketing, pour la seconde tous les propriétaires de sites web, et pour la dernière toute personne qui rédige du contenu sur le web, ou qui en fait faire.

Webmarketing, comprendre et utiliser le machine learning (1 journée)

Des algorithmes utiles pour le marketing en ligne : systèmes de recommandation, A/B testing, bandits manchots, analyse de paniers, segmentation client, uplift, voilàce que vous trouverez dans cette formation à mon sens indispensable au moins pour savoir ce que les algos peuvent apporter au marketing et à votre site.

Toutes les infos : https://freres.peyronnet.eu/produit/webmarketing-machine-learning/, pour l’instant deux sessions de cette formation déjà suivie par une soixantaine de webmasters : le 21 septembre et le 14 novembre.

Comment rendre son site web rapide ? (1 journée)

La vitesse des sites est une préoccupation majeure pour les webmasters, particulièrement dans le domaine du e-commerce. Dans cette formation technique nous vous transmettons toutes les bonnes pratiques pour avoir un site réellement rapide.

Il y a une seule session avant fin novembre : le 27 septembre, dépêchez vous de vous inscrire il y a peu de places.

Utiliser Yourtextguru comme un pro (2 heures)

Yourtext.guru est un outil d’aide à la rédaction, notamment conçu pour les besoins des SEOs, des rédacteurs et des webmarketeurs. Nous vous invitons à venir découvrir les différentes façons d’utiliser cet outil sémantique afin d’en tirer le maximum de profit.

Les sessions, d’environ 2h, sont gratuites et aussi bien destinées à ceux qui connaissent bien déjà l’outil qu’à ceux qui le découvrent.

Elles sont gratuites mais les inscriptions sont obligatoires car il y a beaucoup de demandes (la première n’a déjà plus que 2 places disponibles).

Prochaine session le 21 septembre, suivante le 10 octobre.

 

La certification ix-seo, du niveau 1 au 3, il faut la faire !

Aujourd’hui je vais vous parler des trois certifications SEO que nous avons mis en place aux ix-labs : les certifications ix-seo niveau 1, niveau 2 et niveau 3.

Je vais commencer par vous les décrire, ensuite je vais vous parler de pourquoi il est à mon sens indispensable de passer des certifications (pas forcément les nôtres) et enfin je vais vous expliquer pourquoi faire les nôtres et où et comment les faire.

Les certifications ix-seo

La certification ix-seo niveau 1 permet de valider les connaissances généralistes que nous pensons être celles des SEOs. Je dis nous car nous avons été aidé par plusieurs SEOs (Olivier Andrieu, Olivier Duffez, Mathieu Chartier et Frédérik Bobet) pour faire les questions qui sont posées aux candidats.

Le passage du niveau 1 dure 2h, avec trois parties : un QCM avec questions VRAI/FAUX, un QCM avec questions à 3 choix dont un seul est correct, et des questions ouvertes (et attention il faut écrire à la main, c’est comme à l’école). Chaque partie est sur 100 points et pour obtenir la certification il faut : avoir au moins 60 dans les deux premières parties et au moins 201 sur 300 au global. Plus le score est haut mieux c’est.

L’objectif du niveau 1 n’est pas de valider des experts SEO, c’est au contraire de valider un socle de connaissance de base que doit avoir tout SEO (selon l’équipe des ix-labs, car nous assumons les choix qui sont faits). En faisant passer le niveau 1 aux maximum de SEO de tous les niveaux, on pourra donner une visibilité au niveau des recruteurs, c’est le but de ce niveau 1.

Si vous voulez montrer votre expertise pointue, il faut alors passer les niveaux 2 et 3 de la certification.

Le niveau 2 valide la capacité à créer et mettre en place une stratégie SEO. Pour la passer, il faut le niveau 1, et rendre un mémoire sur un cas concret fourni par le jury. En pratique cela veut dire que nous vous fournissons une short list de 3 ou 4 sites, et que vous devez en choisir un et rendre un rapport d’audit complet avec préconisations pour une stratégie SEO de votre choix. C’est un travail conséquent qui est demandé. Pour l’instant il n’y a qu’une personne qui a été validé, et son rapport était très complet. Le niveau 2 est sanctionné par une note sur 60 (6 critères sur 10 points chacun) et il faut au moins 36/60 pour être certifié. Le certifié type du niveau 2 est donc un SEO déjà aguerri.

Enfin, le niveau 3 permet de valider les compétences en situation réelle. Pour passer le niveau 3, il faut le niveau 2 et il faut soutenir devant un jury de pairs une présentation d’un cas client réel (avec une lettre du client qui atteste que le candidat est bien celui qui a fait le travail). L’objectif est donc de certifier des SEO au plus au niveau opérationnel.

Pourquoi passer une certification

Si vous êtes SEO de vos sites (dans ce cas je pense que éditeur est un mot qui convient mieux), alors bien sûr vous n’avez pas besoin de passer une certification (qaseo, ceseo, ix-seo, etc.). Mais sinon c’est utile :

  • Pour vous, car cela vous rend plus facile à cerner lors des recrutements, et si vous êtes indépendants cela donne de la visibilité au niveau des clients.
  • Pour les recruteurs, car pour l’instant il n’y a que peu de diplômes et formations, et on s’aperçoit que souvent les candidats marquent qu’ils ont la certification X ou Y, ou encore mieux, qu’ils ont suivi la formation de X ou Y (Olivier Duffez, SEO HL, frères Peyronnet, etc.). Il y a donc besoin de plusieurs marqueurs connus des recruteurs pour faciliter l’insertion professionnelle des SEOs.
  • Pour le secteur du SEO, sans rentrer dans les discussions de bar assez fréquentes dans le milieu, on voit qu’au moins une partie de la communauté est en recherche d’éléments structurants. Une certification fait partie de ces éléments.

Pourquoi la notre et pas une autre

(pour l’historique des premiers mois, c’est ici)

Première chose : il n’y a pas d’exclusion entre les certifications, à terme c’est le secteur qui arbitre (principalement les recruteurs en fait) et en attendant la meilleure stratégie est de passer toutes les certifications.

Ensuite, on a fait la notre pour plusieurs raisons, et parmi les raisons qui peuvent vous pousser à jouer le jeu de ix-seo il y a :

  • On associe notre nom à cette formation, et il est stable. Quand une entité créee une certification, il faut que la vision soit la même depuis la première année de certification jusqu’à 5, 10, 15 ans plus tard. C’est plus facile quand des personnes/entreprises mettent un label que quand c’est des groupes plus ou moins informels avec des changements de gouvernance fréquents, et donc des visions du métier qui vont différer d’un mandat sur l’autre.
  • Nous avons la capacité financière pour faire cette certification à grande échelle. Jusqu’ici nous avons fait passer peu de monde sur 2 mois en 2017 pour tester le concept. Convaincu, nous avons attendu de sécuriser une salle full time pour passer la seconde. C’est chose faite avec l’ouverture du centre de formation des ix-labs sur Paris. A compter de fin août nous planifions des certifications toutes les semaines hors vacances, nous pouvons donc faire passer plusieurs centaines de personnes par mois si il y a la demande en rapport.

C’est où ? combien ça coûte ?

C’est aux IX-LABS – Le 108, accès Métro 7 Le Kremlin-Bicêtre, 108 avenue de Fontainebleau,94270 Le Kremlin-Bicêtre.

Pour le niveau 1, c’est 25 euros HT (30 euros TTC) par personne pour le café, les bonbons, les 2 heures d’examen et la correction. Cette somme est une participation aux frais sachant que le temps de correction moyen est de 20 minutes par candidat en moyenne. L’objectif est de fournir un service à la communauté, à ce prix ce n’est pas rentable (mais on peut le faire, aussi car la salle est à nous). Pour ceux qui se posent la question, la rentabilité commence à plus de 50 euros TTC par personne pour le niveau 1.

Bien entendu les niveaux 2 et 3 sont plus coûteux (il y a un jury dès le niveau 2, et c’est en presentiel pour le niveau 3), mais c’est une histoire pour un autre jour.

Si vous voulez vous inscrire dès les premiers créneaux, voici les 7 premiers :

Attention, inscription obligatoire sur le site web, impossible de s’inscrire sur place

22 août

6 septembre

12 septembre

26 septembre

4 octobre

14 novembre

22 novembre

Attention, inscription obligatoire sur le site web, impossible de s’inscrire sur place

Les résultats actuels : http://www.ix-labs.org/certification-ix-seo/

Voilà, vous savez tout, à bientôt !

Le book log de mai et juin 2018

Bonjour à tous !

A l’origine je devais faire le booklog de mai en premier, puis celui de juin, mais comme je suis complètement à la bourre voici le booklog des deux mois. Il contient également mes conseils pour vos lectures de l’été.
Business as usual : les liens amazon c’est de l’affiliation, pas la peine de râler vous n’êtes pas obligé de cliquer ?

Le booklog

    • Courir ou mourir – Kilian Jornet (sur Amazon)
      Jornet est un athlète hors norme et ce livre sans prétention évoque sa pensée et sa motivation pour la course à pieds. L’écriture est assez mauvaise, mais la lecture est rapide et ça reste raisonnablement intéressant.
    • La flotte perdue – tomes 1 à 6 – Jack Campbell (sur Amazon) puis La flotte perdue : par delà la frontière – tomes 1 à 6 – Jack Campbell (sur Amazon)
      Ce genre de saga assez nulle dans le fond me fascine toujours. Ici il s’agit de grandes batailles épiques dans le futur, avec des extraterrestres et des gros vaisseaux. Ne vous attendez pas à de la grande littérature, personnellement c’est ce que je lis pour m’endormir, tard le soir…
    • Machine learning avec Python – Andreas Mueller et Sarah Guido (sur Amazon)
      Un bon livre pour apprendre, comme le nom l’indique, le machine learning avec Python.
    • Twenty Lectures on Algorithmic Game Theory – Tim Roughgarden (sur Amazon)
      Un livre pour les étudiants très avancés ou les chercheurs dans le domaine de la théorie des jeux et qui veulent bien comprendre les fondements mathématiques de la création des mécanismes, le prix de l’anarchie, etc.
    • Apprendre à programmer en Python avec PyZo et Jupyter Notebook – Bob Cordeau et Laurent Pointal (sur Amazon)
      Ce n’est personnellement pas mon livre favori pour apprendre Python, mais ici il y a une spécificité avec les notebooks, ce qui peut sans doute intéresser certains de mes lecteurs.
    • Plein de livres de la black library (warhammer 40k) – plein d’auteurs, certains qui savent à peine écrire, d’autres qui sont vraiment bons (sur Amazon).
      Là encore c’est de la littérature de commande avec à boire et à manger, toujours dans l’univers du jeu de figurines warhammer 40k (space marines, orks, eldars, etc.). La série de l’hérésie d’Horus est globalement de bonne qualité, ainsi qu’une bonne partie de la série sur les primarques. Pour le reste c’est très très variable. La saga des fantômes de Gaunt est plutôt bien, la sage sur Eisenhorn l’inquisiteur tient la route, en revanche les one-shot sur des batailles épiques ou des personnages alternatifs sont souvent assez nuls.
    • Narcissisme: Recueil de Nouvelles – Camille Gillet  (sur Amazon).
      Camille, qu’on croise souvent sur Twitter lorsque l’on fait partie de la sphère SEO/webmarketing/rédaction web, est avant tout une véritable auteure, et vous pouvez maintenant acquérir sur Amazon son premier recueil de nouvelles. C’est à lire, c’est pas cher, faut pas être timide !

Pour l’été

Je pourrais vous conseiller un plein cartons de livres pour cet été, mais je vais me cantonner à deux seulement.
Le premier est Au péril de l’humain, par Jacques Testart et Agnès Rousseau (sur Amazon). Ce livre c’est l’alliance d’un biologiste et d’une journaliste engagée pour nous parler de ce qu’est le transhumanisme et surtout de l’idéologie sos-jacente au mouvement, qui d’après les auteurs est du ressort de la haine de soi-même. C’est à lire car cela remet en perspective le discours solutionniste que l’on a l’habitude d’entendre chez les techno « prophètes ».
Ma deuxième proposition est Makers, par Isabelle berrebi-Hoffmann, Marie-Christine Bureau et Michel Lallement (sur Amazon). Ces trois auteurs sont tous sociologues et dans ce livre ils évoquent les différents aspects de cette culture du « faire ». On y parle hackerspace et fablab, en y évoquant ce qui différencie l’un de l’autre (basiquement l’un est plus « politique » que l’autre), on y parle de la spécificité française, on y parle de la relation du mouvement des makers à la marchandisation du monde, etc. C’est objectivement un livre très intéressant que je vous conseille vivement.

Voilà, bonne lecture, et bon été bien sûr !

 

Le book log d’avril 2018

Sur ce blog j’ai souvent fait des billets sur quelques bouquins à lire (ou pas d’ailleurs)… Pour réussir à m’astreindre à parler livres régulièrement, je change mon fusil d’épaule et je vais faire un book log d’une partie des livres que je lis mois par mois, ce sera beaucoup plus simple pour moi.

Globalement, je ferais une liste avec juste quelques mots et même parfois une note (car c’est souvent plus parlant), et sauf exception je ne mettrais pas les bouquins très techniques du boulot.

Enfin, comme d’habitude les liens amazon c’est de l’affiliation, pas la peine de râler vous n’êtes pas obligé de cliquer 😉

  • Jusqu’au coeur du Soleil: Élévation, T1 – David Brin (sur amazon)
    On commence par la déception du mois. David Brin est un des grands noms de la SF, mais j’ai toujours trouvé que ses récits étaient poussifs, c’est pour moi encore le cas ici, et j’avoue (et c’est pourtant rare) que je n’ai même pas tenu jusqu’au bout.
  • Vingt mille lieues sous les mers – Jules Verne
  • L’île mystérieuse – Jules Verne
    Deux grands classiques…  je relis périodiquement l’île mystérieuse que j’aime beaucoup et pour d’évidentes raisons (spoiler) j’ai eu envie de relire 20 000 lieues sous les mers. Je suis moins fan de ce dernier, mais si vous n’avez jamais lu Jules Verne, il est temps de corriger cette erreur.
  • Le Dernier Château et autres crimes – Jack Vance (sur amazon)
    Quatre textes de Jack Vance, rien de plus à dire, c’est très bien comme d’habitude.
  • La saga de John Perry tomes 1, 2 et 3 – John Scalzi (sur amazon, amazon, amazon)
    Une saga (en 5 ou 6 tomes) de SF sur la guerre et avec des extraterrestres. Ca parait être à lire, et ça l’est au début, avec pas mal d’idées déjà vues (sur la transmission de la conscience, sur le clonage, etc.). Mais très rapidement ça se dégrade, preuve encore une fois que parfois il faut finaliser ses histoires plus tôt. Je vous conseille de lire au moins le premier tome, et ensuite d’aviser.
  • Think like a data scientist – Brian Godsey (sur amazon)
    Un livre sur la data science, pour vous apprendre les bonnes pratiques et la méthodologie. Ca reste un livre de « haut niveau » : pas de détails ultra-techniques mais un panorama complet du métier. Si vous êtes curieux et que vous avez déjà un petit bagage technique je vous le conseille fortement.
  • Machine Learning for Absolute Beginners – Oliver Theobald (sur amazon)
    Comme le nom l’indique, mais avec du code quand même. Objectivement vous pouvez vous en passer.
  • Comprendre le Deep Learning: Une introduction aux réseaux de neurones – Jean-Claude Heudin (sur amazon)
    Celui-là par contre je le conseille, et je déplore le titre choisi, il y a bien plus que simplement une intro au deep learning dans ce livre qui est bien écrit et pédagogique.
  • Le Diable rebat les cartes – Ian Rankin (sur amazon)
    Rébus revient pour une vieille affaire, et il n’est pas content… Un bon Rankin, avec les protagonistes usuels, à lire si vous ne connaissez pas, à lire si vous connaissez ^^
  • Les Dérives de l’évaluation de la recherche. Du bon usage de la bibliométrie – Yves Gingras (sur amazon)
    Rien que le titre vous permet de savoir si vous devez lire ce bouquin, dans un cas c’est indispensable, dans l’autre passez votre chemin 😉

Voilà, les commentaires sont ouverts, et à dans un mois pour le book log des livres lus en Mai. Plus de lecture.

Quelques livres pour Noël

Et voilà, on y arrive, c’est bientôt la fin de l’année, avec tous les excès qui vont avec, et les cadeaux, les cadeaux, les cadeaux et aussi les cadeaux (est-ce que je vous l’ai dit ? j’aime bien les cadeaux, en faire comme en recevoir ^^).

Si jamais vous n’avez pas encore fait votre commande au vieux barbu, voici quelques idées cadeaux avec des livres que j’ai aimé ces derniers temps.

 

  • Peter F. Hamilton – Dragon déchu (lien amazon avec mon affil pour l’acheter)
    Peter Hamilton fait partie des grands noms du renouveau du space opéra. Ses centres d’intérêts : l’IA, la singularité, le transhumanisme font que le moindre de ses bouquins ressemble à la checklist de l’avenir vu par les fondateurs des GAFA et compagnie.
    Ici il nous raconte une histoire plus courte que d’habitude (1 tome) d’un soldat d’une corporation interplanétaire qui va faire une découverte qui va changer sa vie, la troisième raison va vous étonner… euh non je m’égare. Bref du space opéra sympa et sans prise de tête.
  • Plein d’auteurs – Sociologie d’internet (lien amazon avec mon affil pour l’acheter)
    Un excellent livre, sur… la sociologie d’internet. Interactions, sociabilités, médias, politique et économie, tous les aspects non techniques y passent. C’est super intéressant, c’est documenté, c’est à lire.
  • Jean-Paul Walch – Galilée (lien amazon avec mon affil pour l’acheter)
    Galilée, Copernic, la théorie héliocentrique, l’Eglise, tout ces protagonistes d’une révolution scientifique fondamentale, on ne les connait pas vraiment, et ce livre permet de découvrir une histoire dans l’Histoire. je ne vous cacherai pas que c’est un livre que la plupart de mes « suiveurs » trouveront aride, mais si vous avez un peu de courage et que la physique et l’histoire vous intéresse, ça vaut le coup de tenter le coup 😉
  • Umberto Eco – Chronique d’une société liquide (lien amazon avec mon affil pour l’acheter)
    On ne présente plus Umberto Eco. Avant sa mort il avait lui même fait la curation d’une partie de ses chroniques hebdomadaires. C’est un nouvel éclairage (pour nous Français) sur ses écrits, ne serait-ce que parce qu’ici il s’agit d’un travail d’éditorialiste, avec un ancrage plus fort dans la réalité. Après, vous verrez que quand on fait une chronique hebdomadaire on ne fait pas que du très bon, mais c’est à lire.
  • Evgeny Morozov – Pour tout résoudre cliquez ici (lien amazon avec mon affil pour l’acheter)
    La technologie n’est pas la solution aux problèmes de notre société, c’est en gros le point de vue de Morozov, et le livre est vraiment bien fait, avec en filigrane les deux notions de solutionnisme et de internet-centrisme. Après si vous isez l’anglais prenez la VO qui est bien mieux éditée que la VF, mais VO ou VF c’est un MUST MUST READ.
  • Luc de Brabandere – Homo Informatix (lien amazon avec mon affil pour l’acheter)
    On remonte le temps pour découvrir l’histoire de l’informatique au travers de portraits. le livre est intéressant car il est plus tourné « société » que « technique », pour le reste ça se laisse lire, mais cela ne sera sans doute pas votre lecture de l’année 😉

 

Voilà, si vous ne devez en prendre que deux : Hamilton et Morozov, sans hésiter. Bonnes fêtes, et n’abusez de rien tout en prenant de tout !

[Good Books] Quelques livres pour l’été (4/X)

C’est déjà l’été et pour certains vous êtes sans doute déjà en vacances… Mais même en retard, voici ma petite sélection de livres pour l’été, avec comme d’habitude de la réflexion avec deux essais, des devoirs de vacances avec deux livres techniques, et un peu de rêve et d’aventures avec deux romans.

Comme je suis bien à la bourre je vais être le plus concis possible…

Réfléchir

Pour commencer l’été, rien de tel qu’un peu de réflexion. En ce moment le sujet chaud c’est l’intelligence artificielle et le transhumanisme, alors voici deux livres sur ces sujets. Les deux sont assez courts, et présentent deux visions plutôt opposés concernant le futur.

Le premier que je vous propose est « Les robots font-ils l’amour ? Le transhumanisme en 12 questions » par Laurent Alexandre et Jean-Michel Besnier. Un titre un peu racoleur pour un sujet d’actualité, présenté au travers d’un livre-discussion entre deux auteurs pas toujours d’accord. Le lien amazon pour commander : http://amzn.to/2tMiSZA.
Le second livre est « Le mythe de la Singularité – Faut-il craindre l’intelligence artificielle ? » par Jean-Gabriel Ganascia. Le discours de l’auteur est vraiment très différent de ce que l’on a l’habitude de voir sur le sujet de l’IA et la singularité. En effet, pour lui ça n’est pas prêt d’arriver… Le lien amazon pour commander : http://amzn.to/2vgdbRD.

Apprendre

Pour ne pas oublier les fondamentaux, ou pour progresser techniquement, rien ne vaut quelques exercices d’algo avant l’apéro. Je vous propose donc un livre assez scolaire sur l’algorithmique : « Conception d’algorithmes: Principes et 150 exercices corrigés », que vous pouvez voir là : http://amzn.to/2vgabEM. C’est plutôt pour les débutants en code qui veulent comprendre les algos.

Autre livre technique de l’été : « Apprentissage machine: De la théorie à la pratique. Concepts fondamentaux en Machine Learning« . Celui-là est plus en phase avec les intérêts actuels du public et sans surprise il vous explique de manière plutôt accessible le machine learning 😉 (le lien : http://amzn.to/2tMieek).

Rêver et se divertir

J’ai bien évidemment plein d’idées au chapitre de la lecture pour se divertir, je pensais d’ailleurs vous aiguiller vers une de mes grandes passions : le monde de Lovecraft, et en particulier son enrichissement par ses nombreux « suiveurs » (on parlerais de nos jours de fan fiction^^). Mais au final, je préfère vous proposer un écrivain français bourré de talent (que j’ai eu la chance d’interviewer pour Krinein il y a maintenant looongtemps), et mon écrivain de SF favori (et malheureusement décédé il y a 4 ans).

Je commence donc par Matthieu Gaborit, écrivain français créateur d’univers, ses écrits valent le détour de par la poésie qu’ils contiennent, et des idées toujours un peu barrées que l’auteur présente. Pour l’été je vous conseille l’excellent « abyme » qui nous relate les aventures de Maspalio le farfadet (et vous pouvez bien sûr le commander via le lien http://amzn.to/2tPIOnf).

Enfin, si vous ne devez en lire qu’un, c’est du coté de Iain Banks qu’il faut se tourner. Banks est un auteur pour qui la SF c’est plus que des vaisseaux, des lasers et des boums boums. Il a un vrai message (généralement politique) qu’il fait passer au travers de ses histoires de space opéra toujours centrées autour du destin assez vain de quelques personnages. Sa civilisation galactique, la culture, est affranchie du travail, est gérée par des IA (les mentaux), on peut digitaliser son esprit, on y est immortel si on le souhaite (mais personne ne le souhaite réellement)… Bref, il y a tous les ingrédients de la SF grandiose, pour nous faire comprendre qu’il y a des questions qui sont/seront les mêmes pour tous.

De Banks, je vous propose directement ce qui est pour moi son livre le moins accessible : les enfers virtuels (sur amazon c’est là : http://amzn.to/2ttR9tm). Attention, ça parle beaucoup de torture, c’est pas toujours « facile » à lire.

Voilà, et surtout revenez me dire dans les commentaires si vous avez lu, et si ça vous a plu ou pas 😉

 

Construire une machine pour faire du deep learning

Il ne vous a sans doute pas échappé qu’en ce moment il y a une grande effervescence autour de « l’intelligence artificielle » dans le grand public, principalement car il y a une grande fébrilité autour du machine learning.

Cette fébrilité a des effets sur le marché de l’emploi (il est très difficile de recruter des profils machine learning/data en ce moment, et quand on a ce profil on est assailli par une surenchère d’offres de plus en plus hautes), et plus prosaïquement sur le prix du matériel qui permet de faire tourner les algos associés (oui, j’ai des actions NVIDIA ^^).

La grande mode est aux techniques de deep learning. Mon objectif dans ce billet n’est pas d’expliquer le deep learning (pour débuter lisez déjà wikipedia, puis ensuite le livre de Goodfellow, bengio et Courville qui est dispo gratuitement ou payant sur amazon), mais de vous parler des éléments techniques permettant de mettre en place des réseaux profonds.

Il y a naturellement de très nombreuses bibliothèques pour faire du deep learning (voir ici) qui ont presque tout le support CUDA, et c’est pour cela qu’il vous faut du GPU de chez NVIDIA pour vous amuser sans avoir besoin d’attendre des jours pour entrainer le moindre réseau. Pour le dire plus clairement, sans GPU pas la peine de vous y mettre.

Nous allons voir maintenant deux machines pour faire du deep learning (et aussi la plupart des tâches liées à des GPUs puissants). J’ai casé partout mon lien d’affiliation, mais soyez prudent, amazon n’est pas toujours l’endroit le moins cher !

La machine pas chère.

Si vous n’avez pas un budget illimité, notamment si vous voulez juste vous amuser un peu mais pas rivaliser dans les compétitions Kaggle, ou faire de la presta, ou si vous n’avez pas un projet ambitieux, une machine avec un GPU vous permettra d’apprendre en toute quiétude.

  • Il faut d’abord un GPU, ce sera pour cette machine une GTX 1070 (elles sont toutes là sur amazon avec mon lien d’affil) ou une GTX 1080 (ici)
  • Il vous faut un CPU et une carte mère avec de la RAM. Un i5-6600 est largement suffisant (240 euros ici), auquel vous collez un peu de RAM (16G pour 140 euros) et vous mettez le tout sur une carte mère du type de la Gigabyte GA-Z170XP-SLI (je ne sais pas si elle se vend encore, mais un truc du genre).
  • Pour le disque dur, sans moyens prenez du SATA en 1TB, ça vous coutera 50 euros (56 pour celui là).
  • Il ne manque enfin que le boitier, auquel il faut rajouter une alimentation puissante car un GPU ça consomme (je mets celle là, mais c’est sans doute overkill).

Au final, vous en avez pour un peu plus de 1000 euros, et je suis prêt à parier que vous pouvez vous en tirer pour beaucoup moins en récupérant un peu de matos chez vous.

La machine puissante.

Si vous avez des besoins en calcul très fort ou bien si vous avez un portefeuille bien rempli et que vous voulez vous amuser, je vous propose une config de ce type :

  • Pour le CPU, on part sur plus puissant avec un core i7 5930K. 6 coeurs et 3,5GHz, ça laisse de la marge sachant que le deep learning sur GPU utilise peu ou pas le CPU. A noter qu’a priori avec celui là vous avez 40 lanes PCIe, donc vous pouvez mettre jusque 4 GPUs. Il est là sur Amazon.
    Pour ventiler le CPU, un Noctua comme celui-là. N’oubliez pas la pâte thermique pour mettre entre les deux !
  • Pour la carte mère, il y a un choix pléthorique, l’Asus X99 fait le job.
    Elle est dispo ici.
  • Il faut de la RAM, mais en théorie pas beaucoup car il n’y en a pas besoin pour le calcul sur le GPU. Ceci étant, avec une machine pareille vous aurez peut-être envie de faire d’autres choses aussi, et dans ce cas 64 GB ça semble OK. De la RAM DDR4 est alors l’idéal. Il y en a sur Amazon.
  • Le nerf de la guerre pour faire du calcul sur des GPUs, c’est les GPUs. Un bon rapport prix/puissance, c’est les Titan X (architecture Pascal). Je vous propose de prendre deux GeForce GTX Titan X 12 GB (bon courage pour en trouver elles sont en rupture un peu partout). Si vous abandonnez votre recherche, prenez des GTX 1080 (dispo ici). Elles sont moins chères, prenez en plus ^^.
  • Il faut ensuite un boitier et une alim. N’oubliez pas que vous faites une machine qui va consommer comme jamais de l’électricité. Visez donc une alimentation entre 850 et 1500 W selon les GPUs que vous aurez mis dans la machine. Il y a du choix chez Corsair, mais aussi du bon matos chez EVGA en 850 W ou en 1000 W.
    Pour le boitier, tout est bon du moment qu’il est assez grand et ventilable. Moi j’aime bien le Corsair Air 540, mais au bureau notre plus gros boitier c’est une grosse bouse moche qui fait le job !
  • Enfin, il vous faut du disque. Si vous faites bien les choses vous avez déjà un NAS de grande capacité pas loin, donc il vous fait un disque rapide mais pas forcément énorme. Prenez donc un SSD de 1 TB, ça ira parfaitement. Un très bn choix sera par exemple un Samsung 850 EVO de 1 TB.

Si vous faites le calcul, la facture est lourde, en TTC cela fait entre 4000 et 4500 euros (entre 3300 et 3750 HT donc). Mais là vous aurez une puissance de feu vraiment importante, et à vous la joie du deep learning au niveau des champions !

N’hésitez pas à commenter, avec votre courtoisie habituelle bien sûr.

 

 

 

 

Du nouveau aux ix-labs

Ce billet assez court est en fait un message de service à destination de tous ceux qui suivent l’aventure des ix-labs. Il y a effectivement de la nouveauté puisque Guillaume rejoint totalement les ix-labs. Cela étonnera peut-être certains qui pensaient que Guillaume était déjà 100% aux ix-labs, mais ce n’était pas le cas puisqu’il avait aussi un certains nombre d’activités dans la société Nalrem Medias dont il est le boss.

En fait, puisque nous dévoilons tout ici, Nalrem Medias et les ix-labs vont fusionner pour devenir une seule entité (qui portera le nom des ix-labs). Ainsi nous aurons trois pôles d’activités :

  • Un pôle R&D qui comme son nom l’indique portera toutes nos activités R&D avec notamment de la prestation de recherche/innovation pour des tiers, ainsi que le développement, la maintenance et la commercialisation des outils (comme https://yourtext.guru/ et d’autres sur lesquels nous ne communiquons pas).
  • Un pôle formation qui porte les formations des frères Peyronnet « habituelles », les formations R, Python, data science et les lives.
  • Un pôle édition, qui vous vous en doutez, est centré sur l’exploitation de nos sites avec des monétisations via publicité, affiliation et publications de « textes » 😉

Voilà, vous savez tout, à bientôt pour de nouvelles aventures !

Quelques bonnes raisons de quitter le milieu académique

Voici un billet que j’aurai mis beaucoup de temps à proposer. Beaucoup de temps car je ne voulais pas écrire un tel billet trop rapidement après ma mise en disponibilité. En effet, le temps aurait éventuellement pu faire évoluer mon point de vue sur le milieu académique. Au final, ce n’est pas le cas. Je souhaitais également attendre que mon dernier thésard soutienne, principalement pour éviter qu’il n’entende des commentaires stressants pour lui sur son directeur de thèse.

Pour rappel, je suis en disponibilité depuis le 1er septembre 2014, après 2 ans comme Professeur des Universités à la fac de Caen, 5 ans comme MCF à l’Université Paris-Sud, 1 an de « postdoc » à l’X, 2 ans comme enseignant-chercheur à l’EPITA, 1 an comme ATER à Paris 7 et 3 ans de thèse à Paris-Sud.

Depuis mon départ en 2014, j’ai eu de nombreuses occasions de rencontrer d’anciens collègues. On me pose beaucoup de questions, et je vois bien qu’implicitement la seule cause admise pour le départ du milieu académique est financière. L’argent, grand fantasme : si on part c’est pour gagner plus ^^. En fait ça n’a pas été mon cas. C’est pour cela que j’écris ce billet, afin de présenter quelques bonnes raisons pour quitter le milieu académique, ces raisons assemblées m’ont poussé à partir. Et maintenant, même si je peux dire que du point de vue financier je suis sans doute gagnant, c’est plus un effet du gain de productivité qu’on peut avoir dans une structure plus souple que de la richesse supposée du milieu privé.

Enfin, je parle ici du milieu académique (principalement universitaire) mais certains des points que j’évoque sont directement transposables dans d’autres fonctions publiques (parfois même en pire, comme par exemple lorsque qu’en plus d’un appareil administratif fort on se retrouve avec les désirs d’un élu tout puissant).

Voici donc quelques bonnes raisons pour quitter le milieu académique, sans hiérarchie particulière :

  • Il n’y a plus de définition claire des missions de l’enseignant-chercheur
    C’est le point le plus évident, et sans doute celui sur lequel tout le monde est d’accord. Il est désormais quasiment impossible de définir clairement quelles sont les missions réelles de l’enseignant-chercheur : l’enseignement et la recherche, c’est très clair. Mais est-ce que gérer les emplois du temps et les salles fait partie de l’enseignement ? Est-ce que gérer les contrats des vacataires est une mission pour un responsable pédagogique (plutôt qu’une mission des RH) ? Est-ce que la recherche de contrat fait partie de la recherche ? Est-ce que la gestion des bureaux, des fournitures, des capsules à café, des périodiques à la bibliothèque, fait partie du job ? Bref, vous l’aurez compris on demande de plus en plus aux seuls personnels qu’on ne peut pas « dégraisser », pour faire des économies, sans doute au prix d’un futur bien noir pour la qualité de la science française.
  • La fonction support perturbe désormais les missions légitimes
    La fonction support, c’est l’ensemble des personnes qui sont en théorie là pour servir la mission en délestant les enseignants-chercheurs de ce qui n’est pas tout à fait leur métier, mais qui est nécessaire à ce métier. Dans la fonction support il y a donc les différents secrétariat (pédagogique, labo, etc.), les administrateurs systèmes, les techniciens, les RH, la compta, etc.
    Soyons clairs : de nos jours, dans la plupart des facs c’est la fonction support qui de fait dirige la boutique avec des contraintes de plus en plus ubuesques. Savez-vous par exemple que dans certains labos d’informatique on ne peut pas être root sur sa machine, et que l’administration système n’hésite pas à discuter les choix techniques des chercheurs ? Que certaines administrations exigent des documents en couleur en plusieurs exemplaires manuscrits identiques pour lancer des remboursements ?
    Plus récemment une responsable d’un bureau des thèses voulait m’expliquer ce qu’est un directeur de thèse, inutile de dire que l’explication a plutôt été dans l’autre sens, pour recadrer la personne…
  • L’administration toute puissante a perdu de vue les êtres humains
    C’est un corollaire direct du problème précédent : les personnels support amers et désabusés (à raison) appliquent les règles sans faire de sentiments, au risque de pénaliser tout le monde, de stresser les étudiants, etc. Par exemple, que penser d’une fac qui interdit à une personne d’apparaître comme encadrant officiel d’une thèse, car « il fallait demander avant monsieur », et ce même si cette personne a contribué à tous les articles du thésard et l’a encadré de très près ?
  • Le système est dysfonctionnel par nature
    La nouvelle mode de la fonction publique c’est l’objectivisation (= le bean counting), par exemple on comptant le nombre de publications, le nombre d’étudiants dans un diplôme, le nombre de jurys, de séminaires, etc. Cette objectivisation vient du fantasme de « on va faire comme dans le privé » (ce qui montre à quel point la fonction publique ne connait pas le secteur privé d’ailleurs).
    Le problème de cette objectivisation, au delà de sa bêtise intrinsèque, est qu’une mesure de performance sans punition ni récompense possibles ne sert à rien d’autre qu’à créer du stress et de l’humiliation (car le seul moyen de punir est de mettre les personnes moins performantes au pilori en public).
  • Le manque de moyens récurrents
    Pas grand chose à dire là dessus, il n’y a plus d’argent pour les choses importantes comme par exemple les voyages en conférences (il n’est pas rare d’être de sa poche dans les facs « de province »), ou le matériel (sans contrats de recherche difficile d’avoir une machine de bureau ou un ordinateur portable performant à certains endroits).
  • Les surcoûts : un gaspillage permanent
    Mais en parallèle de ce manque de moyens, il y a un gaspillage permanent. Ce gaspillage est dû aux rackets de certains fournisseurs qui profitent des règles des marchés pour vendre plus cher des choses qu’on pourrait avoir moins cher ailleurs (très visible sur le matériel informatique par exemple). Mais la plus grosse source de gaspillage est sur les aspects humains : une réunion d’une heure avec 10 personnes de niveau MCF moyen, ça coûte quasiment 300 euros. Combien d’heures passez-vous dans des réunions inutiles ? Vous pouvez faire le calcul de l’argent perdu POUR la société facilement…

En plus de ces raisons avec lesquelles quelqu’un de très motivé peut sans doute composer, il y  des points beaucoup plus graves.

  • Les petits chefs
    Plus le système se dégrade plus certaines personnes vont essayer d’avoir des places de « pouvoir » (pour ce que ça vaut dans le milieu académique, où en fait il n’y a pas de vrai pouvoir) pour avoir la main sur les ressources ou être plus tranquilles. Une fois ces personnes en place, elles vont être au choix tyranniques, ou magouiller dur, ou faire payer à d’autres des offenses souvent imaginaires. Bien évidemment il n’y a pas que des petits chefs, mais soyons francs il y en a, chez les collègues, mais aussi dans le personnel administratif, ce qui entraine des souffrances au travail qui ont parfois des effets dramatiques sur les personnes.
  • Le manque de vision cohérente
    Aujourd’hui, il est très rare de rencontrer des visionnaires parmi les scientifiques. En effet, le bean couting favorise plutôt les aspects techniques, le micro-management et la recherche incrémentale, et donc les personnes avec une vision se taisent ou partent. Au niveau des directions de laboratoires les chefs vont se placer en gestionnaire d’une mosaïque de sujets, certains importants d’autres complètement has-been, mais personne n’aura le courage de « forcer » une vision cohérente sur le long terme. On attend toujours l’émergence d’une génération de chercheurs charismatiques que les autres suivront aveuglément, pour l’amélioration de la société (que ça marche ou pas c’est un autre sujet).
  • La pauvreté intellectuelle
    Histoire de continuer à ne pas me faire d’ami, je pose une question simple : vous qui êtes enseignant-chercheur et qui me lisez, combien avez vous lu de livres de pédagogie ? de livres sur la société, et sur sa relation à la technologie et la science ? sur les usages sociologiques de votre discipline ? sur l’éthique ? ou même plus simplement sur les autres sciences ? Il y a de moins en moins de réflexivité et de curiosité intellectuelle dans les facs, et ça va finir par se voir et avoir un impact.

    • La résignation
      Mon dernier point, celui qui m’a littéralement fait fuir : l’acceptation de la proximité de la mort du milieu académique français. Il est pour moi inacceptable d’accompagner un système à sa mort en croyant que c’est le seul moyen de le sauver (combien pensent que faire de l’admin « c’est normal » et que les choses vont s’arranger un jour ?).

Voilà donc une liste bien noire et que j’assume pleinement. Mais est-ce que tout cela est l’apanage de l’ESR, voire de la fonction publique ? Pour certains points oui, mais pour d’autres clairement non. La différence, c’est que les coûts indus sont ici supportés par la société, c’est-à-dire nous, la collectivité. Alors que dans le privé ce n’est pas le cas.

En revanche dans le public comme dans le privé, les travailleurs sont libres d’aller voir ailleurs, mais ce n’est pas toujours si facile que ça, loin de là, et même pour certains postes/métiers c’est en réalité impossible (il y a par exemple des postes dans la fonction publique qui n’existent nul part ailleurs, ce qui est d’ailleurs édifiant en tant que tel). Cela demande aussi un certain courage, voire une certaine absence de conscience du risque. Mais bon, quand on aura 90 ans et qu’on se retournera sur sa vie, qu’est ce qu’on veut voir ? Moi j’ai choisi.

Au final, pourquoi est-ce que je suis parti ? pour tout ça, mais surtout pour les 4 derniers points. Tous les autres sont pénibles et déprimants mais supportables si les gens travaillent ensemble « for the greater good ».

Voilà, vous êtes maintenant libres de commenter abondamment, dans la courtoisie de préférence.