Category “Non classé”

[Good Books] Quelques livres pour finir l’été (3/X)

Alors que le mois d’août est largement entamé, nous sommes très clairement dans le dur des vacances. Et quoi de mieux pendant les vacances que de bouquiner tranquillement, pour affûter son esprit avant la rentrée 😉

Voici donc quelques livres avec un court commentaire, que je vous conseille pour l’été, mais aussi pour la rentrée. Comme d’habitude, les liens amènent vers Amazon, via mon tag d’affiliation (transparence transparence…).

Trois livres non techniques, sur des sujets divers

Les vacances, c’est le moment de se couper de la réalité du boulot en lisant des livres pour s’ouvrir l’esprit. Je commence donc par vous conseiller quelques essais non techniques.

En premier, un livre parlant d’économie : Ce que l’argent ne saurait acheter : Les limites morales du marché, par Michael Sandel. Comme le titre l’indique, le livre porte sur les limites de la marchandisation totale, et sous-tend l’hypothèse que donner une valeur monétaire à certains biens/actions dégrade leur valeur non monétaire. L’auteur soutient son discours avec de nombreux exemples, certains édifiants, d’autres moins percutants (d’autant que la France n’a pas les mêmes idéaux moraux que les USA). Le livre reste intéressant, même si l’analyse est parfois un peu courte, et parfois également très imprégné de la propre morale de l’auteur. A lire cependant.

En deuxième, L’utilité de l’inutile, par Nuccio Ordine. La thèse de l’auteur est simple : il est faux que seul ce qui est source de profit est utile. Une fois qu’on a compris que c’est de ça qu’il s’agit, on se laisse guider dans un texte très érudit, plein de références et agréable à lire. Ce n’est pas de la « rocket philosophy », mais pour l’été c’est parfait.

En troisième, un livre plus près de nos préoccupations habituelles : The Black Box Society, les algorithmes secrets qui contrôlent l’économie et l’information Broché, par Frank Pasquale. Frank Pasquale est professeur de droit aux USA, spécialisé dans les questions éthiques liées aux technologies de l’information. Le livre fera peur au grand public, et ne surprendra qu’à moitié les personnes « du métier » : les grandes sociétés, main dans la main avec les pouvoirs publics, utilisent des algorithmes discriminants à longueur de temps, sans les divulguer, en se basant sur des données qui sont récoltées à très grandes échelles (et partagées entre « ceux qui savent »). Les gouvernements se font bananer à longueur de temps par « ceux qui savent » car les élus n’y comprennent rien. bref, business as usual. Le livre est très bien sur son aspect « catalogue », même si vous êtes dans l’informatique, mais sans être dans les « data trucs », vous découvrirez des choses (par exemple, je parie que vous ne savez pas ce qu’est un « fusion center »). Par contre, quand l’auteur aborde les possibles solutions, on retourne au pays des bisounours, ce qui montre que l’auteur est assez loin de la technique. Une lecture très agréable en tout cas.

Deux livres techniques, pour apprendre

C’est pendant l’été qu’on a le temps de se mettre à niveau sur des nouveautés, et c’est pour cela que je vous propose les deux livres suivants.

Le premier : Automate the Boring Stuff with Python, par Albert Sweigart. Je vais faire assez court : après une quasi-moitié du livre passée à apprendre Python (et c’est utile !), vous découvrirez comment faire du scrapping, comment travailler sur des fichier xls, pdf et json, comment faire du traitement d’images, comment manipuler souris et clavier pour automatiser des tâches, etc.

Le deuxième : Data Science from Scratch, par Joel Grus. Pas grand chose non plus à dire, il s’agit d’un livre qui part du principe que vous avez des bases en python, et qui déroule les bases de la data science à partir de là. Il y a des liens vers le code (via github) et les explications sont toujours très claires et pédagogiques. Seul bémol : le code est en python 2.6, alors que le standard est maintenant python 3.

Voilà, vous avez maintenant de quoi vous occuper sur la plage, à bientôt !

YourTextGuru : j’ai la patate !

Après quelques mois de mise en production de la version beta de YourTextGuru, nous avons mis en action aujourd’hui quelques correctifs de qualité pour produire de meilleurs guides, et surtout, nous avons activé notre nouvelle fonctionnalité, nom de code PATATE.

Vous êtes à l’heure actuelle un peu plus de 500 à utiliser plus ou moins fortement YourTextGuru, et pour certains c’est l’utilisation des guides qui est problématique. C’est le cas de certains rédacteurs déjà très rapides, qui trouvent qu’un guide est trop contraignant, avec certes quelques mots très importants, mais aussi des suggestions de mots « pour faire naturel » que ces rédacteurs ne vont pas utiliser car ils font déjà « du naturel ». C’est également le cas de certains SEOs, qui veulent aller plus loin dans l’optimisation, quitte à chatouiller les limites du moteur, et qui voudraient donc plus de mots importants.

Si vous êtes dans ces cas là, nous vous avons écouté, et nous avons rajouté la possibilité de demander la « patate » d’une requête. Cela se fait toujours dans la même interface, sauf qu’au lieu de demander des guides, vous allez cocher la case « je veux la patate », et vous l’aurez, pour 5 jetons.

Chaque requête n’a qu’une patate : si vous demandez 234 guides, ils seront tous différent, mais il n’existe qu’une seule patate par requête, et pour cause puisque la patate c’est L’INTEGRALITE des mots les plus importants du cluster sémantique de la requête que le moteur construit pour proposer ses SERPs. Je dis les mots, mais bien sûr nous proposons les mots importants, et les entités nommées également.

Vous vous demandez encore ce qu’est vraiment la patate ? C’est bien normal, et comme des exemples concrets valent mieux que mes discours ronflants, voici quelques exemples de requête, avec la patate associée :

Voilà, je vous laisse vous faire votre idée. Après, comment utiliser cette patate ? Elle vous donne les mots les plus importants, indépendamment de leur ventilation statistique naturelle, c’est donc à vous de faire vos arbitrages (qui sont faits automatiquement dans les guides), quitte à prendre des risques avec le Grand Google…

Pour tester et commander des belles patates, c’est sur YourTextGuru que ça se passe, et pour commenter c’est ici, dans la joie et la bonne humeur bien sûr.

[Good books] Programmation efficace : des algos, du python (2/X)

128Aujourd’hui je vais vous parler d’un livre intitulé « Programmation Efficace –  Les 128 Algorithmes Qu’Il Faut Avoir Compris et Codés en Python au Cours de sa Vie ». Les auteurs sont Christoph Dürr et Jill-Jênn Vie. Comme d’habitude, je vous colle le lien amazon : c’est ici pour acheter.

Pour faire un full disclosure, il faut que je vous raconte encore une fois un bout de ma vie (heureusement que j’écris sur un blog). Je suis rarement impressionné par des algorithmiciens. Souvent ils sont bons théoriquement mais ils sont à coté de la plaque sur la réalité et l’efficacité (ils manquent de pragmatisme). D’autres sont au contraire trop dans la pratique et font donc des algos mauvais car ils ne connaissent pas la théorie.

Christoph, dont j’ai partagé le bureau au tout début de ma thèse dans l’équipe de recherche en algorithmique de la fac d’Orsay, est à la confluence des deux approches (théorique et pratique). Il fait donc partie des rares personne capable de résoudre réellement des problèmes à l’aide d’algos bien conçus.
Quand j’ai vu qu’il sortait ce livre, je me suis jeté dessus.

Il ne s’agit pas d’un livre pour apprendre l’algorithmique, pour cela je vous envoie vers le Cormen, référence du genre (Algorithmique – 3ème édition – Cours avec 957 exercices et 158 problèmes), mais plutôt d’un livre pour comprendre comment on résout des problèmes à l’aide d’algorithmes. Je n’ai pas peur de dire que c’est le meilleur livre que j’ai lu sur le sujet.

Il est structuré de manière très simple : après la traditionnelle introduction chaque chapitre va se consacrer à un sujet spécifique (les chaînes de caractères, les arbres, les flots, l’exploration, etc.). Au sein d’un chapitre, on passe en mode « résolution de problème » : explication d’un problème, définitions utiles, commentaires divers, et enfin code complet en python.

C’est ce qui fait la force de ce livre : il explique de manière simple et accessible comment on résout réellement chaque problème évoqué.
Par exemple, une section du chapitre 3 porte sur le calcul de la distance de Levenshtein entre deux chaînes de caractères. C’est l’approche de programmation dynamique qui est mise en avant, avec un exemple permettant de bien comprendre, et le code (10 lignes) qui implémente l’algo.
Plus loin (chapitre 13), on trouve une section sur comment trouver le plus grand rectangle sous un histogramme. Inutile ? Non, car l’algorithme qui réalise le calcul peut s’appliquer directement en télécommunications par exemple, de la mème manière que dans le dernier chapitre, les auteurs introduisent l’algo des liens dansants, qui vous permettra de résoudre automatiquement le sudoku, les chiffres et les lettres, etc.

Bref, un excellent livre que doit avoir toute personne qui développe et qui voit au delà de la programmation de cochon ^^ Ce n’est pas un livre de chevet, qu’on va lire d’un bout à l’autre et ranger, c’est un livre dont chaque page doit se lire, se relire, se travailler. C’est un livre qui fera de vous un meilleur développeur.

Voilà, comme d’habitude, les commentaires sont ouverts, dans la joie et la bonne humeur.

A noter : si vous savez faire tout ce qu’il y a dans le livre, vous savez répondre à toutes les questions des entretiens d’entrée dans les boites tech de la silicon valley (en ce qui concerne les algos ;)).

 

Que vendez-vous ? Réflexions autour des prix…

Je profite de cette journée de Mai, donc sans grande action au niveau du travail, pour écrire ce billet que j’ai en mode brouillon depuis longtemps. Le sujet du jour sera donc la vente, mais pas du point de vue techniques de vente.

C’est largement inspiré par de très nombreuses discussions avec les confrères que j’ai eu l’idée de ce billet. Pour tout vous dire, l’élément déclencheur a été une discussion qui s’est reproduit plusieurs fois avec plusieurs personnes différentes et qui visaient toutes à répondre à la question : « je suis blindé de boulot, mais je ne gagne pas bien ma vie, Sylvain qu’est-ce que tu en penses ? ». La réponse canonique que font tous les vieux briscards (et que j’ai fait conjointement à Laurent Bourrelly à un plus jeune que nous à VEM7) est « il faut augmenter tes tarifs ». Partant de là, j’ai réfléchi et je vous présente aujourd’hui le fruit de ma réflexion, car je pense qu’il faut aller au delà de la simple augmentation de prix et plutôt réfléchir à ce que l’on vend.

Avant de penser au marketing, il faut penser à faire le commercial, et pour aller au delà du diptyque synchronisation – théorie de l’engagement, je vous propose de réfléchir à une analyse en amont du type de besoin client auquel vous répondez. Selon le type de besoin, vous ne vendez pas la même chose, et sans vous en rendre compte vous êtes en train de manipuler un levier pour choisir vos clients et gagner plus.

Selon moi, voici les trois types de choses que vous pouvez vendre (quand vous êtes dans le même type de métier que moi, qui mêle informatique, conseil, formation, etc.).

  • Vendre du TEMPS

Le schéma le plus standard, qui vient du milieu du conseil, est de vendre son temps. Pas mal de SEOs font ça, les formateurs en présence aussi, les agences aussi, etc. Le problème de la vente de temps est qu’on peut devenir assez rapidement esclave de son travail et qu’on n’a plus le temps de se former, de faire de la R&D et qu’on va donc vers l’épuisement.

Par ailleurs, il n’y a qu’un seul levier pour choisir ses clients et gagner plus : augmenter son tarif journalier. Le choix des clients ne sera alors pas par rapport aux missions, mais juste par rapport au budget, et l’augmentation du tarif journalier n’est pas sans limite. Si on prend l’exemple des meilleurs SEOs, le niveau haut se situe plutôt autour d’un TJM de 1000 euros, il y a donc une vraie barrière pour qui veut de très gros revenus. Lors de mon passage dans des métiers plus rémunérateurs (du conseil RH/technique), le record que j’ai vu pour un cador absolu de son domaine, c’était 3000 euros par jour, une somme très substantielle, mais très loin de ce que gagne les grands capitaines d’industrie.

  • Vendre des PRODUITS

Vendre des produits, c’est le schéma du commerce « normal », mais dans nos domaines « virtuels », c’est le moyen de se créer des revenus récurrents à forte marge. Dans le domaine des SEOs, c’est là qu’on trouve la vente d’ebooks, ou encore plein d’outils (par exemple, YourTextGuru rentre dans ce schéma).

Bien sûr, le résultat dépend du volume, et on rentre là dans des problématiques plus proche du marketing que de la vente, car vendre en one to one des produits à quelques euros est un no brainer. Mais si on fait abstraction de cela, on a maintenant plusieurs leviers : le prix des produits, le niveau de technicité, et même tout simplement le service que fournit le produit.

Parfois, catégoriser n’est pas facile : est-ce qu’une formation est un produit ou une vente de temps à un prix variable car dépendant du nombre de formés ? Dans le cas des formations dites « des frères Peyronnet » c’est de la vente de temps car le produit ne peut pas être instancier par d’autres formateurs, mais dans le cas d’une formation SEO générique, on est plus sur la vente d’un produit.

La limite de gain va dépendre de la surface de marché et de la capacité qu’on va avoir à s’adresser à ce marché. Par exemple, un produit pour SEOs freelance en France a un potentiel de clientèle autour de 1000 personnes environ, si c’est un produit pour agences c’est moins, si c’est pour tous les webmasters dans toutes les langues alors the sky is the limit^^

  • Vendre de la VALEUR

Vendre de la valeur c’est le modèle économique derrière les ix-labs, qu’on a poussé à son paroxysme. La valeur, c’est ce qu’on va gagner grâce à ce qu’on achète moins ce que nous coûte la chose en question. Attention, je ne parle pas de vendre PAR la valeur, qui est en fait mettre en avant la valeur d’utilité d’un produit lors d’une opération commerciale ou marketing, mais bien de vendre directement cette valeur.

Nuance ? oui et non, c’est bien plus que ça. Quand on vend de la valeur on vend la promesse que la prestation associée va être une certaine forme de game changer pour le client. Vendre de la valeur c’est donc typiquement ce que l’on vend quand on est un labo de R&D, car l’innovation est un levier de croissance très fort pour le client.

Comment pricer cette valeur ? c’est là que les choses deviennent complexes, et pour moi il n’y a que deux possibilités, qui ne s’excluent pas mutuellement (on peut faire un mix des deux).

La première possibilité est le forfait : on est payé pour réfléchir à comment créer de la valeur chez le client, ça marche ou pas (bon, si ça marche jamais on ne gardera pas longtemps les client). Vous noterez que c’est le modèle que l’état utilise majoritairement pour le fonctionnement de la recherche publique : les chercheurs sont payés de manière forfaitaire. A ce propos, le financement par projet va a l’encontre de la notion de vente de valeur, et n’a sans doute aucun sens et aucun avenir à cause de cela.

La deuxième possibilité pour mettre un prix sur le potentiel de valeur est de gommer le risque du client en faisant du revshare (partage de revenu) ou un mécanisme de licence. Concrètement vous ne facturez pas votre temps de réflexion/conception, mais vous touchez un pourcentage (substantielle) de la valeur réellement créée par votre travail. C’est un mécanisme apprécié par les plus petites structures qui ne peuvent pas risquer leur petite capitalisation, qu’on retrouve également lorsque plusieurs personnes s’associent pour faire de la co-création.

Si vous le pouvez, d’un point de vue métier et d’un point de vue risque, c’est dans la vente de valeur, avec un mix petit forfait – gros revshare, que vous pourrez avoir VOTRE game changer, pensez-y 😉

Voilà, j’ai fait le tour de ma (petite réflexion), et vous, que vendez-vous ? N’hésitez pas à me le dire dans les commentaires.

 

YourTextGuru, c’est fait pour vous

yourtextguruAujourd’hui, je fais le commercial de choc, pour vous présenter notre nouvel outil, disponible en mode SAAS (Software As A Service) : YourTextGuru.

TL;DR : YourTextGuru est un outil d’aide à la rédaction, qui vous fournit des guides de rédaction pour coller à un besoin informationnel que vous donnez sous la forme d’une requête (=phrase raisonnablement longue et raisonnablement courte). Il est disponible à l’adresse https://yourtext.guru, il est efficace, il donne des résultats de qualité et il est à un prix défiant toute concurrence.

La version plus longue et romancée commence naturellement par une belle histoire et une belle rencontre 😉 Après nos formations, et après un live des ix-labs par Guillaume (mon frère pour ceux du dernier rang qui ne suivent pas) sur la notion de corpus sémantique, nous avons eu l’occasion de discuter avec Benoit et Frédérick, qui avaient dans l’idée de faire un outil. J’avoue que ma mémoire est vacillante et donc je ne sais plus trop si les choses se sont cristallisés à Lyon pendant le teknseo ou à Genève pendant le seocamp day (devenu cette année performance web), mais c’était autour de ce moment là, il y a donc environ 1 an.

Très rapidement, nous nous sommes rendu compte que la notion même de corpus était d’une certaine manière dangereuse, en plus d’être difficile à utiliser : quels mots utiliser ? y a t-il danger de suroptimisation ? Bref, pas facile et souvent en plus la réalisation du corpus en lui même était assez coûteuse.

C’est pour cela que nous avons mis en place un système comprenant un modèle génératif de la langue afférente à votre besoin informationnel. Oulala ça à l’air compliqué ? Pas du tout:

  • Un besoin informationnel, c’est ce que vous voulez mettre dans le texte que vous allez rédiger. Votre besoin est d’écrire un texte sur « comment gagner à tous les coups au poker texas hold’hem » ? Et bien votre besoin informationnel c’est un dérivé directe, du type « comment gagner au poker texas hold’hem à chaque fois » ou « comment gagner au poker texas hold’hem facilement » ou «  »comment gagner au poker texas hold’hem ». Si vous êtes SEO (oui, je sais qu’il y en a dans mes lecteurs), vous vous demandez pourquoi pas la requête « poker texas hold’hem » et sur quoi le moteur va mettre un texte fait avec le besoin informationnel précédent ? La réponse est sur toute les requêtes proches car le moteur fait de la reformulation de requête, donc de toute façon les requêtes que vous travaillez pour Google ne sont pas toujours celles qui sont utilisées par le moteur au final.
  • Un modèle génératif. Quand vous rédiger un texte sur un sujet, puis un deuxième, les deux ne contiennent pas QUE les mêmes mots, les deux n’ont pas le même langage interne. Le modèle génératif capture cette diversité et la restitue : si vous générez 23 guides sur un même besoin informationnel, alors vous pourrez rédigez 23 textes qui seront naturels, qui seront en phase avec le sujet, et qui ne seront pas en duplication !

Vous voyez, au final ce n’est pas très compliqué 😉

Au final, on génère donc au moins un guide pour faire un texte, et on gagne du temps car on découvre ce qu’on doit mettre dans le texte sans trop réfléchir, et rapidement en plus. Cerise sur le gâteau, tout ça est dispo pour un prix modique (avec le premier pack 60 centimes le guide, mais vous pouvez faire baisser ce prix assez vite).

Une fois le guide en main, vous verrez donc que c’est très normé, avec des choses du type (pour la requête « vidange voiture soi-meme comment »)

TITRE : vidange voiture soi-meme comment (je mets le guide en italique)

Est-ce qu’il est difficile de faire la vidange de sa voiture soi-même ?

CHAPO : vidange voiture soi-meme comment + retirez bouchon + bidon huile + carnet entretien

Comment réaliser soi-même la vidange de sa voiture : Le TL;DR c’est de regarder dans le carnet d’entretien où se trouve le bouchon, de le retirer et de remplir avec un bidon d’huile !
SOUS-TITRE :  vidange + niveau huile + entretien voiture

La vidange, c’est un des points cruciaux de l’entretien de sa voiture, et ça commence par vérifier le niveau d’huile, mais pas que…
PARAGRAPHE
 carter cle + lubrifier joint + lubrification moteur
 maximum + boite + astuces

Le carter d’huile est l’un des points clés du moteur, en effet c’est là que commence le circuit de lubrification du moteur, qui vous ne le savez peut-être pas lubrifie aussi les joints, pour éviter l’asséchement et donc la fuite.

Aujourd’hui, nous allons voir comment faire une vidange, et nous allons vous donner un maximum d’astuces, comme par exemple utiliser une vieille boîte de conserve « familiale » pour récupérer l’huile usagée sous la voiture 😉

J’imagine que vous avez compris le principe, et il est maintenant temps pour vous de poursuivre vous-même la route de la découverte. Pour tester l’outil, et profiter en plus des 3 jetons de génération offerts pour le lancement, c’est par là : https://yourtext.guru

Comme d’habitude, les commentaires sont ouverts, dans la joie, la bonne humeur et la courtoisie 😉

Trois livres intéressants

Parmi tous les livres que j’ai lu récemment, je vais vous parler plus particulièrement de trois d’entre eux, qui pour moi partagent une volonté commune, même si l’un est nettement au dessus des autres. Comme d’habitude, je suis franc avec vous : les liens sont taggés avec mon affiliation amazon 😉

Ces trois livre ont une chose en commun : ils nous font vivre l’innovation via la vie de ceux qui la guide. Au programme, le livre de William Réjault sur Melty, celui de Jean-Baptiste Rudelle sur Criteo, et enfin le topissime livre de Walter Isaacson sur la « révolution numérique ».

 

Il était une fois… Melty par William Réjault

Premier de ma liste du jour, et celui sur lequel je suis le plus mitigé. Ce livre n’est pas une biographie, ni une analyse de l’aventure Melty, ni une analyse de la stratégie de la boite, ni… Il s’agit d’un livre d’entretiens, et je mets bien un « s » car il y a des entretiens entre Alexandre Malsch et l’auteur, mais aussi entre ce dernier et d’autres acteurs de la vie présente et passée de Melty.

Ne vous y trompez pas, le livre est intéressant, on y découvre un peu le cheminement de Melty dans ses premières années, mais j’ai été déçu par la qualité rédactionnelle globale. Les questions ne sont pas toujours à la hauteur, et les réponses auraient mérité d’être retravaillées. Par ailleurs, même si les états d’âme d’Alexandre Malsch sont mis en évidence, et si ce dernier est plutôt transparent, le choix des questions place le bouquin dans le domaine des hagiographies, on est loin de la grande objectivité.

Ceci étant, même si j’ai pas mal hésité je conseille la lecture de ce livre, car les réponses d’Alexandre Malsch restent intéressantes, et le point de vue d’autres personnes impliquées à certains moments de la vie de Melty est édifiant.

 

On m’avait dit que c’était impossible: Le manifeste du fondateur de Criteo par Jean-Baptiste Rudelle.

Sur ce deuxième livre, effet inverse. Je l’ai acheté par hasard au détour de la tête de gondole de mon libraire habituel (l’Armitière à Rouen), mais sans grand espoir d’une bonne lecture. Et ce fut totalement l’inverse, j’ai trouvé le livre vraiment passionnant. JB Rudelle se montre sous un jour que je n’imaginais pas : il a une vrai réflexion qui va au delà de Criteo, et il tient un discours à la fois sincère, optimiste mais aussi très réaliste. Toute personne qui monte une boite, startup ou pas, devrait lire ce livre, ce qui n’est pas nécessairement le cas du précédent (qui est plus pour le grand public).

Bref, je conseille ce livre, dont le seul point faible est le titre, qui à mon avis n’a pas été choisi par l’auteur vu comment est écrit le reste.

 

Les innovateurs par Walter Isaacson.

Avec ce livre, on passe très clairement dans la gamme supérieure. Vous connaissez sans doute Walter Isaacson, qui est l’auteur de la biographie de Steve Jobs. Le livre est un vrai panorama des pionniers de la révolution numérique. On commence par les « anciens », depuis Ada Lovelave, Turing et cie… Puis ensuite on découvre la genèse des ordinateurs, des interfaces utilisateurs, etc. Le livre finit bien sûr par évoquer le web et les grosses entreprises du secteur, celles qui nous font travailler indirectement lorsque l’on bosse dans le web.

Là où les deux autres livres de ce billet sont des témoignages plus ou moins direct, ici on rentre vraiment dans l’histoire. L’auteur essaye d’être le plus objectif possible (les chapitres sur la paternité du transistor et de l’ordinateur sont à ce titre des modèles du genre), et ses recherches sont vraiment extrêmement documentées, et la seule bibliographie vaut à elle seule l’achat du livre.

Je vous recommande donc très chaudement ce dernier livre, qui est pour moins un incontournable.

 

Voilà, c’est fini pour aujourd’hui, bonne lecture !

Amusement permanent et sens de la vie

C’est après avoir lu les billets de Victor, Laurent et Bertrand que j’ai eu à mon tour envie d’écrire sur le sens de mon travail, sur la perception des autres et sur le plaisir que j’ai à faire ce que je fais au jour le jour. En plus, la période de Noël est généralement assez propice à cela.

Ce n’est pas un secret, j’ai un parcours très différent des trois cocos mentionnés au début de ce billet. J’ai fait des études longues, pas tant parce que c’était mon plan à l’origine, mais parce que j’ai bossé pendant tous les week-ends comme poissonnier, ce qui m’a motivé à étudier pour trouver un travail que je serais susceptible de ne jamais regretter. Après ma thèse, je suis donc devenu enseignant-chercheur (tout en faisant des « ménages » en tant que consultant à coté). J’ai découvert le SEO en 2003/2004, en dilettante et principalement parce qu’avec Guillaume on gérait le site krinein. En tant qu’enseignant-chercheur, j’ai choisi un de ces métiers qui sont, en théorie au moins, utiles à la société. Dans la quête de sens que certains mettent en avant (comme Victor) par exemple, ce genre de job est en haut de la liste, avec la satisfaction double de faire avancer la science, et de former les jeunes.

Pourtant, au fur et à mesure des années, j’ai été de moins en moins heureux dans le milieu académique et j’ai choisi d’en partir (au moins provisoirement) en 2014. En même temps, le milieu SEO (et plus globalement le milieu du web), qui est moins porteur de sens d’une certaine manière, est beaucoup plus satisfaisant. Pourquoi ? parce qu’il y a une composante très importante : l’amusement au travail. Le milieu académique a perdu le « fun », les contraintes administratives et financières rendent les journées bien longues et bien loin du diptyque science & enseignement. A contrario, dans le SEO/web tout est amusant, on passe son temps à jouer avec des gros jouets : Google et le web, et c’est fun.

Actuellement, je m’occupe des ix-labs, et de mon point de vue j’ai le meilleur des deux mondes. Je fais de la recherche et je contribue donc toujours à l’avancée de la science (même si les applications sont plus importantes pour moi qu’auparavant), et en plus cette recherche c’est moi qui en choisit les objectifs, et je n’ai pas à quémander des moyens à des institutions totalement déconnectées des priorités de recherche, mais aussi des priorités de la société civile, des entreprises, etc. Par ailleurs, j’ai toujours une activité de formation, de dissémination, de vulgarisation, et de conseil. Bref, c’est le fun et le sens à tous les étages !

Voilà en vrac quelques uns de mes (petites) réflexions sur tout cela :

  • Il faut être égoïste d’abord pour s’épanouir dans son travail. 
    Avant de chercher à être utile à la société ou à son entreprise, il faut trouver une satisfaction personnelle qui va pousser à continuer dans son travail. Pour moi, c’est le challenge de la nouveauté : trouver des solutions (algorithmiques généralement) à des problèmes divers, apprendre et voir des nouvelles choses, etc. Pour d’autres cela sera peut-être un tout autre objectif qui sera important comme voyager beaucoup, être au grand air, etc. Mais dans tous les cas il faut trouver le « fun » au travail.
  • On ne peut pas plaire à tout le monde.
    Vous aurez toujours des gens qui ne vous aiment pas, quelle que soit la raison qui les poussent à cela. Dans le milieu de la recherche certains collègues m’ont accusé de vénalité, d’être trop près de l’industrie, de faire du clientélisme (car les étudiants étaient plutôt positifs concernant mes cours). Ailleurs on m’a reproché d’être chercheur, et donc d’être quelqu’un incapable de faire quelque chose d’applicable. Dans tous les domaines, toutes les communautés (pareil chez les SEOs, les datascientists, etc.) il y aura toujours une poignée de personnes qui ne vous aimeront pas, ne vous en préoccupez pas.
  • « J’aime mieux avoir des remords que des regrets. » Oscar Wilde
    Ne vous limitez pas vous-même. Si votre situation ne vous convient pas, agissez pour qu’elle change. Ce sera peut-être long et difficile, ça sera peut-être un échec, mais vivre tristement toute sa vie n’est sans doute pas la meilleure des choses.
  • Donnez vous les moyens de vos ambitions.
    Je suis en phase avec Laurent : « c’est le plus acharné qui gagne » et « t’iras te chercher le respect ». Votre « devoir » vis à vis de vous-même est une obligation de moyens. Il faut bosser, il faut rebosser, et il faut rerebosser. Après, si un projet foire alors que vous avez bosser dur, et bien bosser, et bien c’est la vie, et c’est pas grave, ni pour vous, ni vis à vis des autres.
  • C’est vous qui décidez du sens de votre vie, pas les autres.
    Dans son billet, Victor dit « Ma vie est dénuée de sens car mon job ne fait tout simplement pas progresser la société et les gens qui m’entourent« . C’est une manière particulière de donner du sens à sa vie, mais elle est loin d’être unique. C’est à chacun d’avoir sa propre quête de sens, d’autant plus la notion même de progrès de la société est loin d’être claire, et est souvent propre à chacun.

Voilà, j’en ai fini avec mon billet approuvé par l’institut des philosophes et psychologues de comptoir^^. A ma décharge, 2015 fût une année compliquée, ceci expliquant cela.

Sur ce, un joyeux noël et n’abusez pas trop lors des repas !

 

 

[books] Les livres pour apprendre R

Avec le buzz actuel autour de la data science, de nouveaux outils arrivent sur le devant de la scène. Quand je dis « nouveaux » c’est un peu une exagération car la plupart existaient déjà, mais ils deviennent très visibles et populaires. Parmi ceux-ci, il y a R, un logiciel d’analyse statistique, qui permet de faire du traitement de données, de la visualisation. R est gratuit, R est plein de fonctionnalités grâce à une communauté très active qui release de nombreux packages.

Bref, vous devinez que pour moi R est un outil indispensable, et à vrai dire je m’en sers intensivement, quotidiennement, pour faire du prototypage mais aussi des outils qui sont en production.

Apprendre R, c’est facile quand on est informaticien, mais c’est facile aussi dès qu’on a l’habitude de l’outil informatique (vous remarquez la nuance), ce qui est par exemple le cas de beaucoup de webmasters et webmarketeurs. Il n’y a pas vraiment besoin de suivre des cours, il suffit d’avoir les bons bouquins et de prendre du temps pour apprendre.

Voici donc mon avis sur quelques livres utiles pour apprendre R, que vous pouvez mettre sur votre liste au gros barbu qui mets des paquets au pied du sapin (et en plus, j’ai mis mes liens d’affiliation^^).

R in action
Il s’agit d’après moi d’un des meilleurs livres pour apprendre à se servir de R. Édité par Manning, qui est sans doute l’un des meilleurs éditeurs de livres techniques en anglais, ce bouquin vous mènera de l’installation jusqu’à une utilisation très correcte de l’outil. Rien que pour les chapitres de la partie I il vaut le coup, ensuite les sujets sont plus orientés statistiques que outils pour le web, mais c’est quand même à lire.

Practical Data Science with R
Toujours chez Manning, il s’agit d’un livre que j’ai beaucoup apprécié car il est structuré « par l’exemple », une démarche appréciable pour la plupart des praticiens de R. Même si vous n’êtes pas un statisticien, même si vous avez appris l’informatique sur le tas, ou encore même si vous êtes encore étudiant, vous pourrez résoudre des problèmes intéressants, vous pourrez faire des visualisations au top en étant guidé. Certains chapitres sont vraiment au top, c’est par exemple le cas de celui sur le clustering, qui est très clair et utile.

Initiation à la statistique avec R
Voici un livre en français qui introduit R rapidement, et qui est ensuite plus un cours de statistique pour les étudiants de licence avec un soutien informatique en R. J’en parle principalement parce qu’il est facile à lire, mais ce n’est pas celui que je vous conseille si vous êtes dans le web.

R for everyone
Ce livre là est clairement en compétition avec « R in action » proposé plus haut. Un livre d’excellente tenue, et qui a le bon goût d’être basé sur ggplot2 pour la réalisation des visualisations de données, ce qui est bienvenue car il s’agit de très loin du meilleur package pour faire les graphiques en R.

Voilà, avec ça vous avez de quoi vous occuper pendant un petit moment 😉 Si vous ne devez en prendre qu’un : prenez R in action ou R for everyone, avec peut-être une préférence pour le second.

Sur mon bureau…

Aujourd’hui je vous propose un billet léger et pas très intéressant, pour vous divertir un petit peu.
A chaque fois qu’un visiteur arrive dans nos bureaux des ix-labs, il y a quelques commentaires incontournables. Le premier est généralement : « ils sont grands ces bureaux, et ils sont top », ce qui est vrai pour le premier point, et un plaisir à entendre pour le deuxième. Ensuite on a le droit à « wow, vous avez une sacré bibliothèque », et puis ensuite il y a un léger silence, remplacé par un « je suis sur que TON bureau c’est celui avec tout le bordel^^ » quand le visiteur me connait bien. Est-ce vrai ? On va dire oui et non, je vous laisse juge^^ :

bureauOui, je sais que la photo est floue, mais si je range vous ne voyez pas l’état du bureau, et si je ne range pas, il faut que je floute^^

Alors oui, le rangement n’est pas mon fort, mais tout ce qui est sur mon bureau est indispensable, et je vais vous en faire la liste incomplète, et aussi vous parler ainsi de certaines choses importantes pour bien bosser.

  • Un ordinateur. Quelle surprise, je suis dans l’informatique et j’ai un ordinateur… Mon choix s’est porté sur un mac, grand écran et assez puissant. Il y a toujours des discussions sans fin à ce sujet, mais c’est pour moi un bon compromis : il y a toutes les fonctionnalités d’une machine sous linux (ligne de commande, serveur X, emacs, etc.), une interface graphique ergonomique et tous les outils de développement modernes. Perso je fais principalement du R, du Python et du latex, donc tout est OK. Par ailleurs, la suite office fonctionne très bien sur le mac, ce qui me permet d’être compatible avec les rageux sous Windows.
  • Des cahiers, plein de cahiers. Au moment où j’écris ces lignes j’ai 12 cahiers différents sur mon bureau !
    photo (7)Mes cahiers préférés j’en parlerais dans un billet spécial un jour, mais j’utilise surtout des cahiers leuchtturm A5. C’est un peu comme des moleskine, mais en beaucoup mieux (si vous voulez en acheter pour Noël, passez donc par ma version en affiliation amazon).
    J’aime aussi beaucoup les SOS Notes d’Oxford, si ils étaient en A5 plutôt qu’A4 ce serait encore mieux (lien amazon).
    Chaque cahier son utilité : un pour un gros projet, un pour plusieurs petits projets, un pour les idées, un pour les lectures, etc. Travailler sur un cahier plutôt qu’à l’écran est fondamental car cela libère la créativité. Si vous utilisez un outil textuel logiciel pour noter vos idées, vous ne ferez pas de schémas, vous aurez une pensée linéaire et pauvre, et oui j’exagère un peu pour faire passer mon idée.
  • Des stylos de toutes les couleurs. Si il y a des cahiers, il faut des stylos. J’ai des plumes jetables de toutes les couleurs, un roller Dupont offert par un client (ahah, si des clients passent par là, n’hésitez pas), un beau plume offert par ma douce, des feutres, des crayons, etc. J’utilise plein de couleurs pour mettre en évidence les choses importantes, et pour faire des schémas « temporels » (en noir ce qui reste stable, en rose l’évolution au temps 1, en vert au temps 2, en … etc.).
  • Des lunettes. Bon, de base je suis déjà myope et astigmate, donc j’ai des lunettes. Comme je suis coquet j’ai des belles lunettes pour sortir et tout, mais j’ai toujours eu en plus une paire supplémentaire au bureau. Cette paire avait jusqu’ici comme fonctionnalité d’être à ma vue et d’être plus légère que l’autre.
    Mais après avoir discuté avec mon pote Julien qui fait du SEO pour Clearly, j’ai appris l’existence de lunettes avec un traitement anti-fatigue pour ceux qui travaillent devant un écran toute la journée.
    photo (9)J’ai honteusement soudoyé Julien et j’ai donc obtenu une paire (celle de la photo) et je dois bien dire que j’ai été surpris : ça change vraiment la vie de bosser avec ces lunettes. En revanche, je ne m’en sers pas en dehors du bureau car le traitement modifie légèrement les couleurs. Si vous êtes au Canada, jetez donc un coup d’oeil au site de lunettes de Clearly (peut-être qu’on peux acheter depuis la France aussi, je ne sais pas).
  • Un casque audio. Je ne suis pas tout seul dans le bureau, et pour une raison que j’ignore mes compagnons de bureau ne partage pas mes goûts pour l’eurodance et la makina. J’ai donc un casque. J’en ai testé (comprendre cassé) pas mal, comme le Parrot Zik qui a survécu 3 mois… Au final les casques anti-bruit sont rangés et je les sors pour prendre l’avion, et je suis parti sur du robuste pour le bureau.
    photo (8)Le casque qui me sert désormais est mon casque de running : le Trainer de chez Gibson (bluetooth uniquement, lien amazon). Il tient parfaitement (normal on peut courir avec), il est étanche (croyez moi sur mon bureau c’est un plus) et sans fil ce qui fait que quand je me lève je n’emmène pas avec moi l’ordinateur…
  • Des livres. Qu’est ce qui est mieux qu’un livre ? DEUX livres ! Bref, en ce moment sur mon bureau il y a « Python for finance », « Practical data science with R » (bouquin vraiment au top, lien sur amazon), « statistiques avec R » et « doing data science ».
    livres2Pourquoi des livres en vrai papier ? Parce que ça se lit partout, parce qu’on peut ECRIRE dessus. Un livre c’est fait pour vivre et donc on peut annoter ses livres, on peut les lire n’importe où, et on peut le laisser dans le bureau pour les petits camarades, alors que si le bouquin est sur la tablette, c’est plus compliqué.

Voilà, c’était mon billet plus léger du moment, n’hésitez pas à me dire comment sont vos bureaux dans les commentaires ^^

 

Mesure la force induite d’un lien : plus d’explications

Je vous ai parlé dans un précédent billet d’une nouvelle métrique pour estimer la force contextuelle d’un lien. Aujourd’hui je vais vous donner plus de détails, et un exemple pour illustrer l’apport de différents types de liens sur une même cible.

Pour commencer, voyons ce qui caractérise un lien puissant. Mais avant, une remarque très importante doit être fait : il faut différencier la puissance d’un lien de sa capacité à passer entre les gouttes de la team webspam. La métrique dont je vous parle aujourd’hui permet de donner une valeur à un lien, mais si vous voulez en plus éviter les balles, il faut faire des analyses supplémentaires (reverse engineering de penguin notamment).

Bref, voici donc les trois caractéristiques importantes d’un bon lien :

  1. Un bon lien vient d’une page qui transmet de la popularité. Dans les algos les plus important pour un moteur, il y a celui de calcul de la popularité (pour Google c’est le pagerank). Il faut donc prendre en compte la popularité qui fait le lien lorsque l’on mesure la valeur de ce lien.
  2. Un bon lien est thématisé. Il est donc indispensable de s’assurer que le lien provient d’une page dont les thématiques sont compatibles avec celles de la page cible.
  3. Un bon lien ne vient pas du dernier dépotoir à la mode, et notamment sa popularité et sa confiance doivent être corrélées. Si elles ne le sont pas, le lien perd de la valeur.

Aux ix-labs, nous avons mis au point une métrique, et comme on est pas des génies du marketing, on l’appelle pour l’instant la force SEO, ou la puissance SEO, ou la force SEO induite, ou… Bref, la force SEO est calculée par une formule qui ressemble de loin à ça :

Force (a\rightarrow b) = F(compatibilité, popularité, anticorrélation(confiance,popularité))

  • La compatibilité va être mesuré par un mécanisme similaire à un clustering dans l’espace des thématiques des pages web
  • La popularité reste un grand standard
  • La déviation confiance versus popularité est ce que son nom indique
  • La fonction F est une composition des trois éléments du dessus à l’aide de log, de multiplications, max, divisions, sommes, etc. Le tout pour avoir une mesure entre 0 et 100, avec un effet d’amplification (il est plus dur de passer de 50 à 51 que de 10 à 11, par exemple).

Comment utiliser cette métrique ? Il y a deux cas typiques :

  • Pour auditer les liens existants, notamment lorsque vous faites un audit d’un site client, ou que vous allez bientôt faire du désaveu de liens. Par exemple, imaginons que vous faisiez un désaveu post penguin. Il faut dans ce cas désavouer des liens à ancres exactes, mais vous pouvez en garder quelques-uns. La décision sera facilité par l’utilisation de la force SEO : vous ne garderez que les plus puissants.
  • On vous propose d’acheter un lien ? Hop, un coup de force SEO et vous pouvez voir si le prix est en phase avec le lien.

Bon, comme le mieux c’est toujours de prendre un exemple, je vais prendre le site de Clearly. Pourquoi ce site ? Parce que c’est mon pote Julien qui bosse pour le site, et que je me suis un peu moqué de lui dans un précédent post^^. Bref, imaginons que Julien donne du boulot à ses stagiaires : faire du lien vers la page du site qui parle de lunettes.

Panique à bord pour les stagiaires ! heureusement, il y en a une qui est plus dégourdie que ses comparses et qui va utiliser la force SEO. Et c’est parti pour quelques mesures avant de tenter de choper des liens.

 

1ere possibilité : http://sante-medecine.journaldesfemmes.com/forum

Force SEO vers la page spéciale lunettes : 37

Objectivement, un thread avec un lien vers la page serait une plutôt bonne opération, même si il y aura une déperdition de force en créant un thread. Ce n’est pas non plus le lien du siècle.

 

2eme possibilité : http://www.infolunettes.com/News/nws_38/votre-lunette-n-est-pas-un-objet-comme-les-autres.html

Force SEO vers la page spéciale lunettes : 1

Et oui, ce n’est pas parce que la thématique semble en adéquation que ça marche à tout les coups. Ce lien ne vaut rien du tout.

 

3eme possibilité : http://www.pointwc.com/fr

Force SEO vers la page spéciale lunettes : 14

Visiblement on ne doit pas parler des mêmes lunettes ! Un lien moyennement intéressant.

 

4eme possibilité : http://www.optical-center.fr/lunettes-de-vue et http://www.direct-optic.fr/lunettes-de-vue

Ces deux sites sont en première et deuxième position pour une requête du sujet.

Force SEO du premier : 44
Force SEO du deuxième : 32

Et si on regarde le troisième des SERPs, il vaut 38. Incroyable, si les concurrents faisaient des liens vers le site, ces liens seraient assez puissant^^

Combien vaut le lien que j’ai fait à Julien un peu plus haut ? A peine 20, mon pauvre Julien, j’en suis bien désolé^^

 

Voilà, vous pourrez bientôt faire la même chose, car nous espérons finaliser un outil disponible en ligne dans pas trop longtemps.