Archive for août, 2016

Les ix-labs ont deux ans !

Il y a deux ans, je prenais une disponibilité de mon poste de professeur des universités pour monter un labo de R&D privé : les ix-labs. A la fin de la première année, j’étais déjà plutôt content (voir ici), et pour spoiler ce billet, je dois dire que cette année a été encore meilleure. Meilleure ? oui meilleure, et sur tous les plans, sur le plan financier (croissance de presque 50%) mais surtout sur le plan des missions, qui sont chaque jour plus intéressantes.

Que s’est-il passé lors de cet exercice dans l’écosystème des ix-labs ?

Je vais commencer par faire un petit retour sur les principaux points intéressants de l’année.

  • Les lives des ix-labs. Je vais en fait commencer par l’activité qui est la plus problématique. Les live des ix-labs sont, je pense, une réussite sur le plan intellectuel : les exposés sont tops et certains ont donné des idées de produits à des confrères (je pense notamment à l’exposé de Guillaume sur les corpus). Mais nous voyons bien que notre retard chronique prend une dimension épique et à la rentrée, quand nous aurons fini les exposés qui auraient dû être faits avant janvier 2016, nous réévaluerons cette activité pour voir comment offrir un service de la même qualité, mais sans le retard (deux pistes : un abonnement avec moins d’exposés, ou bien un paiement au coup par coup, si vous avez un avis sur la question, vous savez comment me joindre).
  • Les conférences QueDuWeb et iSWAG. Vu ce qui a été dit ici, ici, ici, ici, ici, ici ou encore ici, j’estime que c’est une réussite. L’année prochaine, QueDuWeb reviendra, probablement sur deux jours, mais iSWAG n’aura pas lieu, la situation économique de la plupart des labos de recherche ne permettant pas de garantir facilement une audience suffisante. Nous pensons cependant à ajouter quelques exposés de vulgarisation scientifique dans QueDuWeb, car il y a un public intéressé.
  • L’international. Rien à voir avec le chant révolutionnaire… Cette année nous avons réalisé un peu plus de 20% de notre CA à l’international, y compris sur des activités de data science, c’est pour nous une reconnaissance importante.
  • La R&D et la data science. Ces deux activités restent de très loin nos activités principales (70% de notre temps). Il y a de la R&D et de la data science dans l’étude webspam (terminée cette année), dans les travaux avec Qwant et d’autres grands comptes, mais aussi dans nos « spin-off » comme YourTextGuru et The Machine In The Middle (présentée rapidement lors de QueDuWeb, plus à venir bientôt, Guillaume en parle dans ce podcast chez Thomas Cubel).
  • Les formations. Au delà des classiques (moteurs sur 2 jours, machine learning sur une journée et vitesse sur 1 journée) opérées via les frères Peyronnet, nous avons commencé une formation R + Python, pour l’instant en intra chez un de nos clients. Concernant la formation vitesse, nous réfléchissons à la proposer en mode dématérialisé, et là encore, si vous avez un avis sur la question, n’hésitez pas à nous le faire connaitre.
  • A titre personnel. Ca peut faire sourire, mais j’ai été honoré d’être nommé Personnalité Search de l’année 2016 en marge de la conférence SMX. En vrai ça fait très plaisir.

Voilà pour les points importants. Ce qui permet de passer aux news pour notre troisième exercice.

Plein de projets excitants pour l’année à venir

Alors que l’équipe n’était pas composée de personnes à temps plein aux ix-labs l’année dernière (sauf moi), cela change : Thomas et Lucie rejoigne totalement l’équipe (enfin, Lucie conservera en partie son activité de rédactrice freelance à coté, donc si vous avez besoin d’elle n’hésitez pas). Guillaume est sur tous nos projets également.

En terme de projets, à part ce qui est en continuité (formations, R&D, QueDuWeb), nous allons passer la seconde pour YourTextGuru et The Machine In The Middle.
La formation R/Python sera sans doute adaptée pour un public large, en commençant par une formation R seul. Nous sommes encore à la recherche d’un format et d’un modèle économique adapté.
Enfin, au chapitre des grandes nouveautés, un projet secret va être finalisé en octobre, qui mettra à disposition la puissance du machine learning pour mieux comprendre les problèmes que peut avoir un site web. Et nous allons relancer une activité que nous avions mis de coté au fil des années : l’édition de sites web.

Voilà, vous savez tout, stay tuned for the next episodes…

[Good Books] Quelques livres pour finir l’été (3/X)

Alors que le mois d’août est largement entamé, nous sommes très clairement dans le dur des vacances. Et quoi de mieux pendant les vacances que de bouquiner tranquillement, pour affûter son esprit avant la rentrée 😉

Voici donc quelques livres avec un court commentaire, que je vous conseille pour l’été, mais aussi pour la rentrée. Comme d’habitude, les liens amènent vers Amazon, via mon tag d’affiliation (transparence transparence…).

Trois livres non techniques, sur des sujets divers

Les vacances, c’est le moment de se couper de la réalité du boulot en lisant des livres pour s’ouvrir l’esprit. Je commence donc par vous conseiller quelques essais non techniques.

En premier, un livre parlant d’économie : Ce que l’argent ne saurait acheter : Les limites morales du marché, par Michael Sandel. Comme le titre l’indique, le livre porte sur les limites de la marchandisation totale, et sous-tend l’hypothèse que donner une valeur monétaire à certains biens/actions dégrade leur valeur non monétaire. L’auteur soutient son discours avec de nombreux exemples, certains édifiants, d’autres moins percutants (d’autant que la France n’a pas les mêmes idéaux moraux que les USA). Le livre reste intéressant, même si l’analyse est parfois un peu courte, et parfois également très imprégné de la propre morale de l’auteur. A lire cependant.

En deuxième, L’utilité de l’inutile, par Nuccio Ordine. La thèse de l’auteur est simple : il est faux que seul ce qui est source de profit est utile. Une fois qu’on a compris que c’est de ça qu’il s’agit, on se laisse guider dans un texte très érudit, plein de références et agréable à lire. Ce n’est pas de la « rocket philosophy », mais pour l’été c’est parfait.

En troisième, un livre plus près de nos préoccupations habituelles : The Black Box Society, les algorithmes secrets qui contrôlent l’économie et l’information Broché, par Frank Pasquale. Frank Pasquale est professeur de droit aux USA, spécialisé dans les questions éthiques liées aux technologies de l’information. Le livre fera peur au grand public, et ne surprendra qu’à moitié les personnes « du métier » : les grandes sociétés, main dans la main avec les pouvoirs publics, utilisent des algorithmes discriminants à longueur de temps, sans les divulguer, en se basant sur des données qui sont récoltées à très grandes échelles (et partagées entre « ceux qui savent »). Les gouvernements se font bananer à longueur de temps par « ceux qui savent » car les élus n’y comprennent rien. bref, business as usual. Le livre est très bien sur son aspect « catalogue », même si vous êtes dans l’informatique, mais sans être dans les « data trucs », vous découvrirez des choses (par exemple, je parie que vous ne savez pas ce qu’est un « fusion center »). Par contre, quand l’auteur aborde les possibles solutions, on retourne au pays des bisounours, ce qui montre que l’auteur est assez loin de la technique. Une lecture très agréable en tout cas.

Deux livres techniques, pour apprendre

C’est pendant l’été qu’on a le temps de se mettre à niveau sur des nouveautés, et c’est pour cela que je vous propose les deux livres suivants.

Le premier : Automate the Boring Stuff with Python, par Albert Sweigart. Je vais faire assez court : après une quasi-moitié du livre passée à apprendre Python (et c’est utile !), vous découvrirez comment faire du scrapping, comment travailler sur des fichier xls, pdf et json, comment faire du traitement d’images, comment manipuler souris et clavier pour automatiser des tâches, etc.

Le deuxième : Data Science from Scratch, par Joel Grus. Pas grand chose non plus à dire, il s’agit d’un livre qui part du principe que vous avez des bases en python, et qui déroule les bases de la data science à partir de là. Il y a des liens vers le code (via github) et les explications sont toujours très claires et pédagogiques. Seul bémol : le code est en python 2.6, alors que le standard est maintenant python 3.

Voilà, vous avez maintenant de quoi vous occuper sur la plage, à bientôt !