Do you know Brian Suda ? Microformats : a web of data - Web 2.0 Expo - Berlin 5-8 novembre 2007
Start-ups : vous êtes les bienvenus à "Campagnes 2.0"

Connaissez-vous François Goube ? Microformats : des offres d'emplois (Jobijoba) aux bouteilles de Bordeaux ?

Les premiers sites proposant du microformat éclosent en France... Tout sera-t-il microformaté ?
François nous présente sa plateforme de crawling, et de microformatage automatique d'offres d'emploi publiées par plusieurs sites différents... Jobijoba Les annonces présentées dans ces sites de diverses façons, sont recadrées dans un modèle unique, grâce à un robot qui "comprend" les différents élements de l'annonce... Des tags sont générés à la volée.
Le savez-vous ? C'est une curiosité gauloise semble-t-il, mais la petite annonce est couverte par le droit d'auteur (on serait le seul pays dans le monde ...). Jobijoba a donc dû passer des accords avec les sites qu'il "crawle"...
Il recense environ 50.000 annonces microformatées (au total sur les 150 sites de petites annonces d'emploi il y aurait 150 à 200.000 annonces)... Ce qui favorise quand même pour l'internaute la recherche d'emploi, plutôt que de visiter l'un aprés l'autre les différents sites...
Comment cela fonctionne-t-il ? A quoi sert un microformat ? (voir le billautshow de notre ami Christophe Ducamp et celui de Brian Suda au Web 2.0 à Berlin).. Comment le lire ? Est ce que le microformatage va accélérer la fluidité du marché de l'emploi ? Qu'est ce qu'une recommandation qualitive en flux tendu ?
François nous fait une démo...
Quel est son business modèle ?
Peut-on appliquer les microformats à autres choses que les annonces d'emploi ?
Réponse : oui...
A l'immobilier, les produits vendus sur les sites marchands... (ce qui permettrait à l'utilisateur d'avoir un panier unique)... Et même, hors caméra François, m'a dit qu'il réfléchissait à microformater des recettes de cuisine et des bouteilles de bordeaux (mais je ne vous ai rien dit)...
Ah, dernier point. Jobijoba est basé à Bordeaux... Il y aurait 150 start-ups à Bordeaux un peu dans tout les domaines... (biologie, Internet, etc...). Va falloir que j'aille y faire un tour...

Pour contacter François Goube ici
Le site de Jobijoba ici (prenez la précaution d'installer au préalable Operator, le plug in adhoc, dans votre Firefox)...

© A Billautshow production - the video for the rest of us -

Commentaires

Robert

Les annonces sponsorisées ne sont pas forcément de la pollution de recherche : tout dépend la façon dont vous décidez d'afficher ces annonces. Certains sites comme Wanajob.com proposent ainsi des offres sponsorisées qui s'affichent de façon contextuelle dans le moteur de recherche. Et cela participe efficacement à la quête du job de vos rêves !

Stéphane Labrouche

Bonjour,

Je réagis et commente rarement le travail et les efforts de communication de nos concurrents mais je crois nécessaire cette fois d'apporter quelques éclaircissements. Et une fois n'est pas coutume notre point de vue spécifique.

D'abord nous devons corriger les éléments de marché avancés ici par Monsieur Goube. Il y a en France au bas mot plus de 500.000 offres d'emploi disponibles en ligne et non pas 150.000. Nos équipes travail depuis 8 mois à valider ces informations tant auprès des acteurs professionnels que des entreprises elles-mêmes. Le site emploi Keljob.com annonce d'ailleurs 450.000 offres sur Internet alors qu'il n'est pas forcément à son avantage, compte tenu de son positionnement, de trop gonfler les chiffres.

S'agissant des microformats, nous pensons effectivement qu'ils peuvent avoir un intérêt, à terme, pour le candidat dans le processus relationnel engagé avec une ou des entreprises auxquelles il veut ou a proposé sa candidature. Nous contestons en revanche leur impact sur la qualité des résultats générés lors d'une requette effectuées par un candidat dans un moteur de recherche.

Deux raisons essentielles ici qui nous ont convaincu, en la matière, de ne pas utiliser les microformats dans Wanajob:

1/ Une offre d'emploi c'est déjà une information structurée par un intitulé, un type de contrat, un salaire, une durée, une date de mise en ligne, une mission, un employeur (!), une situation géographique et souvent l'indication assez précise du profil recherché. Nous croyons de ce fait que les "tags" ou mots clés essentiels sont déjà constitutifs de l'offre et qu'il appartient au moteur et à l'algorithme qui lui donne vie de savoir identifier ce qui est pertinent ou ce qui ne l'est pas, ce qui convient au candidat ou pas en fonction précisément des mots clés saisis lors de la recherche.

Quand nous ne faisons pas d'extraction directe, les sites nous envoient des flux XML dans lesquels les offres d'emploi sont déjà structurées. J'ai pu voir un flux envoyé à Jobijoba par l'un de ces sites et les "tags" qui y sont effectivement proposés sont des redites très subjectives et à mon sens limitatives, de la richesse intrinsèque de l'offre elle même.

2/ Si les "microformats" sont générés ou "pushés" par les sites qui sont à la source des offres d'emploi et qu'ils concernent d'autres éléments que ceux permettant le cas échéant de récupérer les informations concernant l'employeur, alors il est facile d'imaginer comment corrompre et influencer in fine le ranking du moteur. Celui qui en fera les frais est ici encore le candidat.

Nous croyons en revanche pertinent de proposer un filtrage dynamique des résultats générés par une recherche. Wanajob est à cet égard aujourd'hui le seul moteur de recherche d'offres d'emploi à proposer un filtrage poussé sur plus de dix ensembles de métadonnées qui permettent justement de passer d'une dynamique quantitative à une démarche qualitative. Le candidat est alors gagnant puisqu'il est capable de retenir les quelques offres correspondant au plus près à ses besoins. Ceci couplé à l'historique des recherches nous permet très simplement d'intégrer des recommandations profilées.

Wanajob a choisi d'investir des sommes importantes en R&D depuis plus de 18 mois et travaille tous les jours à améliorer son expertise d'extraction des données sur le web, à leur homogénéisation et enfin à la création d'un algorithme spécifique.

Quant à la dynamique d'échange contextuelle basée sur le profile des candidats, qu'ils soient actifs (en recherche d'emploi effective) ou passifs (simplement à l'écoute) Wanajob.com prépare notamment avec son partenaire MonCV.com l'implémentation de fonctions avancées répondant à cette logique. Et les microformats n'ont ici aucun intérêt substentiel particulier sinon d'être redondant des métadonnées déjà récupérées.

Alors "microformats" pourquoi pas, comme le HRXML d'ailleurs, ils ont leur utilité. Je suis un peu troublé par contre quand nos homologues en font un avantage concurrentiel ou technologique ou prétendent encore y trouver une valeur ajoutée pour les candidats et employeurs.

Je ne crois pas vraiement au concept du Recrutement 2.0 dont certains font un usage communicationnel parfois abusif. Je sais en revanche que la Recherche d'emploi, au delà d'être un marché dynamique, est une démarche quotidienne vécue par des millions de français et régie par des règles immuables. Faisons attention à ne pas nous tromper dans les fondamentaux.

Stephane Labrouche
CEO, Wanajob.Com

billaut

@Stephane...
Merci pour ce long comment... je pense que François y répondra... et à votre disposition pour un billautshow...

Nicolas Cynober

Double post sur les microformats ? Double commentaires ! :)

Plutôt que microformater, ne voulez vous pas à la place tout simplement sémantiser l'information comme le fait Twine, FreeBase, PowerLab et TrueKnowledge autour de technologies pérennes?

http://nicolas.cynober.fr/blog/?p=13

François-Xavier Bodin

Bonjour Jean-Michel.

Ravi de voir que François Goube a attiré l'attention sur Bordeaux :-) Super initiative, JobiJoba.

A propos de microformat pour le vin, il existe déjà VinoXML : Matthieu Ducrocq, auteur du logiciel de gestion de cave Open Cellar (http://www.open-cellar.com a participé à sa définition. A découvrir.
Amitiés.

Thomas Allaire

@ Monsieur Labrouche :

Nous vous remercions pour votre commentaire et l’intérêt que vous portez aux choix technologiques de JobiJoba. Permettez-moi à mon tour d’apporter quelques précisions, tant le sujet des microformats nous tient à cœur et reste (à notre avis) d’une priorité absolue pour construire le web de demain.

Initialisés par une communauté de « gurus » de l’internet (Brian Suda, Tantek Celik, Tim Berners Lee…), les microformats sont aujourd’hui intégrés dans les recommandations du W3C et soutenus ou adoptés par l’ensemble des acteurs majeurs du web (Yahoo, Mozilla, Microsoft, Google…). On est donc loin du « hype 2.0 » que vous évoquez.

Pour rappel, les microformats constituent une approche du web sémantique qui permet de structurer un contenu afin que celui-ci, produit par des humains, puisse être compris par des robots.

Vous avez fait le choix de ne pas utiliser les microformats sur wanajob, et nous le respectons. Laissez-moi répondre à vos objections et vous expliquer notre choix :

1) L’offre d’emploi étant bien une information structurée mais présentée de manière différente sur chaque site indexé, les microformats permettent de comprendre cette information de manière autonome. De plus les tags générés sur JobiJoba sont non seulement récupérés de la compréhension du contenu, mais également, comme vous le mentionnez, des actions des sites emploi. Au-delà l’analyse des actions et profils des candidats nous permet de rajouter une couche de données supplémentaire : le croisement de ces sources de données ou meta-données nous garantit la pertinence des résultats.

2) Par définition les microformats ne peuvent en aucun cas être « poussés » puisqu’ils constituent « seulement » une manière de préciser le sens du contenu présenté sur un site web. Ils nous permettent de ne pas demander aux Jobboards de développements spécifiques pour produire leurs flux. Il n’y a pas non plus de paramétrage spécifique site par site pour extraire les données puisqu’elles sont comprises automatiquement par nos robots. Il n’y a donc aucun risque de corruption des résultats.

Alors oui, il est clair que pour un simple aggrégateur, les microformats ne présentent pas un intérêt majeur. Mais pour un moteur de recherche leur implémentation constitue un enjeu technologique pour répondre aux attentes des internautes à l’avenir.

Aujourd’hui les microformats nous servent à mieux interpréter l’information par nos algorithmes, mais la puissance de leur implémentation se révèlera véritablement dans les semaines qui arrivent avec l’ajout de nouvelles fonctionnalités sur notre moteur de recherche.

Nous croyons à un web libre, et ouvert et travaillons en ce sens pour proposer un accès simple et pertinent à l’information. Et c’est le minimum que les candidats sont en droit d’attendre d’un service comme le notre. C’est aussi la raison pour laquelle les résultats ne doivent pas être pollués par des considérations commerciales (@Robert : cf. offres sponsorisées).

J’espère vous avoir convaincu de l’intérêt des microformats, et trouve plutôt sain que tous les acteurs ne fassent pas les mêmes choix, c’est aussi ça l’internet libre. Je suis sûr qu’au final, c’est l’utilisateur qui en sortira gagnant.

Cordialement,

Thomas Allaire
Responsable Programme R&D - Co-Fondateur
JobiJoba.com

Vérifiez votre commentaire

Aperçu de votre commentaire

Ceci est un essai. Votre commentaire n'a pas encore été déposé.

En cours...
Votre commentaire n'a pas été déposé. Type d'erreur:
Votre commentaire a été enregistré. Poster un autre commentaire

Le code de confirmation que vous avez saisi ne correspond pas. Merci de recommencer.

Pour poster votre commentaire l'étape finale consiste à saisir exactement les lettres et chiffres que vous voyez sur l'image ci-dessous. Ceci permet de lutter contre les spams automatisés.

Difficile à lire? Voir un autre code.

En cours...

Poster un commentaire

Vos informations

(Le nom est obligatoire. L'adresse email ne sera pas affichée avec le commentaire.)