Le web sémantique est de retour sous forme de Pog #31
/** Commentaires #31 — */

Le web sémantique est de retour sous forme de Pog

Microsoft a lancé NLWeb, un outil open-source qui transforme tes données structurées (schema.org) en une couche compréhensible pour les LLM via MCP. Si ton SEO et tes données structurées sont déjà solides, c'est le moment de les revaloriser pour que les agents conversationnels comprennent et utilisent ton contenu.

Sémanti-quoi ? Peut-être que tu te dis ?

Ou peut-être pas, c’est un métier actif depuis longtemps et qui appuis beaucoup de technologies activement utilisées partout sur le web : WikiData, Schema.org, ArtsData.

Je suis peut-être trop dans ce domaine pour bien voir le paysage. Est-ce que toi aussi tu connais de près ou de loin le web sémantique ?

En fait, c’est presque certain que tu as déjà au minimum des données structurées sur ton site.

C’est une pratique importante dans ton référencement et beaucoup d’outils en contiennent par défaut.

La promesse des agents

Microsoft a annoncé, environ depuis la promesse des agents, l’implémentation d’un outil open source qui permet de mettre en valeur du contenu, des données structurées.

Et pour lancer son outil, ils ont fait appel à plusieurs compagnies actives avec le maintien et le partage de données structurées sur le web, comme : Yoast (Wordpress SEO), Shopify, Tripadvisor, etc.

Revaloriser tes données structurées.

C’est ma raison principale d’écrire ce texte.

Tu as déjà des données structurées sur ton site, ta boutique.

Ton SEO est bien en place, et on doit maintenant optimiser le contenu pour que les LLM le comprennent mieux.

Ou même seulement pour toi, pour que ton site web puisse faire partie de tes interactions avec les robots conversationnels.

Sinon, voici une nouvelle bonne raison pour commencer à contrôler tes données structurées sur ton site.

C’est là que NLWeb commence par proposer un nouveau standard en donnant les outils pour que tes données structurées puissent être utilisées avec les LLM.

Ils ont implémenté plusieurs des couches techniques nécessaires pour que tes données puissent être utilisées avec tes agents ou ton robot conversationnel.

Tout ça parce que les robots ont besoin de structure pour comprendre.

Comment fait-il ça ?

  1. Il faut que tes données soient structurées.
    1. Partagées avec une ontologie, comme schema.org (déjà utilisé par Google).
    2. Vérifie auprès de ta plateforme, elle le fait probablement déjà.
    3. Sinon, tes fils RSS sont structurés, mais très générique.
  2. Tes données seront moissonnées et transformées dans une structure faite pour les robots et ensuite transformée dans une base de données vectorielle.
  3. Ensuite, NLWeb ajoute des accès MCP et une interface web pour que ton contenu soit accessible par un agent ou dans une application LLM.

Pourquoi prendre ce temps ?

Principalement parce que les comportements de recherche ont déjà changé. Et que le GEO est déjà là dans la majorité des listes de choses à prendre en main.

Et tout le monde veut améliorer l’expérience avec leur contenu. Pour eux et pour leurs utilisateurs.

Que les pratiques se définissent.

Mais je crois fortement que si tu as une présence forte avec les fondations du SEO et avec des données structurées.

Les robots vont t’aimer.

Un peu comme j’ai parlé dans mon /** commentaires #12 */ Lettre d’amour aux robots :

Un nouveau standard

Parmi les partenaires qui ont intégré NLWeb dans leur projet, il y a Yoast.

Yoast développe un des outils les plus utilisés pour le SEO dans Wordpress. Ils offraient déjà un soutien pour contrôler ses données structurées.

Et grâce à l’implémentation de NLWeb, ils ont documenter encore plus en détail comment ajouter du support pour plusieurs types de contenu couramment structuré : Recette, produits, événements, etc.

Et plus de tous les autres partenaires annoncés, comme shopify, Cloudflare a ajouté le service directement. Donc, dans leurs grappes de service, ils offrent la base de données vectorielles et l’implémentation de NLWeb.

Outils et définition

Cloudflare introduit son lighthouse pour LLM et ses agents is it agent ready et leur article de blog à ce propos.

Ma veille du web du mois

Mes découvertes

liens. J’espère que cette section est pas trop lourde ou trop longue à la lecture. Design

/** Commentaires */

  • Précédent

    Les applications jetables #30
    #30


    Les applications jetables

    applications-jetablesarchitecturevibe-coding
Voir tous les numéros