Comment transformer un moteur de recherche en chatbot ?
Comment aspirer un site internet puis restituer les pages web les plus pertinentes aux usagers de son chatbot ?
Parution le
6/9/2021
, par
Martin Caussanel
Introduction
Avant d’enrichir le contenu de son chatbot ou de parler d’automatisation, un premier outil pouvant apporter en quelques clics une valeur importante à ses usagers est le moteur de recherche.
Lorsqu’il ne trouve pas une réponse à une question dans sa base de connaissance, votre assistant ira chercher une ou plusieurs pages pertinentes de votre site, qu’il restituera à l’usager sous la forme de courts extraits illustrés et accompagnés du lien de la page.
Cet article vous apprendra à :
- Créer un moteur de recherche
- Le lier à votre assistant
- Affiner sa configuration
Créer un moteur de recherche
Pour ce faire, rendez-vous sur l’écran de création de ressources depuis le menu bleu en haut à gauche de votre console.
- Sélectionner Moteur de recherche
- Renseigner un nom, description, catégorie, et éventuellement une image représentant la ressource
- Renseigner l’URL de votre site, en la commençant par http:// ou https://
- Valider
Dès lors, le moteur de recherche commencera à découvrir et indexer les différentes pages de votre site.
Lier le moteur à son assistant
L’usage le plus courant d’un moteur de recherche est de l’appeler depuis l’intention “Défaut” afin de proposer des pages web en réponse seulement lorsque le bot n’a pas les connaissances pour traiter le message lui-même.
Depuis l’éditeur Design du bot désiré :
- Se positionner au dessus de l’intention Défaut
- Depuis la partie “Actions” de la liste de réponses, glisser et déposer “Rechercher” dans votre intention Défaut
- Sélectionner le moteur de recherche précédemment créé
- Valider
- Enregistrer l’assistant

Pour tester, vous pouvez alors parler à votre bot avec une phrase non traitée par la base de connaissance et apparaissant dans votre site.
Affiner sa configuration
Par défaut, un moteur de recherche ira indexer toutes les pages du site indiqué. Toutefois, il existe 2 manières de restreindre les pages visées.
Restreindre l’indexation à une catégorie de pages
La première condition est d’avoir un chemin commun au début des adresses ciblées:
- https://votresite.com/fr/documentation/page1.html
- https://votresite.com/fr/documentation/sousdossier/souspage2.html
Ici, le chemin commun est : https://votresite.com/fr/documentation/
A partir de là, 2 cas se présentent :
- https://votresite.com/fr/documentation/ correspond à l’URL d’une page valide de votre catégorie
C’est le cas le plus simple, il suffit alors de créer votre moteur de recherche en lui fournissant cette URL, et il se limitera automatiquement aux pages démarrant par /fr/documentation/.
- https://votresite.com/fr/documentation/ ne correspond à aucune page valide
Dans ce cas, il faut trouver une sous-page de votre catégorie, mais dont le chemin est situé juste en dessous de /fr/documentation/ et non sous un autre dossier.
Exemple valide : https://votresite.com/fr/documentation/page1.html
En créant un moteur de recherche avec cette URL, la première page à être indexée sera page1.html, et le moteur se limitera aux autres pages commençant par /fr/documentation/.
Exemple invalide : https://votresite.com/fr/documentation/sousdossier/souspage2.html
Puisque cette page est située dans un dossier inférieur à celui visé, le moteur commencera par indexer souspage2.html et se limitera aux pages commençant par /fr/documentation/sousdossier/.
Indexer un site selon son sitemap
Si vous disposez d’un sitemap indiquant une liste précise de pages à indexer, il est aussi possible de fournir l’URL du sitemap (qui doit terminer par sitemap.xml pour être reconnu comme tel), et le moteur de recherche se limitera automatiquement aux URL fournies par ce fichier.
Indexer plusieurs sites
A la création d’un moteur de recherche, l’URL fournie commence aussitôt à être indexée. Mais il est aussi possible de fournir d’autres URL, qui seront indexées de la même manière, et profitant des mêmes options présentées ci-dessus.

Pour ce faire, ajoutez votre adresse dans la barre de saisie située sous “Domaines”, et cliquez sur Enregistrer.