Pendant longtemps, les moteurs de recherche e-commerce fonctionnaient sur un principe simple : comparer les mots de la requête avec les mots présents dans les titres et descriptions des produits. Cette approche - dite "lexicale" ou "par mots-clés" - est efficace pour des requêtes exactes, mais elle atteint rapidement ses limites face à la réalité des comportements des acheteurs en ligne.
La recherche vectorielle, aussi appelée recherche sémantique, représente une rupture technologique fondamentale dans la façon dont les moteurs comprennent les requêtes. Elle est aujourd'hui au coeur des moteurs de recherche les plus avancés, dont Google Search et Google Vertex AI Search for Retail.
Qu'est-ce que la recherche vectorielle ?
Un vecteur est, en mathématiques, une liste ordonnée de nombres. En traitement automatique du langage (NLP), les chercheurs ont découvert qu'il était possible de représenter le sens d'un mot, d'une phrase ou d'un texte entier sous forme de vecteur à plusieurs centaines ou milliers de dimensions.
Ces représentations - appelées embeddings - sont construites par des modèles de deep learning entraînés sur d'immenses corpus de texte. La propriété fondamentale des embeddings : deux textes ayant des sens proches se retrouvent mathématiquement proches dans l'espace vectoriel, même s'ils n'ont aucun mot en commun.
L'exemple classique des embeddings
Dans un espace vectoriel bien entraîné, "chaussure de running" et "basket de sport" sont proches. "Imperméable homme" et "veste de pluie" sont proches. "Tenue de bureau" est proche de "chemise formelle" et de "blazer". La distance entre vecteurs reflète la proximité sémantique.
Dans le contexte e-commerce, chaque produit de votre catalogue est indexé sous forme d'embedding. Chaque requête d'un visiteur est elle aussi convertie en embedding en temps réel. Le moteur calcule alors la distance entre le vecteur de la requête et tous les vecteurs du catalogue, et retourne les produits les plus proches - les plus sémantiquement pertinents.
Recherche lexicale vs recherche vectorielle
Pour comprendre l'apport de la recherche vectorielle, voici une comparaison directe des deux approches sur des scénarios courants en e-commerce :
| Requête | Recherche lexicale (BM25) | Recherche vectorielle |
|---|---|---|
| "tenue bureau été" | Zéro résultat si ces 3 mots n'apparaissent pas dans les fiches | ✓ Trouve robes mi-saison, chemisiers légers, blazers... |
| "cadeau pour bébé" | Seulement les produits taggés "bébé" + "cadeau" | ✓ Comprend l'intention, propose layettes, jouets d'éveil, poussettes... |
| "chaussures confortables longues marches" | Cherche "confortables" et "longues marches" dans les descriptions | ✓ Comprend le besoin, trouve chaussures de randonnée, semelles ergonomiques... |
| "nkie air max" (faute de frappe) | Zéro résultat (correspondance exacte) | ✓ Corrige et comprend la requête |
La recherche lexicale excelle quand la requête correspond exactement aux termes du catalogue (SKU, marque, nom de produit). La recherche vectorielle excelle pour les requêtes en langage naturel, les intentions d'achat floues, et les descriptions de besoin.
Les avantages concrets pour un site e-commerce
Réduction drastique des requêtes à zéro résultat
Les pages "aucun résultat" sont l'une des principales causes d'abandon sur les sites e-commerce. La recherche vectorielle permet de toujours proposer des produits pertinents, même pour des requêtes inhabituelles ou en langage naturel.
Compréhension du langage naturel
Vos visiteurs ne pensent pas en termes de mots-clés de catalogue. Ils décrivent leurs besoins : "quelque chose de chaud pour l'hiver", "cadeau de mariage original", "vélo pour aller au travail". La recherche vectorielle comprend ces formulations et y répond.
Meilleure couverture du catalogue
Avec la recherche lexicale, les produits dont les fiches sont mal rédigées ou peu détaillées sont invisibles. La recherche vectorielle comprend le produit dans son ensemble et peut le retrouver même avec des fiches imparfaites.
Testez la recherche vectorielle sur votre catalogue
Vectail intègre Google Vertex AI Search for Retail - la meme technologie que Google Search - dans votre boutique en 2 minutes. Essai gratuit 14 jours, sans carte bancaire.
Démarrer gratuitementLa recherche hybride : le meilleur des deux mondes
La recherche vectorielle pure a une limite : elle est moins précise que la recherche lexicale pour les requêtes exactes. Un visiteur qui tape "Nike Air Max 90 blanc taille 42" attend une correspondance exacte - pas une interprétation sémantique.
C'est pourquoi les moteurs de recherche modernes combinent les deux approches dans ce qu'on appelle la recherche hybride :
- Recherche vectorielle - pour les requêtes en langage naturel, les intentions, les descriptions de besoin
- Recherche lexicale (BM25) - pour les références exactes, les marques, les numéros de modèle
- Fusion des résultats - les scores des deux approches sont combinés (souvent via une technique appelée Reciprocal Rank Fusion) pour produire un classement final
Google Vertex AI Search for Retail utilise cette approche hybride nativement. C'est l'une des raisons pour lesquelles ses résultats sont pertinents sur un spectre large de requêtes - des plus précises aux plus floues.
Comment fonctionne l'indexation vectorielle ?
Lors de la synchronisation de votre catalogue, chaque produit est traité de la façon suivante :
- Extraction du texte - titre, description, catégories, attributs du produit
- Génération de l'embedding - le modèle de langage convertit ce texte en vecteur à N dimensions
- Stockage dans un index vectoriel - les vecteurs sont stockés dans une structure permettant une recherche rapide par similarité (ANN - Approximate Nearest Neighbors)
- Mise à jour en continu - chaque modification de catalogue met à jour les embeddings correspondants
Lors d'une requête, la même chaîne s'applique à la requête du visiteur : le texte est converti en embedding, et la recherche ANN trouve les N vecteurs les plus proches dans l'index en quelques millisecondes.
Recherche vectorielle vs solutions traditionnelles
Plusieurs solutions de recherche e-commerce se présentent comme "sémantiques" ou "IA" sans forcément utiliser de véritables embeddings vectoriels. Les différences se voient dans les cas limites : requêtes en langage naturel, descriptions de besoin, ou requêtes dans une langue différente de celle du catalogue.
Les indices d'une vraie recherche vectorielle :
- Résultats pertinents pour des requêtes jamais vues dans le catalogue
- Compréhension des synonymes sans configuration manuelle
- Capacité à répondre aux requêtes en langage naturel
- Pertinence multilangue (une requête en anglais peut trouver des produits en français si les catalogues sont correctement encodés)
La recherche vectorielle de Google dans votre boutique en 2 minutes
Vectail connecte votre catalogue à Google Vertex AI Search for Retail via un simple script tag. Sans développement, sans maintenance d'infrastructure. Essai gratuit 14 jours.
Démarrer gratuitement