Stop words : liste et explications

stop words

Aujourd’hui, l’optimisation du contenu des sites internet est devenue primordiale pour pouvoir prétendre à un référencement efficace et cohérent. Cette optimisation consiste entre autres à comprendre l’impact de l’utilisation des stop words dans la rédaction de vos textes.

Définition du stopword ou mot vide

Le terme stop words ou mots vides désigne des mots n'ayant pas de réelle signification. On dit aussi qu'ils ne sont pas porteurs de sens. En effet, ils sont si courants et reviennent de façon tellement régulière qu’ils ne permettent pas de caractériser, au sens lexical, un texte par rapport à un autre texte.

Les stopwords français sont généralement des mots dits grammaticaux tels que des adverbes, des pronoms ou encore des mots de liaison. Par opposition, les mots pleins sont souvent des mots lexicaux comme les noms, les verbes voire même les adjectifs. Néanmoins, il se peut que certains mots grammaticaux deviennent des mots pleins et que des mots lexicaux ne soient plus utilisés dans la différentiation des textes. Il n'existe donc pas de liste de ce type de mots bien définie. En effet, en fonction du groupe de texte ou du sujet que l’on va choisir, les stop words ne vont pas toujours être les mêmes. Par exemple, des textes portant sur un même sujet peuvent se voir attribuer une liste de mots vides qui ne le sont pas en temps normal. L'objet du contenu joue donc un rôle important dans la définition de ces stop lists. Evidemment, elles diffèrent également d'une langue à une autre.

Ainsi, pour constituer une base de données de ces mots, il est nécessaire de calculer le nombre de fois total que chaque terme revient dans le corpus de texte choisie. Les termes qui reviennent en plus grand nombre peuvent alors être considérés comme non porteur de sens et être ajouté à la liste.

Les stopwords dans le référencement et les moteurs de recherches

Une bonne connaissance de l’utilisation de ces mots par les moteurs de recherche permet d’optimiser au mieux le référencement de contenus.

Contrairement à ce que certaines personnes imaginent et à certains dire que l'on peut trouver sur internet, les stop words ne sont pas totalement ignorés lors d'une recherche faite via un moteur de recherche. En fait, certains moteurs de recherche suppriment les stopwords afin de réduire au maximum leurs temps de réponses mais également, et surtout, pour sauvegarder des ressources lorsqu'il s'agit d'indexer des pages web. L'indexation de ces termes serait trop coûteuse en énergie par rapport à la qualité des informations qu'ils renseignent. Cependant, même si l’entrée d’un stopword dans une recherche ne changera pas toujours de façon significative son résultat, celle-ci aura quand même un impact sur la liste des sites affichés. Ceci est d'autant plus vrai pour des recherches utilisant des expressions. Certaines recherches par expression peuvent contenir plusieurs mots vides successifs. Leur suppression lors de la recherche ne serait alors pas cohérente. Il est toujours possible pour l'internaute d'inclure un stop word dans une recherche en ajoutant un symbole plus (+) devant celui-ci pour rechercher le terme indépendamment du reste de la requête.

Savoir utiliser les stopwords

Si vous voulez que votre référencement soit le plus efficace possible, vous devez éviter d’employer d’en vos contenus ce genre de mot. L'utilisation trop abondante d'adverbes et de pronoms peut nuire à la force de sens de vos contenus. Il est notamment fortement conseillé d'utiliser le moins possible ce type de mot dans les titres.

Des outils peuvent aider à la bonne pratique du référencement en vous permettant de supprimer ces termes qui ne servent pas la recherche. Combiendemots.com vous propose entre autres de compter le nombre de mots excepté ceux qui n’apportent aucune information.

La stop list utilisée pour ce site est la suivante : alors, au, aucuns, aussi, autre, avant, avec, avoir, bon, car, ce, cela, ces, ceux, chaque, ci, comme, comment, dans, des, du, dedans, dehors, depuis, deux, devrait, doit, donc, dos, droite, début, elle, elles, en, encore, essai, est, et, eu, fait, faites, fois, font, force, haut, hors, ici, il, ils, je, juste, la, le, les, leur, là, ma, maintenant, mais, mes, mine, moins, mon, mot, même, ni, nommés, notre, nous, nouveaux, ou, où, par, parce, parole, pas, personnes, peut, peu, pièce, plupart, pour, pourquoi, quand, que, quel, quelle, quelles, quels, qui, sa, sans, ses, seulement, si, sien, son, sont, sous, soyez, sujet, sur, ta, tandis, tellement, tels, tes, ton, tous, tout, trop, très, tu, valeur, voie, voient, vont, votre, vous, vu, ça, étaient, état, étions, été et être.

La bonne compréhension et la bonne utilisation des stopwords est utile lorsque l'on veut améliorer son référencement dans les moteurs de recherche. Pour qu'elle soit la plus efficace possible, ces pratiques doivent être intégrées à une politique d'optimisation.