Lexique
- Accessibilité
- Propriété d'un site rendant possible son utilisation par toute personne, quels que soient sa langue, les moyens logiciels et matériels qu'elle emploie, ses aptitudes physiques et mentales. Les moyens utilisables comprennent les navigateurs en mode texte, téléphones portables, PDA et palm computer, iPhone, téléviseur, mais aussi les systèmes assistés, synthétiseur vocal, terminal Braille, etc.
- AJAX (Asynchronous JavaScript And XML)
- Ensemble de techniques d'interactivité à la base du web 2.0. Les techniques utilisées sont une combinaison de Javascript, de XML et de requêtes HTTP. AJAX permet d'exécuter des applications locales (dans le navigateur) en utilisant le remote scripting.
- Annuaire
- Site de référence répertoriant des sites web, dont le contenu est organisé par rubriques, à l'image d'un annuaire papier.
- Blacklistage
- Action d'un moteur de recherche consistant à réduire ou à supprimer la visibilité d'un site qui pratique le spamdexing.
- Balise (tag)
- Marqueur utilisé pour identifier, décrire ou mettre en forme un élément dans un document. Dans le web sémantique, le contenu étant séparé de la mise en forme, les balises n'assurent pas cette dernière fonction qui est alors reléguée aux feuilles de style CSS.
- Blog
- Site web constitué de pages personnelles se présentant sous forme d'une succession de billets (posts), c'est-à-dire d'articles qui composent ainsi une sorte de journal en ligne. De nombreuses fonctionnalités sont possibles telles que la dépose de commentaires par les visiteurs, la liste des liens vers les autres blogs (blogroll), la syndication de contenu par flux RSS, la recherche au moyen d'un moteur de recherche interne...
- Bureau d'enregistrement (Registrar)
- Société d'enregistrement de noms de domaine (le terme anglais registrar est le plus couramment utilisé), en charge de commercialiser un type de domaines, par exemple l'AFNIC pour les noms domaines en fr.
- Cadre (frame)
- Page web renfermant plusieurs pages HTML, constitutives par exemple de l'en-tête, du menu, du contenu principal. Ce type de pages, bien que normalisé, pose des problèmes de référencement aux moteurs de recherche qui afficheront des pages de contenu orphelines (sans leur cadre). De plus, l'utilisation des cadres nécessite souvent de scroller dans chaque fenêtre, ce qui est perçu par l'utilisateur comme un désagrément.
- Captcha (Completely Automated Public Turing test to Tell Computers and Humans Apart)
- Test ayant pour but de différencier une réponse provenant d'une personne de celle d'un ordinateur. Utilisé dans les formulaires, ce test vise à éviter la pollution par les robots malveillants et l'extraction de données automatique. Il se présente sous la forme d’une image contenant des lettres et/ou des chiffres à recopier pour pouvoir valider le formulaire.
- Cloaking
- Technique visant à faire indexer par les moteurs de recherche un contenu spécifique et non visible par les internautes afin d'obtenir un bon positionnement sur des mots-clés donnés.
Le cloaking est une technique de spamdexing. - CMS (Content Management System)
- Un CMS ou système de gestion de contenu est un logiciel qui permet de créer et de gérer un site, les administrateurs ne s'occupant que du contenu, sans connaissance de la programmation. Les fonctions disponibles sont larges, gestion des droits, multilinguisme, forum, historisation et archivage, syndication de contenu...
- CSS (cascading style sheet)
- Feuilles de style permettant de réaliser la mise en forme des documents HTML et XHTML. Les styles sont des directives qui mettent en forme un élément (mot, paragraphe, image...) et qui peuvent être attachées à l'élément lui-même, à une page (styles regroupés dans l'en-tête de la page) ou à un site complet (feuille de style externe). Les feuilles de style sont dites en cascade car les styles d'élément, de page et de site s'appliquent avec des priorités hiérarchisées, sans se contredire.
- Duplication de contenu
- Pages dont le contenu ou une partie de contenu est identique. Une duplication de contenu se produit, par exemple, lors d'un mauvais paramétrage du serveur web, entre les adresses http://domaine.com et http://www.domaine.com. Les moteurs de recherche pénalisent les sites qui présentent de la duplication de contenu destinée à améliorer leur positionnement.
- E-commerce
- Commerce en ligne. Un site de e-commerce est dédié à la vente directe à l'entreprise (B to B), au particulier (B to C, Business to Customer) ou entre particuliers (C to C), et généralement dispose à ce titre de solutions de paiement en ligne.
- Effet Sandbox
- Moyen utilisé par Google pour pénaliser les sites commerciaux et les nouveaux sites et empêcher que ces derniers bénéficient trop rapidement d'un bon positionnement dans les résultats de recherche.
- Feuille de style
- Voir CSS
- Folksonomie (social bookmarking)
- Système de partage de marque-pages, basé sur un classement effectué par des internautes à partir de critères librement choisis. Ce concept, typique du web 2.0, favorise la constitution de communautés autour de sites tels que Del.icio.us et Technorati pour les signets, mais s'étend aussi au partage de photos (Flickr) et de vidéos (Youtube, Dailymotion).
L'utilisateur sauvegarde ses marque-pages sur le site et les classe à l'aide de mots-clés (tags). Les marque-pages de chaque utilisateur, visibles par tous, sont généralement présentés sous forme de nuages de mots-clés et permettent ainsi d'établir un classement par popularité. - Géolocalisation
- Localisation d'une entité sur une carte géographique.
Exemple de géolocalisation de Vent solaire.
Localisation d'un site web dans le pays d'origine de son adresse IP. Des dispositions sont prises par les moteurs de recherche pour référencer les sites web en fonction de leur géolocalisation, de sorte que par exemple un site web avec un nom de domaine en pl bénéficie d'un meilleur positionnement sur les moteurs de recherche polonais s'il est hébergé en Pologne plutôt qu'en France. - Hacker
- Bricoleur du web dont les occupations peuvent s'appliquer à un spectre d'activités large, depuis l'administration réseau, la sécurité ou la cyber-police, avec des valeurs éthiques élevées, en passant par l'exploit informatique que constitue l'intrusion de sites réputés sécurisés sans volonté de nuire, jusqu'au piratage, à l'escroquerie ou au cyber-terrorisme. Ces types de hackers sont qualifiés de blancs, gris et noirs (white, grey, black hat).
- Hoax (canular)
- Message transmis par e-mail cherchant à tromper ses destinataires.
Ces messages malveillants visent à faire effectuer des opérations telles que envoi d'argent, constitution d'une fausse chaîne de solidarité, téléchargement d'un fichier dangereux, voire à effacer des fichiers de son ordinateur. Un bon réflexe : sélectionner et copier une phrase caractéristique du message, la coller dans le moteur de recherche de hoaxbuster pour démasquer l'intrus. - HTML
- Langage de base des pages web permettant de mettre en forme des documents destinés à être publiés sur Internet.
La particularité du HTML réside dans le système de liens hypertextes qui associent un mot à une page, facilitant ainsi la navigation par associations d'idées.
Le HTML est un langage constitué de balises, mais qui ne permet pas d'assurer la séparation entre le contenu et sa mise en forme, principe de base du web sémantique. - Hypertexte
- Procédé permettant d'accéder à une information ou à une ressource à partir d'un mot mis en exergue dans un texte. Ce mode d'accès à l'information, popularisé par Internet, présente l'intérêt d'être rapide et intuitif.
- Internet
- Réseau mondial d'échange de données constitué de plusieurs services. Basés sur des protocoles de transmission normalisés, ces services sont variés : le World Wide Web (les sites), la messagerie, la messagerie instantanée ou chat, le transfert de fichiers, les réseaux privés virtuels, le peer to peer (PC à PC), les forums, les transactions sécurisées... Les applications qui en découlent sont tout aussi variées : vente en ligne, téléphonie/radio/TV par internet, télé-gestion industrielle et domestique, visioconférence, formation à distance...
- Liens commerciaux (ou liens sponsorisés)
- Liens figurant dans les résultats d'un moteur de recherche pour une requête sur un mot-clé donné, dont la position est liée au budget investi. Il s'agit d'une publicité contextuelle qui présente des offres commerciales à un public intéressé. Les liens commerciaux sont situés dans la colonne de droite des résultats de recherche et parfois au-dessus des résultats naturels, sur fond coloré.
- Marque-page (bookmark)
- Repère auquel est associé l'URL d'une ressource sur Internet (page, photo, vidéo, site web...), conservé en mémoire dans un navigateur aux fins d'être utilisable ultérieurement. Le marque-page, terme utilisé par Firefox, est également appelé favori (Internet Explorer) ou signet (Netscape).
- Mashup
- Site web ou application web produisant un contenu composite issu de plusieurs sites. Le développement des mashups a été rendu possible parce que certains éditeurs ont mis à la disposition des développeurs leurs interfaces de programmation (API). L' API la plus utilisée est sans doute celle de Google relative à la géolocalisation.
- Métadonnées
- Eléments d'information structurés servant à décrire un document. Dans cette optique, les documents publiés sur Internet sont assortis de balises META (meta tags), par exemple titre, description, auteur, qui apparaissent dans l'en-tête non visible du document. Sur Internet, les métadonnées sont une composante essentielle du Web sémantique car elles apportent de la pertinence aux résultats des recherches d'information.
- Mot-clé
- Mot ou groupe de mots qui caractérise le contenu d'une page et qui est utilisé pour réaliser son référencement. Ce terme définit également le mot ou le groupe de mots tapé dans le champ de saisie d'un moteur de recherche, permettant d'effectuer une recherche documentaire.
- Mot commun (stop word)
- Mot tel que article et pronom, non pris en compte par les moteurs de recherche lors d'une requête. Pour forcer le moteur de recherche à prendre en compte ces mots, on peut ajouter le signe + devant le mot ou mettre la phrase entre guillemets " ".
- Moteur de recherche
- Outil dédié à la recherche d'éléments tels que mot, image, produit...
Site offrant un service de recherche de sites internet et de documents au moyen de mots-clés. Les principaux constituants d'un tel moteur sont un robot ou spider, chargé de parcourir le web pour trouver les pages et les sites, un moyen de stockage et de classement des données collectées, un outil de traitement des requêtes de l'internaute. - Nom de domaine
- Identifiant d'une entité du réseau Internet. Le système de domaines sur Internet est hiérarchique, le plus haut niveau étant constitué des TLD (Top Level Domain), par exemple com net org fr, les niveaux inférieurs étant les noms de domaine utilisables. Dans ces derniers, des sous-domaines peuvent être définis, par exemple culture.gouv.fr est un sous-domaine de gouv.fr.
- Nuage de mots-clés (tag cloud)
- Concept de représentation d'un ensemble de mots-clés affectant à chaque mot-clé une taille proportionnelle à son intérêt ou à sa fréquentation. Ce principe permet une visualisation rapide des centres d'intérêts d'une personne ou d'une communauté.
- Open source
- Logiciel dont la distribution gratuite et l'accès au code source sont autorisés par le concepteur. Les avantages de ces logiciels sont la fiabilité, la sécurité, la pérennité, le confort d'utilisation et le coût. De nombreux logiciels sont distribués sous licence open source, par exemple Linux (système d'exploitation), Apache (serveur web le plus utilisé dans le monde), OpenOffice (compatible avec Microsoft Office), Firefox et Thunderbird (concurrents plus performants que Internet Explorer et Outlook), 7-ZIP (compresseur), etc.
- Optimisation
- Ensemble de techniques qui visent à obtenir le bon positionnement d'un site dans les moteurs de recherche. A l'opposé du spamdexing, l'optimisation, appelée également SEO, poursuit son but en utilisant des moyens légitimes.
- Page dynamique
- Page web générée automatiquement à partir d'une base de données. Ce terme désigne également une page modifiable d'un site statique, son intérêt étant la modification possible par un administrateur non spécialiste du web, à l'aide d'un simple navigateur.
- Pagerank
- Classement par Google d'une page web en fonction de sa popularité. Le principe est d'affecter à la page une note en fonction des liens qui pointent vers elle, un Pagerank élevé étant favorable pour le classement dans les résultats de recherche.
- Ping
- Commande informatique permettant de vérifier la connexion d'un serveur sur un réseau et de tester la qualité de la liaison. Cette commande envoie un message à l'adresse du serveur et mesure son temps de parcours jusqu'au retour à son point de départ.
- PPC (Pay per click)
- Publicité payante figurant dans les résultats des moteurs de recherche et sur certains sites web. Ce mode de publicité contextuelle est basé sur les mots-clés tapés par l'utilisateur et un paiement au clic, qui n'est déclenché que lorsque celui-ci clique sur le lien publicitaire.
- Podcast (balado)
- Elément diffusé au format audio ou vidéo sur Internet. Le podcasting (baladodiffusion) est le mode de diffusion correspondant des fichiers. Il est réalisé grâce à l'emploi de flux RSS qui permettent aux utilisateurs de télécharger des émissions audio ou vidéo dans leur baladeur numérique ou leur ordinateur pour une utilisation ultérieure.
- Portail
- Site web constitué de ressources et de services mis à la disposition des utilisateurs. Le but d'un tel site peut être de devenir une référence dans un secteur donné, de fédérer une communauté, éventuellement de monétiser son audience...
- Positionnement
- Rang obtenu par un site dans les résultats d'un moteur de recherche, à partir d'une requête sur un mot-clé. On considère qu'un site est bien positionné lorsqu'il figure dans les 2 premières pages (20 premiers résultats) d'un moteur de recherche.
- Référencement
- Action visant à rendre un site présent dans un annuaire ou dans un moteur de recherche. On emploie également le terme indexation.
- Référencement naturel
- Référencement à base de pratiques licites et recommandées par les moteurs de recherche. A l'opposé, le spamdexing est une technique de référencement illicite.
- Référencement natif
- Référencement réalisé lors de la conception ou de la refonte d'un site. Les meilleurs résultats sont obtenus par cette méthode en matière de positionnement.
- Référencement payant
- Référencement contre rémunération. Ce terme recouvre deux notions différentes, le référencement auprès d'annuaires et de moteurs garantissant un délai d'inscription et le référencement réalisé par un référenceur pour améliorer le positionnement d'un site web.
- Référencement publicitaire
- Système de promotion publicitaire auprès de moteurs de recherche, se traduisant par des liens commerciaux figurant dans les pages de résultats. Les liens commerciaux apparaissent généralement dans une colonne à droite des résultats naturels.
- Remote scripting
- Technique qui permet à un script local - dans le navigateur - d'échanger de l'information avec un site distant.
Au lieu de recharger la page complète après le traitement d'une opération, comme en HTML classique, le script local récupère l'information sur le serveur et la traite localement. Cela apporte de la rapidité d'exécution et de la fluidité dans la navigation. AJAX utilise la technique de remote scripting. - Robot (ou spider)
- Programme d'exploration automatique utilisé par les moteurs de recherche pour rechercher et indexer dans leurs bases de données les nouveaux sites, les nouvelles pages et les pages modifiées. Ces programmes - Googlebot, MSNBot, Slurp (Yahoo!), etc - laissent des traces de leur passage sur les sites, visibles dans les journaux de connexions (fichiers de log) et donc repérables dans les statistiques de fréquentation.
- robots.txt
- Fichier de texte placé dans le répertoire racine d'un site, utilisé pour contrôler le comportement des robots (indexation des pages, archivage, suivi des liens...) et contenant des directives lues et appliquées par les robots à chacun de leurs passages.
- RSS
- Protocole utilisé pour la mise à disposition de contenus web (syndication de contenu). Le principe repose sur l'inscription anonyme et volontaire de l'internaute à une page web pourvue d'un flux RSS. Il s'agit d'un fichier dont le contenu est produit automatiquement par le site en fonction de ses évolutions. Cette méthode, largement utilisée dans la diffusion d'actualités, permet à l'abonné d'être automatiquement informé lorsque la page en question est mise à jour. Ce même principe de flux RSS est utilisé par les podcasts et les vidéocasts, ce qui permet de charger les documents audio ou vidéo souhaités.
- SEM (Search Engine Marketing)
- Partie du web marketing qui s'applique spécifiquement aux moteurs de recherche. Ce marketing des moteurs de recherche comprend le Search Engine Optimization et le Pay Per Click.
- SEO (Search Engine Optimization)
- Partie du Search Engine Marketing (SEM) cherchant à optimiser un site web afin d'obtenir un bon positionnement dans les moteurs de recherche. Le SEO ou optimisation utilise des moyens de référencement naturel.
- Site statique
- Site constitué de pages HTML (ou XHTML) écrites "en dur" à l'aide d'un éditeur HTML. Un site statique est généralement mis à jour, hormis ses éventuelles pages dynamiques, par un prestataire ou une agence de communication car ses pages ne sont modifiables que via l'éditeur HTML, nécessitant par conséquent la maîtrise du langage utilisé.
- Site dynamique
- Site constitué de pages dynamiques.
Site dont le contenu est généré par un programme à partir d'une requête du visiteur. Les informations qui sont fournies au visiteur proviennent d'une base de données gérée par un administrateur. Celui-ci, à l'aide d'un navigateur, accède à son espace de gestion et remplit les champs d'un formulaire qui alimente la base de données. La maintenance d'un site dynamique peut donc être effectuée sans connaissances techniques. - Spamdexing
- Ensemble de techniques frauduleuses destinées à améliorer artificiellement le positionnement d'un site dans les résultats des moteurs de recherche. Les techniques de spamdexing (répétition de mots-clés, liens artificiels, pages satellites, cloaking...) sont connues des moteurs de recherche et combattues. Leur emploi par les utilisateurs présente un risque de blacklistage de leur nom de domaine.
- Statistiques de fréquentation
- Informations sur la fréquentation des pages d'un site web présentées de façon synthétique. Consultables en ligne, ces informations proviennent du traitement des journaux de connexions générés par le site. Elles sont livrées sous forme statistique, par heure, jour, semaine, mois, et fournissent des informations variées : nombre de visiteurs uniques, nombre de pages vues, page d'entrée et page de sortie, URL de provenance, mot-clé et moteur de provenance, durée de consultation, nom et version du navigateur utilisé, pays d'origine, etc.
- Stop word
- Voir Mot commun
- URL (Uniform Resource Locator)
- Adresse textuelle qui identifie l'emplacement d'une ressource sur Internet. L'URL est composée du protocole utilisé pour accéder à la ressource, (http, https, ftp, mailto...) et du nom de serveur, par exemple ventsolaire.net.
- Usabilité
- Propriété d'un site permettant une utilisation efficace, efficiente et satisfaisante. Il s'agit pour l'internaute d'atteindre le résultat prévu (obtenir l'information, commander le produit, identifier l'interlocuteur...), sans difficulté, rapidement et de façon agréable.
- Validateur
- Outil effectuant une vérification de conformité par rapport à un référentiel. Des validateurs existent pour tous types de documents et d'éléments, langages HTML et assimilés, CSS, normes d'accessibilité, adresses e-mail, etc.
- W3C (World Wide Web Consortium)
- Organisation internationale en charge des normes de l'Internet. La normalisation porte sur des sujets variés tels que les langages textuels, mathématiques et graphiques, le multimédia, les protocoles d'échange, la sécurité, le cryptage des données.
- Web 2.0
- Concept de présentation d'informations sur Internet se caractérisant par la mise à disposition de l'utilisateur d'interfaces riches, permettant une interactivité accrue et une personnalisation. L'avènement du web 2.0 est lié à une dimension sociale de l'Internet et a été permise par l'utilisation d'AJAX.
- Web marketing
- Partie du marketing s'appliquant à l'Internet, couvrant un vaste domaine d'activités principalement centrées sur la stratégie, le trafic et la fidélisation. L'enjeu majeur du positionnement des sites sur les résultats des moteurs de recherche fait l'objet d'une discipline à part entière, le SEM (Search Engine Marketing).
- Web sémantique
- Principe d'un web qui a du sens, c'est-à-dire dont les contenus sont associés à des métadonnées décrivant clairement les contenus en question, et qui est basé sur la séparation entre le contenu et sa mise en forme. L'avantage du web sémantique est de garantir la pertinence des recherches d'information et l'accessibilité des documents. Le moyen de disposer de contenus sémantiquement corrects est de respecter les normes du web édictées par le W3C, telles que le langage XHTML et les feuilles de style CSS.
- Widget
- Petite application utilisable depuis le bureau d'un ordinateur, permettant à l'internaute d'accéder directement à ses informations favorites sans devoir ouvrir son navigateur.
- Wiki
- Système de gestion de contenu (voir CMS) présentant la particularité d'être ouvert à tout participant et modifiable librement. L'exemple le plus célèbre est l'encyclopédie Wikipédia.
- XHTML
- Langage à base de balises permettant de publier des contenus web.
Le XHTML, issu du HTML, est utilisé essentiellement comme base du web sémantique pour la description des contenus, en association avec des feuilles de style CSS dédiées à la présentation.


