Recherches sur la toile

Le web est certainement la plus vaste base de données au monde. Encore faut-il savoir comment y trouver les informations qui nous seront utiles. Peut-on avoir estimation raisonnable de la pertinence des informations trouvées ?

Il y a traditionnellement deux manières de faire des recherches sur la toile : les moteurs de recherches et les annuaires.

Ajoutons à ces méthodes l'utilisation de marque-pages ou boomarks ( aussi appelés favoris ou signets suivant le navigateur utilisé) pour épinglez les adresses que nous jugeons utile d'enregistrer dans notre navigateur ou sur un site spécialisé dans le partage des marque-pages (social bookmarking) ce qui permet de retrouver ses marque-pages où que l'on soit, à la maison ou au travail.

Moteurs de recherche

Le plus connu des moteurs de recherche est actuellement Google. 90% des recherches dans le monde ( plus d'un milliard de requêtes par jour) passent par Google. D'autres moteurs de recherche existent encore : altavista, fr.search.yahoo.com, alltheweb, hotbot, etc... . Bien que moins connus ils peuvent parfois donner des résultats ignorés par Google.

Les services des moteurs de recheche sont rémunérés par la pub.
Google domine nettement le marché. La réplique de Microsoft s'appelle Bing . L'avenir nous dira si ce dernier parviendra à convaincre une part des internautes.

Les moteurs de recherches mentionnés ci-dessus font dans la sobriété. Il en existe d'autres qui se présentent plutôt sous la forme de portails. La zone de recherche, souvent placée en haut de la page, y est suivie d'un certain nombre d'amorces d'articles et de divers liens souvent futiles. On choisira l'une ou l'autre de ces formules, la présentation sobre ou le portail, selon qu'on veut se documenter ou ... se distraire.

Moteurs de recherche

Portails

Quelques annuaires
généralistes

Méta-moteurs

Méta-moteurs

Les méta-moteurs (meta search enguine) sont des outils de recherche transmettent les requêtes vers plusieurs sources d'informations, moteurs de recherche et annuaires. Les meilleurs méta-moteurs trient les résultats selon leur pertinence, éliminent les doublons et associent les pages web qui ont plusieurs mots clés en commun pour classer les résultats par catégories.

 

Recherche par mots clés

Les moteurs de recherche trient et sélectionnent les pages web à partir de mots clés.
Ces mots clés, et les pages qui leurs sont associées, sont stockées dans d'immenses bases de données et organisées selon des algorithmes jalousement gardés par leur concepteurs ou plus exactement par les sociétés qui les ont rachetés.
C'est la qualité de ces bases de données qui fonde la pertinence des informations trouvées.

Syntaxe pour la saisie des mots clés

Tapez une série de mots clé séparés par des espaces pour obtenir toutes les pages qui contiennent tous, ou du moins la plus part de ces mots.

=> 37.800 pages trouvées

Pour obtenir les pages qui contiennent toutes ces trois mots, faites précéder du signe + les mots ajoutés au sans laisser d'espaces entre les + et les mots additionnels

=> 15.500 pages trouvées

Si par contre vous cherchez à obtenir la chaîne de caractère « panda miel vélo », il faudra indiquer celle-ci entre guillemets.

  Informations  Aucun résultat trouvé pour "panda miel vélo".

Les guillemets s'utilisent pour la recherche d'expressions exactes, une citation par exemple :

=> 40.400 pages trouvées

Supposez que vous vouliez rechercher des informations sur les pandas, le seul mot clé panda vous donnera trop de résultats. Ajoutez d'autres mots clés pour mieux cibler votre sujet. Ex : «panda géant»

Il est aussi possible de demander de soustraire des résultats les pages qui ne vous concernent pas.
Ex : Panda -Fiat Le signe moins '-' est précédé d'un espace et suivi directement du mot qui ne devrait pas figurer les pages recherchées.

Les caractères génériques :
Vous y avez sûrement déjà eu recours pour la recherche de mots dans un texte avec un traitement de texte par exemple. Les caractères génériques, parfois appelés jokers, sont l'astérisque et le point d'interrogation. ( * ? )
L'astérisque remplacer n'importe quelle chaîne de caractère tandis que le point d'interrogation est censé représenter un caractère quelconque.   !!! Ces caractères génériques ne sont que rarement compris par les moteurs de recherche.

Les moteurs de recherches proposent aussi une autre syntaxe basée sur les opérateurs logiques OU, ET, NON ou encore AND, OR, NOT.  Ils permettent de faire à peu près la même chose que les opérateurs + et - mais sont moins parlants pour qui ceux qui n'y sont pas habitués. Pourquoi alors faire compliqué quand on peut faire simple ?

Les moteurs de recherche sérieux proposent une option "Recherche avancée" pour affiner vos recherches. Chacun propose des conseils de recherche qui lui sont propres. Consultez l'aide, elle est spécifique à chaque moteur.

Dernier conseil :
Ne vous laissez pas distraire !   Si au passage vous rencontrez des informations intéressantes mais qui ne sont pas celles que vous cherchez, ne vous y attardez pas. Sans cela vous passerez des heures à lire tout et n'importe quoi sans jamais trouver ce que vous recherchez.

Annuaires

Les annuaires répertorient non pas les pages mais les sites.

Exemple : http://www.dmoz.org/
Ces répertoires sont constitués par des "netsurfers" humains. Il y a donc une réelle sélection des sites trouvés contrairement aux moteurs de recherche pour lesquels la recherche des pages est automatisée.

Les sites indexés par les annuaires y sont enregistrés pour leur qualité. On pourrait donc utiliser un annuaire pour toutes les recherches générales et ne passer aux moteurs de recherche que pour les questions plus précises.

Quand la recherche n'aboutit à aucun résultat, l'annuaire vous propose un ou des moteurs de recherche vous permettant de poursuivre votre requête sans devoir la reformuler.

Exemple:   www.dmoz.org   Open Directory Project

Adresses Internet d'entreprises et d'associations

Vous voulez cherchez une info sur le site de la RTBF ou l'horaire des trains sur le site de la SNCB.

Inutile de chercher longtemps après l'adresse de ces sites. Essayez de suite dans la barre d'adresse www.rtbf.be ou www.sncb.be. Même si l'adresse n'est pas tout à fait correcte il y a des chances que l'adresse du site recherché s'adaptera toute seule. Rappelez-vous la signification des suffixes tels que ".com", ".gov", ".edu", ". org" etc. Comprenez-vous la différence qu'il y a entre les adresses   www.wwf.com   et   www.wwf.org ?

Recherche dans une page

Il n'est parfois pas suffisant de trouver la page qui aborde un sujet qui vous intéresse.  Le document trouvé est parfois trop volumineux. Servez-vous alors de l'outil de recherche dans le document.  Editer > Rechercher... Ctrl+F

Les sites spécialisés

Toute recherche dans le domaine informatique vous conduira tôt ou tard sur un article du site www.commentcamarche.net     Les sites de ce genre sont à la fois des portails et des annuaires spécialisés. Il en existe dans toutes sortes de domaines.

Wikipédia

Wikipedia est une encyclopédie libre, contributive et multilingue. Le nombre de sujets qui y sont présentés croît sans cesse. Tout le monde peut participer à sa rédaction. Ce n'est donc ni un moteur de recherche, ni un annuaire, mais on s'y réfèrera pour avoir une première explication souvent très didactique sur un sujet précis.

Il faut toutefois savoir qu'à propos de certains sujets tels que la politique, les philosophies, les religions ou même l'histoire, les explications pourront être orientées en fonction des opinions des auteurs des articles et manquer de la neutralité que devrait avoir une encyclopédie réelle.   Voyez ce blog à ce sujet.



Propositions de sites pour ceux qui veulent aller plus loin


XHTML	1.0	validé! CSS validé!