|
Présentation
:
Chercher sur le net est parfois synonyme de chercher une aiquille
dans une botte de foin. L'information n'est souvent pas facile
à dénicher soit car rare (peu de pages parlent
du sujet en question) soit car elle est perdue parmi de milliers
de pages qui traitent de sujets proches ou qui utilisent des
mots-clés similaires. Je vais essayer ici d'expliquer
ma méthode pour trouver une information efficacement
sur internet.
Mes conseils :
Préparation
: se constituer un arsenal d'outils
Ce dont vous avez besoin pour des recherches efficaces, c'est
un arsenal d'outils prêts à l'usage (installés
sur votre ordinateur et que vous avez déjà testés).
Les outils de recherche sur le net sont :
-
les moteurs de recherche (et annuaires)
Aujourd'hui, le plus puissant des moteurs est sans
équivoque Google.com,
qui permet de chercher à la fois dans le texte (des
pages web), des images, des news et dans les messages des
groupes de discussion (newsgroups) -- ancienne fonctionnalité
de Deja.com. Même si c'est seulement après avoir
exploiter les résultats de Google qu'il est nécessaire
de se pencher sur d'autres moteurs, il est bon de connaître
et d'avoir sous la main 2 ou 3 autres moteurs. Dans certains
endroits, cela est même obligatoire : en Chine par exemple
Google est souvent bloqué par le gouvernement ! Abondance.com
vous donne une liste complète des moteurs de recherche
et annuaires, et leurs spécificités.
Notes :
- Yahoo utilise le même index que Google, donc n'attendez
pas de résultats très différents avec
Yahoo.
- Il est possible d'utiliser des software spéciaux
(à installer) qui rassemblent les résultats
de divers moteurs. Copernic
est un bon exemple.
Astuces sous Google :
- Pour gagner du temps, ne cliquez pas directement sur les
liens des résultats affichés par Google, mais
(sous Windows) faites un click-droit et "Ouvrir le lien
dans une nouvelle fenêtre"; ainsi vous pouvez ouvrir
plusieurs résultats à la suite et quand vous
regarderez la première page ouverte, les autres finiront
de se télécharger.
Cette fonction d'ouverture dans une nouvelle fenêtre
peut se paramétrer dans les Préférences
Google (spécifiques à l'ordinateur que vous
utilisez) mais les résultats ont tendance à
s'ouvrir toujours dans la même fenêtre, ce qui
n'est pas pratique.
- Google propose d'accéder au cache des pages, ce qui
signifie que si en cliquant sur l'un des résultats
de votre recherche et vous tombez sur "Page cannot be
displayed", revenez à la liste des résultats
de Google et cliquez sur le lien Cache de la page en question.
C'est très puissant, cela permet de retrouver trace
d'informations effacées sur le serveur d'origine !
- Avec Google vous pouvez utiliser différentes astuces
syntaxiques pour filtrer vos résultats. Ces astuces
sont listées ici.
Les plus utiles sont peut-être les guillemets qui permettent
de chercher des groupes de mots exacts et le signe "moins"
qui permet de retirer toutes les pages proposant un mot de
la liste des résultats (par exemple '-sexe' va supprimer
la plupart des pages pornographiques d'une recherche qui ne
l'est pas).
-
newsgroups & forums
Il y a différents moyens d'accéder
aux Newsgroups : par son navigateur, au travers de pages web
(comme avec Google dans l'onglet "Newsgroups"),
ou bien via un logiciel (par exemple Outlook Express vous
propose cette fonctionnalité d'accès aux groupes
de discussion). La recherche au sein de Newsgroups peut être
fastidieuse et amener beaucoup de réponses "dépassées"
(datant de nombreuses années), le plus simple est parfois
de poster un message dans un forum "dynamique" et
de demander aux autres utilisateurs si ils peuvent vous aider.
Pour cela il faut connaître quelques bons groupes de
discussion qui marchent bien.
Le problème est le même avec les forums, il s'agit
de connaître les bons forums "qui bougent bien"
sur le sujet qui vous intéresse. Personnellement lors
de recherches j'utilise les Newsgroups et Forums sur les sujets
que j'affectionne particulièrement, car je connais
déjà les adresses des bons Newsgroups ou Forums.
-
e(mail)-correspondants
Votre réseau de correspondants internet peut
aussi être un excellent moyen pour répondre à
une question... parfois on les oublie ! Et si vous pensez
que ca ne marche pas, c'est que vous devez développer
ce réseau et vous créer de nouveaux contacts
!
-
web chatrooms & chat logiciel
Pour discuter en ligne avec des internautes, vous
pouvez soit aller sur des sites qui proposent cette fonctionnalité
(il faut trouver des sites en rapport avec le sujet de votre
recherche), ou bien utiliser l'un des logiciels suivants:
ICQ, MSN Messenger, Yahoo Messenger, AOL Instant Messenger,
IRC. Personnellement, j'utilise Trillian qui fusionne l'interface
de chacun de ces logiciels en une seul interface, c'est pratique
et permet d'être connecté à tous ces canaux
en un click.
-
P2P Software
Pour trouver des ebooks, vidéos ou de la
musique, les logiciels P2P (Peer-to-peer) sont efficaces.
Les plus célèbres sont Naptster, Kazaa, WinMX,
Gnutella, etc. et le nouveau Tesla.
 |
Moteurs
de recherche : choisir les bons mots-clés
Le problème qu'ont la plupart des internautes lorsqu'ils
effectuent des recherches via des moteurs, est une liste de
sites ne correspondant pas à leurs attentes. La raison
est 9 fois sur 10 un mauvais choix des mots-clés. Des
mots-clés trop génériques vous amèneront
trop de sites avec peu de corrélation avec ce que vous
cherchez. Trop de mots-clés précis vous amèneront
une liste de résultats vide.
Pour choisir de bons mots-clés, vous devez :
- essayer d'identifier "un mot-clé efficace",
en trouvant un mot qui soit suffisamment rare pour donner
des résultats limités et liés au sujet
de votre recherche.
Par exemple, si vous cherchez une table de traduction de caractères
coréens, le mot "romanization" est exactement
ce dont vous avez besoin: peu commun, il est utilisé
exactement pour décrire ce que vous cherchez.
Requête : romanisation
table coréen
- utiliser des mots non ambigus, i.e. choisir
des mots qui n'ont pas de double sens, et si ils en ont, essayez
de les préciser avec un autre mot (si le couple de
mots alors formé est une expression commune, utilisez
les guillemets autour de cette expression).
Par exemple, si vous cherchez des infos sur
une société produisant des émissions
de divertissements qui s'appelle Case Production, le mot "case"
et le mot "production" sont trop génériques,
mais la combinaison...
Requête : "case
production" divertissement
- penser aux mots qui figureront dans la page que
vous cherchez. Il faut imaginer le contexte où l'information
peut être trouvé.
Par exemple, si vous cherchez les paroles de la chanson "Music"
de Madonna, dans la mesure où à la fois l'auteur
et le mot utilisé pour le titre de cette chanson sont
très courants, ajoutez une des phrases de la chanson.
Requête : music
madonna lyrics "I wanna dance with my baby"
- filtrer en ajoutant/enlevant des mots-clés
à votre requête.
Par exemple, si vous cherchez des informations sur un livre
de stratégie rare écrit par Toshishiro Obata,
vous allez peut être commencer par "toshishiro
obata" mais pour supprimer les sites qui ne parlent que
d'infos générales sur ce maître de Shinkendo,
vous allez ajouter :
Requête : "toshishiro
obata" +strategy +book
Note : le + est ici inutile avec Google (il l'est avec
d'autres moteurs pour forcer à ce que les mots soient
dans la page recherchée), il est mis pour souligner
le fait que vous ne souhaitez que les pages où vont
apparaître les mots en question.
 |
Surf
: Comment exploiter une information pour poursuivre les recherches
Lorsque vous aurez trouvé des informations relatives
à ce que vous cherchez, mais que vous souhaitiez trouver
encore plus d'infos, vous pouvez :
- explorer plus en profondeur le site, par différents
moyens, suivre tous les liens, absorber le site avec un Offline
Browser afin d'utiliser la fonction de recherche locale
Windows sur l'ensemble des pages du site, etc. Une technique
à essayer est de supprimer le nom du fichier qui apparait
dans l'adresse de la page (le dernier mot avant le dernier
/) afin de voir si la liste des fichiers du répertoire
s'affiche. Parfois cela permet d'accéder à des
pages qui ne sont pas utilisées dans le site. Vous
pouvez remonter ainsi dans l'arborescence du site et explorer
les fichiers du site.
- emailler le webmaster du site et lui poser les questions
qui appellent votre recherche, ça ne coûte rien
et parfois on obtient des réponses intéressantes.
- et surtout, lorsque vous avez obtenu des précisions
sur l'information que vous cherchez, réutiliser cette
information pour préciser la requête adressée
au moteur de recherche !
 |
Chercher
à l'intérieur d'une page web
Cette astuce est triviale mais j'ai tellement vu de personnes
ne pas l'utiliser... sur internet on tombe régulièrement
sur des pages avec de longs textes, dans laquelle l'info précise
que vous cherchez s'y trouve peut-être, ou peut-être
pas. Dès que la page est chargée (voir même
pendant qu'elle se charge), utilisez la fonction de recherche
de votre navigateur (Control-F pour Internet
Explorer) afin d'aller directement au mot-clé qui vous
rapprochera de la solution et vous permettra rapidement de
juger si la page est intéressante ou pas.
 |
Regarder
dans le source de la page
Regarder le source d'une page web (Menu Affichage/Source
pour Internet Explorer) signifie regarder le code de la page.
Ca peut être effrayant pour les non-initiés,
mais cela peut pourtant être utile. Si vous connaissez
un peu le HTML, cela peut par exemple vous permettre de voler
n'importe quelle image même protégée par
le site. Pour les non techniciens, cela peut aider à
retrouver le nom/email du webmaster, dans les premières
lignes de la page, ou de voir les mots-clés associés
à la page (ça peut donner des idées)
-- tout cela est dans les tags <meta name=...>.
Pour voir toutes les adresses emails de la page (parfois cachées
dans des liens ou des formulaires), faites une recherche du
caractère @ dans le source de la page.
 |
Chercher
en multilingue
L'une des limitations de votre recherche est la ou les
langues que vous maîtrisez. Mais vous n'avez pas besoin
de parler une langue pour chercher une info dans cette langue!
Aujourd'hui de nombreux "assistants à la traduction"
peuvent immédiatement (et gratuitement) traduire une
page web pour vous. Bien sûr le résultat de la
traduction n'est pas très précis et les erreurs
nombreuses rendent le texte traduit difficilement exploitable
directement (puisque ce ne sont encore que des assistants
à la traduction et non des traducteurs). Mais la traduction
effectuée peut donner une bonne idée de ce la
page raconte, et si il vous parait que la page possède
l'info que vous souhaitez, pourquoi ne pas emailler le webmaster...
en français ou anglais !
Assistants de traduction en ligne : AV
Babelfish, Systran,
Reverso,
WordLingo,
Google
linguistic tool, etc.
 |
 Exemple
de cas : Bwang, un art martial de Micronésie
Voici un exemple concret d'enquête sur le net,
qui m'est arrivé il y a quelques années. A la
rédaction du magazine Karate-Bushido, le rédacteur
en chef, Patrick Lombardo évoqua un art martial dont
il avait eu ouï-dire il y a longtemps et n'avait plus
de nouvelles... il était appelé Bwang. Impossible
de trouver quoique ce soit dans toutes les ressources de la
salle de rédaction. De retour chez moi, je décidais
d'explorer le net (à l'époque, il n'y avait
pas internet dans les bureaux, c'était le début).
Google n'existait pas et c'était Altavista
qui était le plus efficace des moteurs de recherche.
Mais une recherche sur bwang
ne donnait que des liens sur des personnes s'appelant B.Wang
ou des choses dans le genre. Pour filtrer ces résultats,
j'ajoutais un mot-clé non ambigu, requête: bwang
martial, et obtins un nombre limité de pages (2
pages de résultats). Certaines pages racontaient que
des Mr B.Wang avaient fait des arts martiaux dans leur jeunesse...
et une seule page avait un rapport avec ce qui m'intéressait.
Cette page était une page HTML simplissime, sans lien
ni image, il s'agissait d'une bibliographie (http://www.uog.edu/up/micronesica/indexes/toc.htm,
aujourd'hui la page a bien changée, mais elle existe
toujours). Parmi ces références, un article
listé s'intitulait "Bwang, A Martial Art of
the Caroline Islands, par William A. Lessa & Carlos G.
Velez-I". C'était une info très intéressante
car elle confirmait que Bwang était la bonne orthographe
et me donnait des infos supplémentaires pour élargir
la recherche (noms de personnes). Une des méthodes
pour affiner les recherches aurait pu être de faire
des recherches sur ces messieurs Lessa et Velez. Ce que je
fis fut de regarder le source de la page et de trouver le
nom de la personne l'ayant créée. Il n'y avait
pas d'email. Alors, j'effaçais le nom du fichier HTML
de l'adresse URL (http://www.uog.edu/up/micronesica/indexes/).
Le site était celui de l'Université de Guam,
une île de Micronésie. En remontant dans le site
web, je parvins à trouver une liste du personnel de
cette université, avec leurs emails. Alors il fut facile
de contacter le webmaster et de lui demander une photocopie
de cet article de Micronesica, the Journal of the University
of Guam (vieux de 1978), que j'obtins rapidement par
la poste, moyennant les frais de port.
Note : les résultats des moteurs de recherche ont
bien entendu changé aujourd'hui, d'autant que mon site
et ceux de personnes ayant visiblement lu mon histoire apparaissent
maintenant dans les résultats. De plus le site de l'Université
de Guam a (fort heureusement) bien changé depuis cette
époque.
|