Chargement en cours . . . 
COURRIER

 télécharger / imprimer la page...
page précédente...
dossiers, lexiques, textes, ...
la dissertation, le commentaire...
mises à jour, projets...
moteurs de recherche...
Philia [accueil]
   Mots clés :
Moteur actif Cléphi  
courrier - contacter - Philia -
Vous êtes ici :

 La messagerie de Philia
 COURRIER

édition originale 16-03-2003
actualisée le 12-05-2008

WILBUR sur le net ?...
04/02/2006

Cette demande de Philippe Muniesa : "Je suis co-modérateur d'une liste de diffusion d'experts-comptables, et nous souhaiterions disposer d'un site INTERNET intégrant un moteur de recherche permettant d'accéder aux mails et aux pièces jointes (PDF, Excel, Word) sur les archives, et à partir de mots clés. Wilbur pourrait-il être utilisé de cette façon ?? Merci d'avance."

=> 06/02/2006 : Bonjour Philippe. Je comprends fort bien votre demande : mettre à la disposition des usagers de votre site la puissance de Wilbur, que vous avez apprécié d'utiliser, leur fournissant ainsi un bon moteur de recherche. Comme vous le savez probablement, je ne suis pas le créateur de cet outil (juste le traducteur français)... Toutefois votre demande me paraît impossible à satisfaire - à moins de parvenir à exploiter les bases de données constituant les index de Wilbur, ce qui me paraît bien compliqué. Sachez toutefois que le même auteur a créé un autre programme, nommé Wilma, qui pourrait probablement satisfaire votre demande. Je dis bien probablement, car je ne l'ai pas personnellement testé... Voyez la page Wilma chez Redtree.

...Mais : pourquoi cherchez-vous à confier cette tâche à un programme alors qu'il est possible de la confier à un moteur de recherche ? Plusieurs solutions alternatives sont en effet envisageables :

  1. Les moteurs internes. Il faut toutefois distinguer 2 types de moteurs internes :

    1. Les moteurs intégrés au site que vous (co-)gérez. Cela implique presque toujours de se mettre à la programmation. Par exemple, Philia utilise Zoom, qui est désormais disponible en shareware (mais dont j'utilise une source PHP empruntée à une précédente version freeware) et Clephi, un moteur programmé en PHP lui aussi, mais "fabriqué maison", et qui utilise exclusivement les mots clés (balises "meta keywords" des documents web). Aucun des deux, toutefois n'est vraiment bien adapté à l'indexation de fichiers aux formats "propriétaires" : DOC de MS Word, et PDF (le pire des formats ?) d'Adobe, en supposant (?) que ces formats soient vraiment bien adaptés à votre projet (ce qui n'est pas certain, notamment en ce qui concerne le format Word, vecteur d'infections virales bien connues...).

    2. Les moteurs que l'on pourrait dire "déportés". Dans ce dernier cas, votre moteur est situé sur un site distant du vôtre. Ainsi avez-vous peut-être remarqué que Philia exploite les possibilités offertes gratuitement par X-Recherche (au Canada). Cette offre pourrait prendra hélas fin dans un an (en janvier 2007), mais pourrait peut-être, temporairement, vous rendre service : ce moteur permet en effet d'explorer les documents de votre site en HTML et dérivés (notamment : PHP), DOC et PDF. Il suffit de créer un compte, et de lancer l'indexation. Quelques minutes plus tard, tous vos documents sont reconnus. Il existe bien sûr d'autres moteurs de ce type, par exemple : Antinea (en français) ou PicoSearch (dont il existe une mouture gratuite, ne reconnaissant pas les DOC et autre RTF).

  2. Les moteurs externes. Il s'agit des moteurs "classiques", Altavista, Google, etc. Cette solution est entièrement gratuite elle aussi. Elle présente toutefois, outre la publicité, un inconvénient : le moment de l'indexation dépend d'un "robot"... avec lequel il est impossible de converser ! On ne peut donc pas imposer une indexation après ajout de nouveaux documents. Mais si votre site n'est pas modifié tous les jours, c'est une solution, toute simple, et néanmoins efficace. Votre site, par exemple, est déjà référencé par Google. J'ai vérifié : allez chez eux, puis tapez (sans les guillemets) : "site:votre_site.com", et vous aurez une idée du nombre de pages déjà indexées par le "googlebot". Dès lors, pourquoi ne pas proposer un petit formulaire de recherche du genre :

    <!-- Début du formulaire Google -->
    <form method=get action="http://www.google.com/search">
    Rechercher sur ce site :<br>
    <input type=hidden name=ie value=windows-1252>
    <input type="text" size="20" name="q" VALUE="">
    <input type=hidden name=sitesearch value="votre_site.com">
    <input type=hidden name=hl value=fr>
    <input type="submit" name="mmt" VALUE="Chercher"> avec <i>Google</i>
    </form>
    <!-- Fin du formulaire Google -->

    ...Testé. Cela fonctionne très bien. Il vous suffit de copier / coller ce code dans votre page, et de remplacer votre_site.com par l'adresse de votre site (sans l'en tête http://).

    Vous pouvez bien sûr préférer un autre moteur. Mozbot, par exemple - est basé sur Google, mais propose des fonctionnalités supplémentaires. A vous d'expérimenter.

Pour terminer, je me permets de vous faire un - aimable - reproche, ainsi qu'une petite mise en garde ;-)

  • Sur votre page d'accueil Wanadoo (what do you do at Wanadoo !?), vous avez introduit des caractères plus ou moins cachés, codés en blanc. Il ne faut pas : comme avec les mots clés (balises "meta keywords" des documents web), il faut éviter les répétitions, car si vous "trichez" ainsi, et que vous êtes "repéré", votre site risque d'être radié des moteurs de recherche, ce qui est certainement le contraire de l'effet... recherché ;-(

  • Votre site dévoile des adresses emails : il ne faut pas, car elles seront inévitablement repérées et recopiées par les "spambots" qui rôdent en permanence sur la toile, et vous serez alors bien vite envahi - si ce n'est déjà fait - par des messages non souhaités (spamming, infections...). Croyez-en mon expérience. Utilisez plutôt des formulaires ne laissant pas apparaître en clair votre adresse email (codes cgi ou perl...).

Avec mes...


-: Amitiés :- P h i l i a.

Référence du message : ID 093

 messages et formulaire...
 précédent... |      Lire      |  suivant...
| Intervenir |
 intervenir...



Moteur actif : Cléphi

changer le moteur =>  Cléphi  | Zoom | X-Recherche | aide

 remonter



            


 - Contrat Creative Commons (certains droits réservés) -



- Encyclopédie -