Créer un fichier des occurrences
(Menu Index)
Ce dialogue apparaît quand la commande Créer un fichier des occurrences est sélectionnée depuis le menu Index. Le but de cette commande est de créer une liste des mots indexés avec leurs fréquences.
Le nom du fichier de destination est entré directement dans le champ Fichier cible, ou créé avec une boîte de dialogue d'enregistrement en utilisant le bouton Parcourir. L'extension de ce fichier est normalement .TXT.
Le champ Pourcentage... est utilisé pour limiter la liste des mots aux plus communs. Une valeur de 0 (zéro) signifie que tous les mots sont à inclure, tandis qu'une valeur de 100 ne prend en compte que les mots qui sont apparus dans tous les fichiers.
En combinant cette commande avec la commande Importer des mots à ignorer, vous disposez d'une bonne façon de produire une liste personnalisée de mots très fréquents à ignorer.
NB : La version française de Wilbur est livrée avec deux fichiers de mots à ignorer déjà prêts à être utilisés : skip.txt pour le français, et skip_english.txt pour l'anglais.
Un clic sur OK créera le fichier et un message annoncera la fin de l'opération. Le fichier cible ainsi produit est un fichier texte ordinaire comportant un mot par ligne suivi par une virgule et le nombre de fichiers où il apparaît, puis une autre virgule et finalement le nombre approximatif total des occurrences du mot dans tous les fichiers. Cela peut donner quelque chose comme :
anthropologie, 110,681 philosophie, 110,109 histoire, 110,213 littérature, 110,218 théâtre, 113,3280 musique, 112,111
...
Ce format de fichier, dans lequel les différentes valeurs d'une même ligne sont séparées par une virgule, peut être facilement importé dans un tableau ou dans une base de données.
|