Page de Nicolas Georgehttp://www.eleves.ens.fr/home/george/info/anti_tdt.html

Les problèmes des traitements de textes

Table des matières

Introduction

Incontournable à la maison, inévitable au bureau, fourni avec tout ordinateur grand public, c'est le traitement de textes. Cet outil est désormais devenu parfaitement naturel pour tous ceux qui se servent d'un ordinateur, à un tel point que la pluspart des gens n'immaginent pas d'autre moyen de taper du texte. Et pourtant, cet outil a plusieurs défauts. Certains tiennent aux spécificités techniques des traitements de textes, d'autre au concept même qui préside à la conception de cet outil.

Ce que j'entends par «traitement de textes»

Au départ, les traitements de textes étaient des machines à écrire un peu plus évoluées que les autres. Ce n'est évidemment pas de cette sorte de traitements de textes que je parle, ni même des tous premiers logiciels de ce type sur ordinateurs. Non, je parle ici des traitements de textes récents, ceux qui se clament «WYSIWYG», «What You See Is What You Get» - encore que cette notion ne soit déjà plus toute jeune, à l'échelle de temps de l'informatique - c'est à dire les logiciels qui prétendent présenter à l'utilisateur son document en permanence tel qu'il sortirait sur l'imprimante.

Les problèmes techniques

Les problèmes que je vais évoquer ici ne sont pas une fatalité. Ils tiennent juste à la manière dont sont faits les traitements de textes actuels.

Le format des fichiers

Les fichiers informatiques sont, au plus bas niveau, une suite de nombres entre 0 et 255. Il existe des normes internationnales décrivant une correspondance entre ces nombres et les symboles nécessaires pour taper du texte. Ceci est possible parcequ'il ne s'agit que d'énumérer un nombre relativement restreint d'objets n'ayant pas de structure particulièrement complexe. En revanche, ce que peut faire un traitement de texte est beaucoup plus complexe, et s'enrichit rapidement et de manière imprévisible. Il n'est donc pas possible de normaliser la manière de le coder un document produit par un traitement de textes (il est en revanche possible d'avoir des standards pour le résultat, c'est à dire un texte bien présenté, mais qui n'es plus éditable).

En conséquence, chaque traitement de textes utilise son propre format pour archiver des textes. C'est un fait (en fait, on pourrait immaginer de standardiser les fonctionnalités universelles, en laissant la place à des extensions, mais ce n'est pas le cas). Mais il y a un autre fait, qui lui n'est pas une fatalité, c'est que ces logiciels ne sont jamais accompagnés d'un descriptif technique du format qu'ils emploient, et qu'un tel descriptif n'est pas non plus disponible par un autre moyen.

L'utilisateur lambda, à qui s'adresse ce texte, va dire maintenant : «mais qu'est-ce que ça peut me faire, qu'il ne soit pas possible d'obtenir un descriptif technique du format ?». Il est vrai que ça n'empêche pas de taper du texte. Mais les textes tapés avec un traitement de textes ne sont pas uniquement destinés à être imprimés sitôt finis, point final. Ils peuvent aussi être archivés, ou transmis à d'autres personnes.

Les problèmes liés à l'archivage

Un premier problème est que les traitements de textes ont tendance à stoquer avec le texte et sa mise en page une quantité assez hallucinante de donnés. Là encore, ce n'est pas une fatalité, mais une constatation. La raison est double. D'une part, le concept est de cacher à l'utilisateur tous les mécanismes internes. En conséquence, le programme doit se débrouiller pour deviner ce qui est une information utile, et ce qui ne l'est pas. Et comme un ordinateur est quelquechose de fondamentalement stupide, dans le doute, il va simplement tout sauver. En outre, la pluspart des traitements de textes sont conçus de sorte que l'utilisateur puisse modifier le contenu des fichiers de style communs. Ils sont alors obligés, dès la création d'un nouveau doccument, de recopier la totalité des informations par défaut dans le document lui-même.

Ensuite, il y a le problème de la relecture. Un document crée avec un logiciel ne pourra être ensuite relu qu'avec un traitement de textes compatible. Et là, plusieurs difficultés peuvent apparaître:

Enfin, il a le problème de la fiabilité du support. Tous les moyens d'archivage s'usent. Il n'est pas du tout impossible qu'un jour une partie d'un document se retrouve illisible. Les formats employés par les traitements de textes comportent en général peu de points de repère. Si une altération intervient, elle peur rendre illisible une beaucoup plus grande partie que celle sur laquelle elle porte, alors que l'information est toujours présente. Un informaticien habile (il y en a toujours un très serviable à proximité), s'il est au courrant du format, peut arriver à réparer. Mais voilà, il ne l'est pas, au courrant du format.

Les problèmes liés à l'échange de données

J'ai déjà évoqué le problème de la taille exagérée des fichiers issus d'un traitement de textes. Je tiens à ajouter deux points. D'une part, un texte de la taille de Notre-Dame de Paris tient parfaitement sur une seule disquette, et pourtant, on a souvent du mal à y faire tennir un document d'une centaine page produit par un traitement de textes. Avouez que c'est gênant, quand on doit transporter un document, surtout si on ne sait pas couper des fichiers en morceaux. Il y a aussi le fait que les données sont de plus en plus en plus échangées par réseau, et que les fichiers volumineux sont un handicap pour ceux qui n'ont pas un accès très rapide.

De plus en proposant à vos correspondants des documents sous un format produit pas un traitement de textes, vous lui imposez, en supposant qu'il a envie de vous lire, de possèder un traitement de textes compatible. Comme souvent seuls les traitements de textes émanant du même éditeur sont compatibles, vous lui imposez souvent de choisir le même que vous. (Au hasard, micro$oft, bref, vous contribuez à l'établissement d'un monopole largement néfaste au progrès de l'informatique, et en plus, vous payez (cher) pour ça.)

Tout autre argument: immaginons une situation. Vous partez passer deux jours/la semaine/le mois chez un ami. Mais comme vous avez un travail urgent, vous emportez avec vous quelques disquettes contenant les documents sur lesquels vous devez travailler, avec l'ordinateur de votre ami. Hélas, votre ami n'a pas de traitement de textes compatible avec le votre. Autre exemple : certaines calculatrices récentes, comme la TI-92, permettent de saisir du texte de manière relativement confortable. Il n'est pas absurde de commencer à taper un texte sur une calculatrice, pour profiter d'un instant de temps libre, et d'ensuite le transférer sur ordinateur. En revanche, il n'est pas possible de continuer sur une calculatrice un texte commencé avec un traitement de textes, à moins d'accepter de perdre la présentation. Que voulez-vous, tout le monde ne peut pas avoir un portable.

La puissance de calcul

Une présentation bâclée

La composition typographique est une tâche extrêmement complexe. Même avec leur puissance, les ordinateurs actuels (à l'heure où j'écris, la norme est légèrement en dessous des 500 MHz et 128 Mo) ont besoin de quelques secondes pour calculer une présentation parfaite pour un document de quelques pages. Or il est insupportable de saisir du texte s'il ne s'affiche pas immédiatement. Pour rester dans l'optique du «WYSIWYG», ils doivent réaliser cette tâche impossible de faire la composition en temps réel.

Pour y arriver, ils emploient principalement deux méthodes. D'une part, ils ne recalculent pas toute la mise en page : ils ne font immédiatement que des modifications locales, et mettent à jour le reste quand l'utilisateur leur laisse une seconde de répit. D'autre-part, tout simplement, ils båclent la mise en page. Et, fidèles au «WYSIWYG», ces simplifications de composition ne sont pas limitées à l'affichage du texte en cours d'édition, mais se retrouvent sur le document final. C'est pour ça qu'un document tapé avec un traitement de textes n'a pas l'apparence d'un texte professionnel.

La course à la puissance

Pour rester compatible avec vos proches, vous devez régulièrement vous procurer la dernière version de votre traitement de textes. Je passerai sur l'inconvénient financier (qui ne concerne que les gens honètes qui payent leurs logiciels), pour m'atarder sur le problème de la puissance toujours plus grande qu'ils exigent pour tourner convenablement. D'autant qu'ils n'améliorent pas la qualité typographique du document. Ce surcroit de puissance est uniquement nécessaire pour quelques fonctionnalités à l'utilité douteuse (avez-vous vraiment besoin que vos fautes soient signalées pendant que vous tapez, ce qui, soit dit en passant, vous ralentit ?), pour ne pas dire franchement inutiles (mais qui a besoin de cet insupportable trombonne ?). En fait, une machine de la puissance d'un 486 DX 50 est amplement suffisante pour le même résultat final, mais il faut bien faire tourner la machine économique !

Modérons nos propos

En fait, beaucoup des inconvénients cités ici ne sont pas une fatalité. Tout d'abord, il existe un standard pour les fichers de texte mis en forme, que bon nombre de traitements de textes comprennent. Mais pour l'utiliser, il faut au mieux aller fouiller dans une interminable liste de formats plus vieux ou ésothériques les une que les autres. Et jamais rien n'indique au néophyte que ce format est particulièrement compatible. De plus, la pluspart des problèmes proviennent d'un choix technique ou, plus souvent, économique plus que d'une réelle limitation pratique. C'est alors aux utilisateurs, qui sont aussi les clients, de faire comprendre aux éditeurs de logiciels qu'ils veulent de la qualité et pas des gadgets.

Un obstacle à la rédaction de textes

Jusqu'ici, j'ai évoqué des problèmes techniques liés aux traitements de textes. Évidemment, je me plaçais dans l'hypothèse où l'utilisateur veut utiliser un tel logiciel. Je vais maintenant évoquer quelques raisons pour expliquer pourquoi il a tort. Je suppose que son but est de taper un texte d'une certaine longueur (au moins trois pages), avec une présentation soignée, mais cohérente.

Séparer le fond de la forme

Tous les traitements de textes vous proposent, à un endroit accessible de l'écran, des boutons qui permettent «d'un simple clic» (puisque cette expression est passée dans la langue usuelle), de passer en italique ou en gras, de souligner, de changer de police de caractères, etc... L'utilisateur aura donc naturellement tendance à utiliser ces boutons pour mettre en valeur son texte. Cette mise en valeur a tout intérêt à être faite au moment même où le texte est saisi, car elle fait partie intégrante du sens du texte. Mais pour la faire correctement, il faut à chaque fois réfléchir à quel format employer pour rester cohérent : les citations d'une certaine manière, les titres de livres d'une autre, les noms propres encore d'une autre. Ce n'est pas du tout le meilleur moyen de se concentrer sur le texte qu'on est en train de rédiger !

La bonne solution serait de créer quelque part une liste de mises en valeur prédéfinies, associées aux différents types de textes qu'on veut mettre en valeur. En outre, on peut vouloir changer dans le document entier la manière de présenter une sorte de texte. Évidemment, la pluspart des traitements de textes permettent de faire des remplacements dans le texte en se basant sur ses attributs, mais si l'utilisateur a eu la mauvaise idée de mettre le même aspect à deux choses différentes, il n'a plus qu'à faire le tri à la main. C'est porquoi ces styles spécifiques ne doivent pas être simplement des raccourcis mnémotechniques, mais doivent être intégrés au document même. Ainsi, il devient possible de donner l'ordre : change toutes les citations en telle police.

Les traitements de textes proposent cette possibilité. Elle s'appelle souvent «style». Alors de quoi me plains-je ? direz-vous. Eh bien, cette fonction style a de nombreux défauts. Tout d'abord, elle est assez obscure pour une personne qui ne sait pas déjà à quoi ça sert. Ensuite, quand on crée un style, on est obligé de lui donner des attributs, même provisoires, ce qui impose de réfléchir à la présentation alors que ce n'est pas du tout le moment. Enfin, le changement de style n'est visible à l'écran que par les modifications typographiques qu'il apporte, et éventuellement par l'affichage du nom dans un coin si le curseur est dedans.

Donner une structure au document

Un document qui n'est pas une simple affiche ou un tract a une structure, avec un titre, des sections et sous-sections, des références, une table des matières, un index, une numérotation des pages, etc... Là encore, un traitement de textes sait (ou devrait savoir) gérer tout ça. Mais ici encore, c'est lourd, difficile et malpratique. Pourquoi ? Tout simplement parceque ça s'appuie sur des informations non visuelles : une référence, par exemple, n'est pas seulement un numéro de page, mais également un identificateur pour l'endroit qu'elle référence ; de même, un titre de chapitre est plus qu'un bout de texte écrit en gros. Et ce genre de chose, le concept de traitement de textes a beaucoup de mal à l'appréhender.

En fait, l'utilisateur d'un traitement de textes est naturellement ammené à ne se servir presque que des fonctions de bas niveau : gras, italique, police de caractères, et à négliger les fonctions complexes qu'il a pourtant probablement payées si cher, et qui ont probablement guidé son choix de logiciel.

Récapitulatif

Voici donc un résumé des différents inconvénients des traitements de textes.

Une alternative ?

Oui, une alternative ! Attention, je ne vais pas proposer un produit miracle. Il a des défauts. Les principaux sont que la solution exige quelques efforts d'apprentissage, et que ceux qui confondent puissance avec boutons et icônes partout trouveront mon produit archaïque. Les logiciels dont je vais parler maintenant s'appellent des formateurs de textes.

Mais l'avantage, c'est que ça résout la pluspart des problèmes: les fichiers sont à peine plus gros que le texte qu'ils contiennent, il est possible de travailler sans le logiciel, la présentation est de grande qualité, les documents restent lisibles et résistent bien aux dommages, le passage à un autre logiciel de même type n'est pas très dur, le document reste relativement lisible en l'absence du logiciel, il tourne même sur des machines très limitées, il favorise la mise en place de styles sémantiques, et la séparation du fond et de la forme, montre pleinement tout ce qui influe sur le document, et propose un accès facile à des fonctions complexes.

Cette phrase sonne comme un slogan, mais c'est uniquement parceque je voulais reprendre d'un coup tous les inconvénients que j'ai annoncés. En fait, je suppose qu'on lui trouverait assez facilement des défauts communs aux traitements de textes, mais il ne m'en vient pas à l'esprit pour le moment, et ça n'entrerait pas dans mon argumentation. J'ajoute ici que c'est un outil particulièrement pratique dès qu'il s'agit de taper des formules mathématiques.

Le logiciel dont je parle ici s'appelle LaTeX (la dernière lettre est un chi, prononcez «latech», avec un ch dur), qui est le plus répandu des logiciels de ce type. Mais ce que je dis s'applique à tous logiciel équivalent, avec quelques retouches.

L'idée de base

Si vous avez la chance d'avoir une secrétaire, vous n'avez pas ces problèmes : en effet, il suffit de préparer le texte sur un dictaphone, et elle s'occupe de tout. Examinons comment se présente une telle dictée. «C'est une lettre à M. Untel, telle adresse. Monsieur, j'ai été très déçu (insistez sur le «très») par votre... veuillez donc contacter M. Tartanpion (ici, mettez son adresse)... je vous prie (et une formule de politesse adéquate)» ou bien encore «... partie suivante: les objectifs... Ah, ajoutez entre les perspectives et les objectifs une partie «difficultés possibles», avec dedans... Comme nous l'avons vu dans le paragraphe «difficultés possibles» (indiquez la page entre parenthèses)...» Comme on le voit, des parties de dictée pure alternent avec des directives de mise en forme, et à des demandes spécifiques. C'est à la secraitaire alors de se débrouiller pour trouver l'adresse dans ses fiches, et de remonter dans le texte pour trouver la page à laquelle il est fair référence.

À ce petit jeu de mémoire, un ordinateur est très fort. C'est même sa spécialité. Évidemment, il aura du mal à deviner qu'il faut aller à la ligne après «Monsieur», ou à composer lui-même une formule de politesse. Mais pour ce qui est de retrouver la page à laquelle il est fait allusion, ou de chercher l'adresse de la personne dont on parle, il est parfait.

Hélas (ou plutôt heureusement), un ordinateur est infiniment moins intelligent qu'une secrétaire. Si vous lui dictez «en gras», il va écrire «en gras», et non pas écrire en gras. Il faut donc lui faire sentir que vous lui donnez une indication. Ceci se fait bien en utilisant un caractère rare, comme ls $, ls # ou le \ par exemple, quite à devoir faire une «périphrase» quand il s'agit effectivement d'obtenir ce caractère dans le texte. D'ailleurs, si vous êtes en train de lire ce texte sur le Web, demandez à votre navigateur de vous afficher le code source du document. Qu'y voyez-vous ? Principalement le texte que j'ai tapé, mais aussi des symboles cabalistiques, appelés balises, par exemple le mot «Web» juste au dessus, se retrouve ainsi: <i>Web</i>, ce qui donne l'ordre de le mettre en italique. Le principe est le même pour LaTeX, mais en plus évolué.

Petit historique

Aux alentours de 1985, Donald E. Knuth, un informaticien théoricien génial, ne supportait plus ce qui était à sa disposition pour écrire ses livres. La saisie de formules mathématiques, notament, était insupportable. Il a donc développé TeX, un programme qui traduit un texte contenant des indications de mise en forme en un fichier prêt à être imprimé. Il a rendu ce logiciel public, et TeX a vite connu un vif succès auprès des milieux scientifiques. Mais TeX mélangeait trop le fond et la forme. Leslie Lamport a alors développé un systèmes de commandes pour TeX qui permet d'utiliser des mises en page toutes faites de manière très simple. Ça a donné LaTeX, qui a également été très vite très apprécié. Un peu plus tard, l'American Mathematical Socity a publié un certain nombre de polices de caractères et d'outils pour faciliter la saisie de formules complexes. On a vu aussi de très nombreux paquetages apparaître, qui proposent des outils plus ou moins exotiques et rendent la production de documents complexes facile. Mais attention, ce n'est pas parceque LaTeX est bien pour faire des mathématiques qu'il ne sert qu'à ça, au contraire : c'est un outil très puissant pour la production de toutes sortes de textes.

Certains, en lisant les dates, s'écrieront «mais c'est une antiquité !» Certes, LaTeX a déjà quelques années, ce qui est beaucoup en informatique. Mais l'écriture aussi est très vieille, et on n'a pourtant encore rien trouvé de mieux pour transmettre des savoirs. Attention, je ne suis pas en train de comparer LaTeX à l'écriture, loin de mois cette idée, mais seulement de ridiculiser l'argument qui dirait que ce qui est plus récent est forcément mieux.

De la difficulté

Un autre argument qu'on invoque souvent contre LaTeX et ses semblables est leur difficulté. Je ne nie pas que LaTeX exige un peu plus d'apprentissage qu'un traitement de textes, mais c'est loin d'être insurmontable, et c'est tout à fait normal, puisqu'il impose plus de soin dans la rédaction du document. Produire un document de qualité n'est pas une tâche facile, mais c'est quand-même plus facile avec LaTeX qu'avec un traitement de textes.

Et quand il s'agit de taper des textes comportant des formules mathématiques, alors il n'y a aucune comparaison : les outils fournis par les traitements de textes sont extrêmement malpratiques. D'ailleurs, ce n'est pas pour rien que l'immense majorité des mathématiciens utilisent LaTeX.

Comment ce concept résout les problèmes

Examinons un à un les problèmes soulevés par les traitements de textes, et voyons comment les formateurs de textes les évitent.

Certains déploreront au début de ne pas voir apparaître rapidement leur document tels qu'ils le veulent, et de n'avoir que des commandes à la place. Mais dès qu'on a pris l'habitude de ce système, les balises deviennent aussi parlantes que la présentation. De plus, certains bons éditeurs de textes (celui que j'utilise pour le moment, par exemple) sont capables de reconnaître en partie les balises, et de mettre des couleurs qui rendent le tout très clair (mais attention, ça reste des éditeurs de textes : les couleurs dépendent uniquement du texte tapé).

De plus, ces éditeurs si puissants sont aussi capables de réduire le travail en insérant automatiquement pour vous certaines commandes courrantes ou longues. Ça n'est pas semblable à ce que fait un traitement de textes : c'est un simple raccourci, et on voit le texte inserré. De plus, si on s'absente de chez soi, on peut travailler, même avec un éditeur moins perfectionné, ce sera juste moins confortable (comme de taper sur un clavier dont on n'a pas l'habitude).

Pour ceux que j'ai convaincus

Pour essayer

Comme je l'ai dit, LaTeX est le plus répandu des formateurs de textes, notament dans le monde de la recherche. C'est celui-ci que je conseille. Il peut être librement téléchargé en de nombreux endroits, dont le site de l'association GUTenberg. Vous le trouverez normalement aussi avec toute bonne distribution de Linux.

Pour apprendre

Les tuteurs informatiques de l'ENS ont écrit quelques pages consacrées à l'apprentissage, qui regroupent notament des bases et des lient utiles : /tuteurs/cours/latex/.

Conclusion

J'espère vous avoir convaincu que le traitement de textes n'est pas l'outil ultime pour rédiger des textes. Évidemment, mon argumentation est à sens unique, et il faut avouer que certains arguments sont discutables. Mais si j'ai pu faire passer l'idée qu'il existe autre chose, alors mon but est atteint. Il ne me reste plus qu'à vous conseiller d'au moins faire l'essai, pour voir en pratique ce dont j'ai parlé.