Processus d’édition
La base de données qui alimente ce site contient les versions informatisées de 73 documents écrits ou coécrits par Jean-Claude Corbeil, lesquels totalisent plus de 1500 pages imprimées. L’édition informatique de ces documents, obtenus en grande partie auprès de leur auteur, a été effectuée en suivant le processus d’édition décrit ci-dessous.
Numérisation, restauration et océrisation
Tous les documents qui n’existaient que sous une forme imprimée ont été numérisés en haute qualité à partir des originaux (à une résolution de 600 pixels par pouce, en mode couleur, sans effets de filtrage automatique ni compression).
Les images numérisées ont été restaurées avec un logiciel de retouche photographique afin d’atténuer les imperfections des documents originaux (visibilité de la fibre du papier, présence de ratures manuscrites…) et les artéfacts parfois introduits par les appareils (variation de l’ombrage, apparition de franges d’interférences…)
Chaque numérisation restaurée a ensuite été océrisée, c’est-à-dire qu’elle a été traitée au moyen d’un mécanisme de reconnaissance optique de caractères. Plus concrètement, chaque image matricielle (photographie numérique) a été convertie sous forme de chaînes de caractères (texte éditable) par un logiciel d’intelligence artificielle (qui simule des capacités typiquement humaines). Le procédé d’océrisation étant imparfait, nous avons dû procéder à une phase de toilettage manuel pour obtenir une transcription textuelle de qualité. En effet, la conversion de l’image en texte provoque souvent l’apparition d’erreurs typographiques ou orthographiques.
Conversion, structuration et mise en page
L’ensemble des documents, océrisés ou déjà disponibles en divers formats numériques, ont été convertis en HTML5, un langage de balisage informatique qui sert à créer des documents structurés diffusables sur le Web. Le code généré a été simplifié et standardisé automatiquement grâce à des expressions régulières.
Un travail de structuration manuelle s’est ensuite imposé. Les balises automatiquement générées ont été révisées de manière qu’elles représentent bien la structure du document. Ces balises sont constituées par des mots-clés conventionnels placés entre chevrons, tels que :
<header>
…</header>
(indique un en-tête);<h1>
…</h1>
(indique un titre principal);<p>
…</p>
(indique un paragraphe);<blockquote>
…</blockquote>
(indique une citation de grande taille);<li>
…</li>
(indique un élément de liste);- etc.
Les documents ont ensuite été couplés à une feuille de style CSS (un code qui sert à mettre en page du contenu), qui permet d’afficher le texte plus élégamment dans un navigateur Web (comme Firefox, Chrome, Safari, Edge, Opera…). Cette opération permet aux documents de bénéficier d’une composition typographique moderne et uniforme. De plus, les feuilles de styles permettent de créer un site dont la présentation s’adapte en fonction de l’appareil utilisé (ordinateur de bureau, téléphone intelligent, imprimante…).
Uniformisation d'éléments textuels et paratextuels
La typographie des documents a été uniformisée, entre autres :
- Les apostrophes dactylographiques (droites) ont systématiquement été remplacées par des apostrophes typographiques (courbées).
- Les guillemets anglais (droits ou courbés) ont systématiquement été remplacés par des guillemets français (en chevrons), sauf dans les citations de second degré.
- Les procédés de mise en relief typographiques ont été retouchés. Le soulignement, qui est en principe réservé aux hyperliens sur le Web, a intégralement été remplacé par de l’italique.
- Certains textes sont passés d’une police à chasse fixe (qui rappelle l’écriture d’une machine à écrire) à une police plus moderne et sans empattements (qui permet une lecture optimale).
- La taille et le format des titres et sous-titres ont été unifiés. De même, les titres et sous-titres ont été retranscrits de façon à respecter les règles habituelles de casse (distinction entre majuscules et minuscules).
- Dans les chiffres, les virgules servant à distinguer les triplets ont été remplacées par des espaces (ex. : 50,000 > 50 000).
- Dans les chiffres, les points ont été remplacés par des virgules (ex. : 50.1 % > 50,1 %).
Les graphies ont été standardisées :
- Les ligatures des e dans l’o ont été systématisées (ex. : coeur > cœur; moeur > mœur; noeud > nœud; oeil > œil; oeuvre > œuvre; soeur > sœur; voeu > vœu).
- Les accents sur les majuscules ont été rétablies (ex. : A > À; Etat > État; Editeur > Éditeur).
- Les soudures graphiques devenues usuelles ont été appliquées (ex. : extra-linguistique > extralinguistique; hydro-électrique > hydroélectrique; inter-personnel > interpersonnel; socio-linguistique > sociolinguistique; uni-lingue > unilingue).
- Les graphies des toponymes ont été alignées sur les recommandations de la Commission de toponymie du Québec (ex. : St-Léonard > Saint-Léonard).
- Les éventuelles coquilles ont été corrigées (*lingustique > linguistique).
La présentation d’éléments paratextuels a été retravaillée :
- Lorsque les articles originaux comportaient des notes de bas de page, les appels de notes ont été retranscrits en exposant et entre crochets (par exemple « [1] ») et, le cas échéant, ont été transposés de manière à suivre une numérotation arabe continue (1, 2, 3…). Des ancres (liens hypertextes internes à la page) ont été ajoutées sur chaque appel de note pour permettre d’accéder, en un clic, à la note de bas de page correspondante.
- Lorsque les articles originaux comportaient des renvois vers d’autres sections du document, des ancres ont aussi été ajoutées sur chaque renvoi pour permettre d’accéder, en un clic, à la section correspondante (voir Corbeil 1980).
- Lorsque les articles originaux étaient accompagnés de résumés, ces résumés ont été placés au début des articles s’ils étaient rédigés en français, et à la fin des articles s’ils étaient rédigés dans d’autres langues (allemand, anglais, basque, espagnol…). Avec l’accord de l’auteur, nous avons ajouté une traduction française des résumés qui n’étaient fournis que dans une langue étrangère (voir Corbeil 1972 et Corbeil 1973).
- Les schémas compris dans quelques documents ont quelquefois été redessinés, lorsque cela permettait d’en rehausser l’apparence. Les images ont alors été enregistrées sous forme vectorielle, ce qui en permet l’agrandissement des images sans l’apparition de crénelage (voir Corbeil 1978). Avec l’approbation de l’auteur, nous avons ainsi pu corriger certains schémas qui s’étaient mal imprimés dans les documents originaux (voir Corbeil 1973).