Traitement automatique des langues et composition sous Ω
Cahiers GUTenberg, Actes de GUT 2001 : « Le document au XXIe siècle », Metz, no. 39-40 (2001), pp. 139-166.

Alors qu’Ω ne cesse d’évoluer et ses fonctionnalités de se diversifier et de s’élargir, on s’aperçoit que les méthodes utilisées pour permettre la composition des langues orientales peuvent aussi servir à résoudre des problèmes jusqu’alors négligés des langues occidentales. Les mêmes types d’outils servent à segmenter les propositions thaï en mots puis en syllabes et serviront aussi à déterminer si une lettre « s » d’un mot allemand écrit en gothique doit être longue ou courte... Dans ces deux cas l’outil en question est un analyseur morphologique, outil d’une discipline connue sous le nom de traitement automatique des langues (TAL en français, NLP = Natural Language Processing en anglais). Grâce au mécanisme d’OTP externe (OTP = Ω Translation Process) d’Ω, nous pouvons intégrer ces outils dans Ω et les utiliser en temps réel pendant la composition. Comme tout ce qui a trait aux langues dites naturelles, ces outils ne peuvent être fiables à 100 imposent donc relecture et inspection du texte composé : Ω peut, par le biais de méthodes de colorisation ou de marquage visuel, faciliter et optimiser cette relecture, en paliant ainsi les défauts d’application des outils linguistiques.

Dans cet article nous allons étudier six cas d’utilisation d’outils ou de méthodes linguistiques, de complexité très variée et couvrant un spectre de langues assez étendu : l’anglais, l’allemand, le grec, l’arabe, le thaï et le japonais. Dans chaque cas il s’agira d’introduire certaines informations supplémentaires concernant la structure syntaxique ou morphologique du texte ou sa phonologie ; ces informations peuvent évidemment être saisies par un auteur méticuleux et patient en même temps que le texte-même : un hypothétique auteur allemand peut marquer explicitement les « s » longs et les « s » courts, un auteur thaï peut, en théorie, indiquer les limites des mots et des syllabes. Mais cela devient vite pénible et ne devrait donc pas faire partie de la tâche de l’auteur mais plutôt de celle de l’imprimeur, voire dans certains cas de celle du correcteur ou du responsable éditorial.

@article{CG_2001___39-40_139_0,
     author = {Haralambous, Yannis and Plaice, John},
     title = {Traitement automatique des langues et composition sous $\Omega $},
     journal = {Cahiers GUTenberg},
     pages = {139--166},
     publisher = {Association GUTenberg},
     number = {39-40},
     year = {2001},
     language = {fr},
     url = {http://www.numdam.org/item/CG_2001___39-40_139_0/}
}
TY  - JOUR
AU  - Haralambous, Yannis
AU  - Plaice, John
TI  - Traitement automatique des langues et composition sous $\Omega $
JO  - Cahiers GUTenberg
PY  - 2001
SP  - 139
EP  - 166
IS  - 39-40
PB  - Association GUTenberg
UR  - http://www.numdam.org/item/CG_2001___39-40_139_0/
LA  - fr
ID  - CG_2001___39-40_139_0
ER  - 
%0 Journal Article
%A Haralambous, Yannis
%A Plaice, John
%T Traitement automatique des langues et composition sous $\Omega $
%J Cahiers GUTenberg
%D 2001
%P 139-166
%N 39-40
%I Association GUTenberg
%U http://www.numdam.org/item/CG_2001___39-40_139_0/
%G fr
%F CG_2001___39-40_139_0
Haralambous, Yannis; Plaice, John. Traitement automatique des langues et composition sous $\Omega $. Cahiers GUTenberg, Actes de GUT 2001 : « Le document au XXIe siècle », Metz, no. 39-40 (2001), pp. 139-166. http://www.numdam.org/item/CG_2001___39-40_139_0/