Intro

vademecum

1 2 3 4 5 6 7 8 9 10 11 12 13 14
FAQ

 

Cours 4

vers Cours 5

pour visualiser le cours Access correspondant, cliquez ici: cours 10

pour télécharger le PDF

 

résumé

Commençons par remplir certains champs linguistiques
Vous avez trouvé des candidats-termes
Vous avez fait des fichiers de concordances grâce à TerminologyExtractor ou à TextStat ou directement dans le concordancier de WALL
Maintenant, vous allez extraire de vos concordances des collocations et trouver des contextes.


Travail à rendre à la fin du cours (voir consignes détaillées)

Collocations

 

Qu'est-ce qu'une collocation? Le terme peut prêter à confusion! Qui dit quoi?

Vous avez dit "collocations"? Bizarre!

 

Qu'est-ce qu'un fichier de concordances? Vous en avez extrait : quand vous demandez votre logiciel d'extraire x caractères à gauche du terme et x caractères à droite, vous faites un fichier de concordances:

Pas de réflexion, ici, à part l'intelligence de l'utilisateur qui formule la requête en Perl si vous utilisez le concordancier Wall. Vous avez l'environnement du terme, pertinent ou pas; à vous de faire le tri.

Alors précisons un peu ce que nous voulons maintenant.

Qu’est-ce qu’un contexte?
Qu’est-ce qu’une collocation ?

Contexte

Un contexte est un exemple authentique, une citation d’un texte de votre corpus, une phrase complète ou un paragraphe, qui vous donne des renseignements sur le terme.

Il va vous servir à de multiples choses mais on peut dire qu’il y a trois types de contextes
Les contextes définitoires (ce sont des définitions plus ou moins bien formées (« canoniques ») du terme ; (ils serviront à nourrir la définition)
Les contextes encyclopédiques, qui vous donnent des renseignements complémentaires sur le concept (ils serviront à nourrir la note technique)
Les contextes qui montrent le comportement du terme dans le discours, c’est l’aspect linguistique qui est intéressant ici .(ils serviront à extraire des collocations)

On pourrait dire, à la limite, que les contextes sont destinés à être exploités pour nourrir d’autres champs (définition, note techique, collocation).

Quand on sélectionne des contextes, le choix est délicat :
• on cherche, souvent en vain, un contexte définitoire. On ne les trouve que dans les corpus didactiques, de vulgarisation, on n'en trouve pas dans les corpus où des spécialistes ou des techniciens s'adressent à leurs pairs. Souvent la syntaxe est pauvre et on rencontre des phrases du type : "X (le terme) est une sorte de Y, il sert à faire ..., il correspond à..."
• les corpus non définitoires sont plus intéressants pour le traducteur : ils mettent en scène le terme en donnant des exemples de son comportement en combinaison avec d'autres termes, ils fournissent la phraséologie du domaine.
Cependant un contexte n’apportant aucun renseignement sur le sens du terme n’aura guère d’intérêt pour l'utilisateur non spécialiste ( ce qui est souvent le cas du traducteur)qui a besoin de se construire une représentation du domaine.
• Parfois le contexte est très court : il risque d'être ambigu, de ne pas donner d'indications sur le sens, de ne pas fournir d'exemples intéressants de la combinatoire du terme.
Parfois, il est très long et donc difficilement consultable par l'utilisateur (qui est toujours pressé). Il faut alors faire des coupes dans ce contexte et en retirer les éléments non pertinents. Dans ce cas il faut signaler scrupuleusement les coupes effectuées au moyen de crochets carrés : I...]

On pourra garder certains corpus pour le champ collocation : on les tronquera sans scrupule pour en faire des exemples courts et schématiques.

Si plusieurs contextes vous semblent intéressants, vous pourrez les inclure tous.


Donc en résumé, le contexte a deux fonctions :
• préciser le sens du mot
• montrer son fonctionnement dans une phrase authentique
• (et ... prouver la bonne foi du terminologue!).

Vous mettrez plusieurs contextes de sources différentes, vous les choisirez avec attention pour qu’ils soient pertinents, vous pouvez commencer par mettre ceux que vous avez en ce moment, quitte à effacer ensuite ceux qui vous semblent moins intéressants.

Vous en sélectionnerez au moins trois pour les fiches de termes longs , venant de sources différentes, pour montrer que votre choix est étayé par les documents que vous avez réunis.

Voir : Quelques exemples de mauvais contextes dans le site termino

Attention, dans le formulaire f_termes, dans l'onglet contextes, vous devez remplir obligatoirement les champs Source, page, date de la source .
Attention : Pas de terme sans contexte! (dans les fiches longues)
mais aussi pas de contexte sans source et sans références de cette source (voir table source)

La source pourra être une URL : dans ce cas il n'y aura pas besoin de page. La date sera la date de consultation.
Champ : note documentaire / type de document : vous caractériserez le type de corpus : niveau de spécialisation, fiabilité, point de vue de l'expert ou des experts (dont les avis peuvent diverger).

Il est absolument indispensable de remplir ces champs : l’utilisateur doit pouvoir retourner à la source pour relire un contexte plus large (tout le paragraphe, toute la page).

Collocation


Une collocation n’est pas une citation, c’est une abstraction de mise en discours.
Il s’agit , pour faire une collocation, de trouver l’environnement du terme, sa combinatoire, et la présenter en lemmatisant les verbes. C’est comparable aux exemples fabriqués du dictionnaire de langue.


L’idée est de trouver tous les paradigmes pouvant se combiner avec le terme afin
-de proposer des exemples authentiques pour des rédacteurs dans une langue spécialisée dont ils connaissent peut être les termes mais dans laquelle ils n’ont pas une parfaite aisance d’expression (aide à la rédaction en anglais par exemple ;
- de faire des correspondances entre des exemples en langue source tirés de corpus et des exemples en langue cible tirés également de corpus, afin de donner des clés pour une traduction fluide et authentique.

Les fichiers de concordances vont vous permettre d’extraire, de fabriquer des collocations.

Vous avez un terme (simple ou complexe).

Vous cherchez

les adjectifs , les compléments de nom avec lesquels on le trouve (attention, vérifiez si ce que vous trouvez n'est pas un terme aussi); les expression où il joue un rôle de déterminant (adjectif ou complément de nom)

exemples pour le terme block cipher :

block cipher modes of operation

block cipher-based hash functions

block cipher-based constructions

standard security requirements for block ciphers

- les verbes typiques dont il peut être complément (donc position N1 ou N2)

exemples :

to use a block cipher in the CBC mode

( concordance :Once you have initialized any of the block cypher classes with a key, .)

to initialize any of the block cypher classes with a key

the module is mixed in with an block cypher encryption class
(vous remarquerez qu'ici j'ai gardé le sujet du verbe, sinon on aurait eu du mal à comprendre le sens)

- les verbes typiques dont il peut être sujet (donc position N0)

The symmetric key block cypher is two way and has a key.
A block cipher inverts E on W
A block cipher fixes any key.
A block cipher decrypts w under a key.

(vous remarquerez que j'ai gardé tous les compléments des verbes, vous remarquerez aussi qu'il n'y a aucune préposition qui reste "suspendue" en fin de phrase, sans le substantif introduit par cette préposition.)

Nous sommes donc intéressés par la combinatoire du terme, ses déterminants adjectifs ou compléments (regardez bien les articles aussi , ça peut être intéressant parfois de voir si "the" ou "a" ou "some" sont possibles/impossibles) , les verbes pour lesquels il peut être en position N0, N1 , N2.

Vous réfléchirez aux classes d'objets pouvant figurer dans ces positions de N0, N1 , N2. C'est à dire que vous essaierez de mettre dans la collocation l'hyperonyme regroupant les termes pouvant figurer dans ces positions de N0, N1 ...Ici on choisira "médicament" plutôt que d'énumérer plusieurs nom de médicaments.

Exemples

expérimenter un médicament en aveugle

 

Vous ne négligerez pas les verbes qui peuvent vous sembler banals et inintéressants:

an increase in carbon stocks
enhancement of carbon stocks
reduced carbon stocks
the magnitude of carbon stocks in terrestrial systems
to account for changes in carbon stocks
carbon stocks accounted for under Article 3.3
to affect standing carbon stocks
to assess changes in carbon stocks
to evaluate changes in carbon stocks
to have implications for the changes in carbon stocks
to measure changes in carbon stocks
to overestimate the actual losses of carbon stocks
to record changes in carbon stocks
to report changes in carbon stocks
to reduce carbon stocks
reductions in carbon stocks
to reflect the actual net change in carbon stocks
to track carbon stocks

Soyons pragmatiques.
Les collocations nous intéressent parce qu’elles sont utiles au traducteur.
Qu’elles soient courtes ou moins courtes, que ce soit des collocations, des colligations , des phrases ou membres de phrases typiques, peu importe. Nous ne sommes pas là pour trancher sur ce que nous devons entendre par collocations mais pour consigner des exemples les plus susceptibles d’être réutilisés et montrant comment écrire une langue spécialisée authentique (donc tirés du corpus) de la manière la plus économique possible (donc lemmatisés).

Attention, je rappelle que contrairement à ce qui se fait dans les dictionnaires papiers, on ne remplacera pas le terme par ~ dans les collocations : nous devons pouvoir interroger le dictionnaire en recherchant les termes dans tous les champs de la base : si le terme est remplacé par ~, on ne retrouvera plus rien.

Exemples

exemple 1 collocations bois

correction

exemple 2 mariez-les

exemple 3 collocations transmission du VIH

 

Base termino à remplir

Nous allons commencer à remplir la base terminologique.

• Vous allez remplir la table source en ouvrant le formulaire F-sources et en saisissant les titres (et les autres champs de fiches) des documents que vous avez collationnés pour constituer votre corpus ou vous servir d’outils (dictionnaires, vulgarisation, encyclopédie…)
Je vous renvoie au cours de termino n°1 et 2 que nous avons vu ensemble.
Si vous avez des doutes sur la façon de remplir cette table source, posez-nous des questions, à Mme Bordet et à moi-même

• Vous allez remplir la table termes avec les termes que vous avez relevés. Vous devez arriver à un relevé exhaustif des termes de votre texte source.

Pour améliorer les performances de TE (TerminologyExtractor) vous pouvez suivre la démo suivante : comment constituer une liste d’exclusion
Dans la correction de l’exercice 3 proposé au début de la leçon 3 de termino ;
http://www.eila.univ-paris-diderot.fr/users/juilliar/demos-cj/corrige_exo1.swf

il y a, en cinquième partie, une démo qui vous permet de rendre TE un peu moins bête
http://www.eila.univ-paris-diderot.fr/users/juilliar/demos-cj/corrige_exo1_D_exclus.htm

Vous allez ouvrir le formulaire Termes et vous allez commencer à remplir les contextes et les collocations

Cherchez des collocations dans vos fichiers de concordances, cherchez en avec GOOGLE, cherchez dans des documments en langue cible des équivalents de vos termes ET des collocations qui serviron peut-être d'équivalents de collocations.

Faites une recherche automatique dans tous les contextes saisis pour trouver des collocations intéressantes. Cherchez dans les contextes non utilisés, raccourcissez-les, lemmatisez : vous devez fournir des exemples tronqués typiques et authentiques qui aident le traducteur.

Marie Laure Beetschen ""la terminologie de la SOT , La technique sacro-occipitale, en chiropratique"

"L’ostéopathie, qui est beaucoup plus implantée en France, même si elle n’a aussi été reconnue que tardivement, a développé une terminologie francophone beaucoup plus large. Pour les phénomènes anatomiques et physiologiques qui restent les mêmes (mais pas pour les techniques employées), le corpus provenant du domaine de l’ostéopathie est donc très riche en terminologie. De plus la technique sacro-occipitale, du fait qu’elle prend en compte l’interaction crâne-sacrum, est la technique, en chiropratique, la plus proche de l’ostéopathie. Cependant les données provenant de l’ostéopathie ont toujours été manipulées avec prudence et soumises à l’avis d’un chiropraticien avant d’être utilisées. La prudence est d’autant plus nécessaire de ce côté que, l’ostéopathie étant plus développée, elle est aussi plus divisée et les idées divergent parfois. La validation est donc plus que nécessaire.)
La prudence s’impose aussi pour les collocations, sur certains termes, comme crâniopathie (ou thérapie crânienne) par exemple. Si on trouve en anglais « in cranial therapy » ou « in craniopathy », on ne trouve pas en français « en thérapie crânienne » ou « en crâniopathie ». Peut-être que si ce domaine se développe, on verra apparaître cette collocation mais pour l’instant, elle n’est pas utilisée."

Fanny Jarnet

. "Equivalence

....Ceci nous amène à parler des problèmes d’équivalence. Une fois encore, alors que nous n’avons qu’un seul terme en français « poussée », il en existe 3 en anglais « relapse », « attack » et « exacerbation ». Dans les sites de vulgarisation en français on trouve toutefois le terme « rechute » (et « attaque » dans une moindre mesure) mais, dans le corpus de référence, seul le terme «poussée » est utilisé. Peut-être la terminologie a-t-elle évolué, peut-être dans le passé plusieurs termes étaient utilisés en français et au fil du temps, le terme vedette a pris le pas sur les autres termes. D’après l’expert, les trois termes anglais sont traduits par le terme « poussée ». On trouve aussi « première poussée » qui pourrait correspondre à « attack ». Une fois encore, même si ces termes sont équivalents aux yeux de l’expert, ils ne le sont pas aux yeux du linguiste."

Il faudra donc trouver les collocations de ces différents termes et peut-être noter dans le champ discours de la table collocations dans quel type de document on va trouver ces collocations et ces termes.

 

Champ Collocation dans la base

Deux champs supplémentaires à remplir dans la table collocations

le champ discours_id qui renvoie à la table t_discours_sql pour classer les collocations en fonction du type de discours dans lequel on les trouve et pouvoir extraire (toujours les requêtes!) les collocations du discours argumentatif par exemple.

 

et le champ num_construction qui renvoie à la table t_construction_sql et permet d'organiser la présentation des collocations en fonction de leur construction (en triant sur leur construction dans la requête)

Vous pouvez ne pas être satisfait des constructions proposées. Nous non plus. Proposez-en d'autres.


Travail à rendre (voir consignes détaillées)

Résumé :

Continuer à relever des sources de documents corpus et outils ainsi que des termes source et cible )
Relevez aussi descollocations source et cible
des contextes source et cible
Continuer à traduire.