²Cours de Terminologie lešon par lešon

Intro

vademecum

1 2 3 4 5 6 7 8 9 10 11 12 13 14
FAQ

Cours 6

vers Cours 7

pour télécharger le PDF

pour voir les exemples cliquez ici:

pour visualiser le cours Access correspondant, cliquez ici: cours

résumé

Nous avons relevé les termes, leur(s) contexte(s), à partir des corpus cible et source collectés.

Nous avons relevés les collocations des termes .

Nous avons noté la langue de ces termes, et leur catégorie morphosyntaxique.

Nous avons noté des éléments de gestion et de maintenance de la fiche.

Nous avons élaboré des définitions et collecté des notes techniques pour compléter les définitions.

Nous avons commencé à circonscrire un domaine et à le comprendre.

 


mots clés
onomasiologie, ontologie,

Essayons de faire une première représentation schématique du domaine.

Nous l'améliorerons et la modifierons au fur et à mesure.

exemples simples :

exemples d'arbres (plusieurs types de représentations graphiques tirées des mémoires précédents)

Attention, il peut s'agir d'arborescences linéaires, hiérarchiques. Mais ce n'est pas la seule façon de représenter des réseaux de concepts.

L'arborescence se prête à la représentation des liens hiérarchiques, (logiques ou ontologiques), mais pas à la représentation des autres types de liens.

légende d'arborescence

 

Nous avons vu que , pour faire une définition canonique, nous avions besoin de déterminer quel était l'hyperonyme du terme. C'est à dire de le repérer dans le réseau de concepts en faisant une strucrturation hiérarchique des concepts.

Revenons sur cette représentaion des concepts que nous avons déjà évoquée au cours n°3

"La démarche onomasiologique est le premier principe de base en terminologie."

voir le didacticiel de terminologie
http://www.termium.com/didacticiel_tutorial/francais/lecon3

Pour l'instant, nous taillons dans la jungle des corpus à coups de machette. Nous essayons de repérer les concepts clé du domaine, d'identifier les termes qui les représentent, de donner une définition qui permette de cerner le concept en utlisant des ouvrages de vulgarisation , à visée didactique, qui vont poser les concepts et les organiser.

Nous pouvons commencer à donner une première représentation des concepts du domaine, voire à utiliser des représentations déjà faites. Même si nous ne la représentons pas graphiquement, elle est en train de se mettre en place de façon plus ou moins floue dans notre tête.

Nous allons faire une ontologie des concepts du domaine.

A ce stade, nous allons élaborer une première hypothèse de représentation des concepts du domaine.

Par exemple, dans le domaine de la reconnaissance par l'iris, nous pouvons commencer à poser que les concepts s'organisent selon ces grandes lignes:

-le fonctionnement du système de reconnaissance avec les différentes étapes du processus d'identification

-les personnes impliquées dans ce processus (d'un côté les concepteurs et les opérateurs du système, de l'autre les utilisateurs volontaires ou involontaires)

-les différents mode opératoires (déjà décrits dans les étapes du fonctionnement du système)

-les principes de codage et de gabarits

-les différents items pouvant faire l'objet d'une reconnaissance (iris, lèvres, mode de frappe d'un clavier...) donc un ensemble de concepts qui ne sont pas à strictement parler inclus dans le domaine (la reconnaissance de l'iris) mais nécessaires à une bonne compréhension du domaine en ce qu'il s'inscrit dans un domaine plus vaste la reconnaissance et l'identification des personnes par des caractéristiques biométriques.

les caractéristiques de l'iris pertinentes pour la reconnaissance

les types de réaction du système (appelés types de décision) selon les données recueillies (acceptation, rejet...)

l'évaluation des performances du système

 

On voit que nous avons là différentes petites nébuleuses de concepts qui vont s'articuler entre elles.

C'est ce que j'apellerais une représentation venue d'en haut.

Mais attention : "Ceci n'est pas une pipe"

C'est une hypothèse de représentation :

"Although this [ontology] isn't the only way to specify a conceptualization, it has some nice properties for knowledge sharing among AI software (e.g., semantics independent of reader and context)"(c'est moi qui souligne)

Lisez la citation complète:

"What is an Ontology?

http://ksl-web.stanford.edu/people/gruber/

Short answer:
An ontology is a specification of a conceptualization.
The word "ontology" seems to generate a lot of controversy in discussions about AI. It has a long history in philosophy, in which it refers to the subject of existence. It is also often confused with epistemology, which is about knowledge and knowing.

In the context of knowledge sharing, I use the term ontology to mean a specification of a conceptualization. That is, an ontology is a description (like a formal specification of a program) of the concepts and relationships that can exist for an agent or a community of agents. This definition is consistent with the usage of ontology as set-of-concept-definitions, but more general. And it is certainly a different sense of the word than its use in philosophy.

What is important is what an ontology is for. My colleagues and I have been designing ontologies for the purpose of enabling knowledge sharing and reuse. In that context, an ontology is a specification used for making ontological commitments. The formal definition of ontological commitment is given below. For pragmatic reasons, we choose to write an ontology as a set of definitions of formal vocabulary. Although this isn't the only way to specify a conceptualization, it has some nice properties for knowledge sharing among AI software (e.g., semantics independent of reader and context)[c'est moi qui souligne]. Practically, an ontological commitment is an agreement to use a vocabulary (i.e., ask queries and make assertions) in a way that is consistent (but not complete) with respect to the theory specified by an ontology. We build agents that commit to ontologies. We design ontologies so we can share knowledge with and among these agents.

This definition is given in the article:

T. R. Gruber. A translation approach to portable ontologies. Knowledge Acquisition, 5(2):199-220, 1993. Available on line.

A more detailed description is given in

T. R. Gruber. Toward principles for the design of ontologies used for knowledge sharing. Presented at the Padua workshop on Formal Ontology, March 1993, to appear in an edited collection by Nicola Guarino. Available online."

 

Dans cette représentation, on voit que l'on est en train de construire un système qui fait apparaître les relations des concepts entre eux.

__

PAR AILLEURS, même si inévitablement, nous allons avoir l'impression qu'une ontologie se dégage "naturellement",

il nous faut bâtir une structuration qui part du corpus, du texte lui-même, des termes en tant qu'éléments du discours et du sens qui se construit dans chaque occurrence du terme pris dans le texte.

DONC, dans chaque langue, en fonction du texte et des fichiers de concordances des termes construits à partir du corpus, donc DEPENDANTS de la typologie du corpus, nous allons construire une représentation terminologique qui va rendre compte de la construction du sens à partir des termes.

C'est ce que j'appellerais une représentation qui part du sol.

Il faut que cette représentation soit confirmée par toutes les occurences du terme, et c'est alors qu'on va pouvoir constater

 

Comment faire pour faire apparaître ces glissements, ce flou de la définition du concept :

Attention, "flou" ne veut pas dire "n'importe quoi" , mais plutôt, autour d'un noyau dur du concept, des marges plus fluctuantes. Cela ne dispense pas de la rigueur de la définition, mais conduit à mettre à l'épreuve du texte les hypothèses définitionnelles.

Exemple

voir l'arborescence de Cécile Hauchard pour son mémoire "Seafloor characterization using sonar systems ".

Cette représentation des concepts tels qu'ils sont exprimés par les termes suppose le repérage des relations hiérachiques des termes entre eux.

Ces relations hiérarchiques (génériques et ontologiques) devront être vérifiées de la même manière dans les corpus.(voir cours n°6)

Voir aussi Fanny Jarnet

"Enfin, j’ai tenté de construire des arborescences à visée ‘didactique’ qui aide à mieux cerner le domaine et à expliciter des termes du domaine plus général. En effet, une seule arborescence suffirait à représenter la quasi-totalité des termes du domaine. Aussi, j’ai d’une part choisi d’organiser les termes dans des arborescences qui représentent presque exclusivement des liens d’hyperonymie et d’autre part, des arborescences contenant presque exclusivement des liens indirects. C’est pourquoi les termes du domaine peuvent figurer dans plusieurs arborescences."