# Resources du LST en xml ## Utilisation du standard LMF Les ressources du LST sont représentées en XML dans un modèle partiellement conforme à LMF (Lexical Markup Framework). - Les entrées Lexicales (mono ou polylexicales), les collocations et leurs traductions sont représentées avec des éléments tirés de LMF. Chacune est une entrée de lexique () associant un ou plusieurs lemmes (), à un sens (). Ces entrées sont dotées de définitions et d'exemples() représentés eux-aussi avec LMF. Plusieurs traits () et attributs (@source, @language, @text) sont également tirés des divers modules de LMF, de même que la manière de représenter les relations entres les entrées (collocatifs, traductions ...). Une portion significative et cohérente des données du lexique est ainsi standardisée. - Cependant, au delà de cette structure fondamentale, le LST contient des éléments d'analyse de ces entrées et des relations avec d'autres ressources (routines, fonctions, classes sémantiques), qui ne sont pas exprimées avec un schéma XML reprennant LMF mais selon un modèle ad-hoc. Un certain nobre d'éléments et d'attributs originaux sont donc présents au sein de cet export. ## Entrée Lexicale ```xml {Texte de l'exemple. L'entrée est mise en évidence en étant encadrée par un élément entrée} ... ... ``` ### Exemple Entrée Lexicale ```xml Ces fiches descriptivesabordaientdivers sujets et s'inscrivaient dans la perspective monographique prônée par Mauss. ... ``` ## Collocation ```xml {Texte de l'exemple. La collocation est mise en évidence en étant encadrée par un élément entrée} ... {????? - OPTIONNEL} {????? - OPTIONNEL} ... ``` ### Exemple Collocation ```xml 1 Précisons que nous considérerons,à la suite des travauxde M. - J. Reichler Beguelin, que la relation d' anaphore ne consiste pas à dupliquer les antécédents, mais à garder la trace de leur interprétation antérieure qui évolue en fonction des nouvelles propositions ou propriétés qui leur sont attribuées. Quelques jours plus tard, les ouvriers rouges votent en masse pour leur directeur [ 42 ]. " Cette image " apolitique " a été affirméeà la suite des travauxde l' équipe de Louis Girard sur les conseillers généraux de 1870 A la suite des travaux de qn(Nom d'auteur, Année), nous considérons que...]]> 7 MF 4 13 ``` ## Traduction ```xml {texte de l'exemple (cible) dans la langue indiquée} {texte de l'exemple (source) dans la langue indiquée} {????? - OPTIONNEL} {commentaire - OPTIONNEL} {Nombre total d'occurrence dans le corpus} ``` ### Exemple Traduction ```xml 意识状态 chaque état de conscience l' état de la conjoncture经济状况 validé dans BCC 70173 ``` ## Classes sémantiques ```xml {Texte de la définition de la classe en lien avec une catégorie Syntaxique précise} {????? - OPTIONNEL} {Texte de la définition de la classe en lien avec une catégorie Syntaxique précise} {????? - OPTIONNEL} ... ``` ### Exemple Classes sémantiques ```xml Regroupe les adjectifs décrivant le dénombrement ou la masse. Indique le dénombrement, la mesure d’une unité. renvoie à la notion de quantité, de mesure. calculer un n / un n s’élève à Grandeur résultant du rapport entre plusieurs valeurs. calculer/mesurer un N entre X et Y ... ``` ## Fonction Rhétoriques ### Exemple ```xml Pour définir le thème essentiel de la recherche (sujet d’étude, objectif, hypothèse, problématique) L’objet/sujet d’étude concerne qc Exposer au lecteur le thème que l’auteur souhaite aborder dans son article L’objet/sujet d’étude concerne qc Exposer au lecteur le but que l’auteur souhaite atteindre Le premier objectif est de + Vinf ... ``` ### Routines - Nombre de `` variable. - Nombre d'`` variable. - `` optionnel sur les exemples. - contenu des exemples est balisé, de manière irrégulière, donc encadré par `` ### Exemple ```xml Il (+ nous/me) + Vétat + ADJsurprise (+ de + Vanalyse + que) Il est frappant de constater que... Il peut paraître surprenant que... Il (nous/me) être, sembler, paraître, apparaître... frappant, surprenant, étonnant (de) (constater, observer, voir...) (que) Par ailleurs, il est frappant de constater de quelle manière l’influence des deux hommes s’est exprimée différemment]]> ... Quel que soit le type d’impact attribué aux évolutions démographiques, il est frappant de constater l’importance de ce facteur dans le débat allemand (Kabisch et al., 2006).]]> ... ``` ## Sources des exemples - Toutes les sources des exemples sont représentées dans un élément `` - Le lien se fait par la correspondance entre l'attribut `id=''` d'une ``et l'attribut `source=''` d'un élément `` ou d'un élément `` (représentation d'un exemple d'après LMF pour les Entrées Lexicales et les Collocations). ```xml {Citation bibliographique} ``` ### Exemple ```xml Lassègue, J., Rosenthal, V., & Visetti, Y-M. (2009). Économie symbolique et phylogenèse du langage. L'Homme, 192, 67-100. Consulté le 20 octobre 2014 : www.cairn.info/revue-l-homme-2009-4-page-67.htm. Macdonald (2008). L'anthropologie sociale en France, dans quel état ?. Ethnologie française, Vol. 38, 617-625. Consulté le 20 octobre 2014 : www.cairn.info/revue-ethnologie-francaise-2008-4-page-617.htm. ... ``` ## Statistiques ### Statisiques Entrée Lexicale ```xml {fréquence absolue (nombre d'occurrences) dans le corpus d'analyse} {fréquence relative (par million de mot) dans le corpus d'analyse} {fréquence relative (par million de mot) dans le corpus de contraste} {nombre d'apparition du lemme dans un n-gramme validé manuellement comme expression polylexicale contigüe (ex: 'point' dans 'point de vue') afin de soustraire ce nombre d'occurrences à la fréquence totale.} {résultat du ratio de la fréquence relative (par million de mots) dans le corpus d'analyse (CA) sur le corpus de constraste (CC)} {nombre de tranches différentes du corpus d'analyse (divisé en 100 tranches) dans lesquelles le lemme apparaît} {nombre de disciplines différentes dans lesquelles le lemme apparaît} {nombre de disciplines pour lesquelles la fréquence relative du lemme est supérieure par rapport au corpus de contraste} ``` #### Exemple Statisiques Entrée Lexicale ```xml 433 89.567 30.722 0 2.915 94 10 6 ``` ### Statisiques Collocation ```xml {fréquence absolue (nombre d'occurrences) dans le corpus d'analyse} {fréquence d'appariton de la collocation dans le corpus d'analyse (divisé en 100 tranches). Exprimée par les valeurs : MF, F, TF. } {nombre de disciplines différentes dans lesquelles la collocation apparaît} {Log-likelihood : probabilité que les deux mots (base et collocatif) sont utilisés ensemble plus souvent que le hasard. } ``` #### Exemple Statisiques Collocation ```xml 7 MF 4 13 ```