/
Groupe  Corpus d'état anciens de la langue Groupe  Corpus d'état anciens de la langue

Groupe Corpus d'état anciens de la langue - PowerPoint Presentation

mindeeli
mindeeli . @mindeeli
Follow
343 views
Uploaded On 2020-08-06

Groupe Corpus d'état anciens de la langue - PPT Presentation

Groupe concerné par les thématiques de plusieurs autres groupes 1 3 et 4 6 8 9 10 11 Enjeux Etat des pratiques et des ressources concernant le français ancien Modes de fonctionnement ID: 800326

les des corpus textes des les textes corpus pour umr dition int

Share:

Link:

Embed:

Download Presentation from below link

Download The PPT/PDF document "Groupe Corpus d'état anciens de la lan..." is the property of its rightful owner. Permission is granted to download and print the materials on this web site for personal, non-commercial use only, and to display it on your personal computer provided you do not modify the materials and that you retain all copyright notices contained in the materials. By downloading content from our website, you accept the terms of this agreement.


Presentation Transcript

Slide1

Groupe Corpus d'état anciens de la langue Groupe concerné par les thématiques de plusieurs autres groupes (1, 3 et 4, 6, 8, 9, 10, 11)Enjeux : Etat des pratiques et des ressources concernant le français ancienModes de fonctionnement : 1 réunion physique + échanges électroniques Participants : UMR Atilf : S. Bazin, G. Petrequin, G. Souvay ; UMR CESM : M.-L. Demonet ; UMR Htl : B. Colombat ; UMR Icar : C. Guillot, S. Heiden, A. Lavrentiev, D. Vigier ; UMR Lattice : S. Prévost ; UMR Modyco : A. Bertin, M.-C. Pouder ; UMR Praxiling : A. Steuckardt ; EA Lilpa : D. Capin ; EA Stih : J. Ducos, T. Ponchon ; Ecole n. des Chartes : F. Duval ; et ponctuellement D. Trotter (U. du Pays de Galles)

1

Slide2

Avancées: Délimitation de la période considérée : 9ème -17ème sièclesCritère principal de ce choix : absence de norme tout au long de la période mais aussi les modalités d’édition des textes qui changent au fur et à mesure qu’on se rapproche de la période actuelle. Décision de recenser :les bases/corpus existants ET disponibles dont les textes sont en mode texte (versus image)les textes édités dans le cadre d’une thèseRemarque : décision de laisser de côté les français hors de FranceEtablissement d’une grille pour les bases/corpus et pour les textesGrille inspirée de celle élaborée par le Consortium international pour les Corpus de Français Médiéval : http://ccfm.ens-lyon.fr/spip.php?rubrique19. Définition des

personnes responsables par période Mission : aider à recenser les bases

existantes et se mettre en relation avec les responsables/gestionnaires pour les aider à recenser leurs ressources

.

2

Slide3

Critères retenus pour les bases/corpus (* champs indispensables) :*Période couverte (terminus ab quo/ad quem)*Dialecte(s)*Nombre de mots*Textes intégraux / partiels*Forme (vers/prose/mixte)*Source de la numérisation *Format des textes (XML/TEI, autres)*Types d’enrichissement : lemmatisation, étiquetage, annotation, etc. ; enrichissement partiel/intégral*Domaine et genre textuel*Statut juridiques des textes : type de diffusion (libre/restreinte ; gratuite/payante ; licence) et types d’utilisateurs/d’usages ; nature des restrictions (téléchargement ou non, taille des contextes, etc.) ; possibilités de référence/citationLa grille pour les textes (à l’intérieur des bases/corpus) comporte davantage de critères.

3

Slide4

Critères retenus pour les textes (* champs indispensables) :*Titre*Auteur*Identifiant (sigle DEAF si disponible)*Date de composition*Date du manuscrit*Dialecte de l’auteur*Dialecte du scribeOrigine sociale de l’auteurOrigine sociale du scribe*Editeur scientifique

*Editeur commercial (maison d’édition, date, lieu)

*Identification du manuscrit (ville, bibliothèque, cote

)*Nombre de mots

*Texte intégral / texte partiel

*Forme

(

vers/prose/mixte)

S

tructure

du texte 

: type de vers (octosyllabe etc.), divisions internes (laisses, strophes, livres, chapitres, etc

.)

Relation

(partie de recueil, corpus, collection, ensemble, compilation, traduction, version

…)

Caractérisation

de l’édition / de la transcription :

choix d’un ou de plusieurs mss, respect des graphies, de la ponctuation, etc

.

4

Slide5

*Source de la numérisation: numérisation d’une édition imprimée récente, d’une édition imprimée ancienne, édition numérique*Format des textes (XML/TEI, autres)*Outil d’interrogation*Types d’enrichissement : lemmatisation, étiquetage, annotation, etc. ; enrichissement partiel/intégralméta-informations : par ex. existence d’un glossaire,... *Domaine et genre textuel  (cf. typologie établie par le projet Corptef)*Statut juridiques des textes : type de diffusion (libre/restreinte ; gratuite/payante ; licence) et types d’utilisateurs/d’usages ; nature des restrictions (téléchargement ou non, taille des contextes, etc.) ; possibilités de référence/citationCertains critères sont mieux adaptés au Moyen Age…************************************************************************Calendrier : recension et documentation : 15 décembre 2012 5