Euskara|Español|English
manuscrito
|| TESITEK ||
BONAPARTE ONDAREKO ESKUIZKRIBUAK - FONDO BONAPARTE
Bonaparte

Etiketatzea

Testurako sarbideak etiketatzeak ematen dituen bi aldeen artean aukeratzeko bidea eskaintzen du: goiburua eta testua bera.

Goiburuak paperezko edizioan agertzen den informazio bibliografiko eta dokumental guztia biltzen du. Horrez gain, proiektuaren goiburu orokorra egin da. Bertan agertzen den informazioa hau da: aurreko edizioen informazio bibliografikoa, proiektuaren deskribapen txiki bat eta corpus digitalaren elaborazio propioaren taxonomia digitala. Sailkapen honek, ikerketaren goiburu orokorrean dagoena, hierarkiak ezartzeko eta digitalizatutako testuen arteko erlazioak egiteko bidea ematen du, kriterio hauek jarraituz: euskalkia, azpieuskalkia, aldakia eta tipologia testuala.

Etiketatze estrukturala XML markaketa lengoaiaren bitartez egin da, TEIren (Text Encoding Initiative) arauak jarraituz, lengoaia estandar bat ezartzeko asmoz. Hasiera batean, etiketatzea TEI Masterren (Manuscript Access through Standards for Electronic Records) arauak jarraituz egin bazen ere, gero TEI P5 (http://www.tei-c.org) bertsioaren gida orokorreko moldaketa egin zen.

Bestalde, testuaren tipologiaren araberako markaketarako ere TEIren arauak jarraitu dira. Horrela, prosaz idatzitako testuetan, testu (<text>) bakoitzaren gorputzak (<body>) honako osagaiak ditu: dokumentuaren titulua (<head>), kapituluka banaketa (<div type="kapitulua" n="">) dagokion zenbakia duelarik eta kapitulu bakoitzean, titulua (<head>) eta bertsikuluen zerrenda (<list type="bertsikulua">), bakoitza numeratuta (<item n="">) eta, beharrik balitz, goiburu txiki bat (<p>) aurretik, informazioaz edo edukiaren laburpenaz. Etiketa horiek ez dira nahita nahiez agertzen, eta, kasu batzuetan, Gure Aitan, esaterako, etiketen beharra goiburura (<head>) eta paragrafo bakar batera (<p>) mugatzen da.

Dokumentuen egiturarako erabilitako kapituluak eta beraien funtzioak hauek dira:
  • Kapitulu 2: The TEI Header. Lan kodifikatu baten deskripzioak dituen arazoak hartzen ditu, testua bera, bere jatorria, bere kodifikazioa eta berrikusketak dokumentatuak ager daitezen.
  • Kapitulu 3: Elements available in all TEI documents. Testu baten ager daitekeen edozein elementu eta TEI dokumentuak markatzeko erabiltzen diren kodigoak deskribatzen ditu.
  • Kapitulu 4: Default text structure. TEI dokumentuentzat maila altuko egituraren defektuzko balorea deskribatzen da.
  • Kapitulu 7: Performance texts. Testu dramatikoak, elkarrizketak eta edozein moduko idatziak kodifikatzeko.
  • Kapitulu 10: Manuscript description. Eskuz idatzitako iturriak deskribatzeko informazio zehatza eskain dezakeen helburu bat definitzen da.
  • Kapitulu 15: Language corpora. TEI dokumentu batean konbinatzeko aukera desberdinak eskaintzen ditu, corpusa, goiburuak eta haren testua edo testu-talde posibleak.
  • Kapitulu 16: Linking, segmentation and alignment. Kodifikatzaile guztiak deskribatzen ditu, kodifikatzaile horiek testu bateko paragrafoak, esaldiak eta hitzak lotzen ala segmentatzen laguntzen dute, edo testutik kanpoko dokumentuekin ere bai, nahi eta nahi ez egitura laua ala hierarkikoa jarraitu gabe.
Oin-oharrei dagokienez, oro har, paperezko edizioarenak gorde dira, zenbaitetan osatu egin direlarik. Bestalde, bilaketa errazagoa egiteko, lau talde tipologikoetan banatu dira:
  1. Testualak, kolore marroia.
  2. Ohar historikoak, kolore horia.
  3. Linguistikoak, kolore gorria.
  4. Mota mistoa, aurrekoen konbinazioa biltzen dutenak, kolore urdina.
Gorde dira, zuzendutako kasu batzuk kenduta, paperezko edizioko sic guztiak. Berdez nabarmendu dira erabiltzaileak hobeto ikus ditzan.

Etiketatzean jarraitu den hizkuntza estandarra ingelesa izan da, arauetan deskribatzen ez diren atributuen baloreak kenduta. Horiek euskarara itzuli dira, hizkuntza horren etiketaziorako proposamena sortuz.

Azkenik, dialekto ezberdinen aldaeren konparazioak errazteko helburuarekin, bistaratzeko interfazeak testu baten bertsioen erkaketa ahalbidetzen du, lauraino gehienez.
 
Testuen hautaketa|Analizatzaile morfologikoa|Analizatzaile sintaktikoa|Glosarioa|Testuen erkaketa|Batueratik
Bizkaiko Foru Aldundia - Diputación Foral de Bizkaia UNIVERSIDAD DE DEUSTO · DEUSTUKO UNIBERTSITATEA