Euskara|Espaol|English
manuscrito
|| TESITEK ||
BONAPARTE ONDAREKO ESKUIZKRIBUAK - FONDO BONAPARTE
Bonaparte

Metodología

Una vez recogidas las variantes gráfico-fonéticas, se fijaron las principales líneas de actuación orientadas a la anotación lingüística, siempre teniendo en cuenta que el análisis morfo-sintáctico pretende alcanzar la automatización en el proceso de etiquetado de los fenómenos pertinentes atendiendo al valor y función que en cada caso desempeñan.

La metodología seguida en la extracción y el tratamiento de datos morfológicos ha sido la siguiente:
  1. Definición de una serie de modelos de flexión y conjugación para el sistema nominal y el verbal, atendiendo a las diferencias tanto dialectales como subdialectales.
  2. Lematización manual de los términos que aparecen en cada uno de los textos y posterior asociación a cada uno de los modelos. De este modo, se obtienen todas las formas flexionadas y conjugadas de cada uno de los elementos, debidamente clasificadas y con el resto de información añadida.
  3. Respecto a las formas verbales, se ha procedido a partir de la recogida de testimonios textuales, y no de la reconstrucción, ya que este último método, si bien completaría todos los paradigmas, obligaría a trabajar sobre la analogía y, por tanto, restaría fiabilidad a las formas.
  4. El etiquetado lingüístico se ha ido configurando en dos fases. En la primera, se ha confeccionado un listado básico de atributos; mientras que la segunda ha supuesto la distribución de estos atributos por categorías.
Para la anotación se ha desarrollado un repertorio propio de etiquetas manteniendo la sintaxis de XML.

La metodología seguida en el nivel sintáctico difiere en su desarrollo de la anterior. No se presenta en este momento porque está en fase de implementación y prueba.

Por otra parte, la gran dificultad del proyecto ha exigido ir avanzando cautelosamente y trabajar sobre ámbitos de análisis reducidos. Una restricción impuesta ha sido la dialectal. Si bien en el nivel morfológico se ha trabajado sobre todos los dialectos conjuntamente, el nivel sintáctico, ciertamente muy complejo, obliga a concentrar el esfuerzo sobre un solo dialecto. Así, en la fase actual, se está implementando el subdialecto oriental del vizcaíno y en etapas sucesivas se continuará con el resto de los dialectos.

También en el ámbito morfológico quedan todavía muchas lagunas que completar, errores que corregir y formulas nuevas que explorar. No obstante, creemos que los resultados obtenidos nos indican que el proyecto va en la buena dirección y que pueden compartirse con la comunidad científica.
 
Selección de textos|Análisis morfológico|Análisis sintáctico|Glosario|Cotejo de Textos|Del Batua
Bizkaiko Foru Aldundia - Diputacin Foral de Bizkaia UNIVERSIDAD DE DEUSTO  DEUSTUKO UNIBERTSITATEA