Recuperación de Información. Indexación de lemas y frases

Enunciado

La práctica propuesta consistirá en la construcción de un módulo de indexación que trabajará sobre un indexador convencional y que realizará la indexación de documentos con lemas en lugar de formas. 

Como segunda parte del trabajo se planteará una ampliación que indexará grupos de palabras relacionados (pares nombre-adjetivo, etc...). 

También será necesario un pequeño módulo de consulta que genere consultas para ese índice.

Documentación y herramientas a emplear.

Pagina de los desarrolladores de swhish-e (con manuales y enlaces al código fuente)  Información sobre el etiquetador GALENA (debian)  Información sobre FREELING (herramienta NLP que incluye un etiquetador)  Binarios y código fuente de las herramientas Documentos para pruebas Filtros