Procesamiento del Lenguaje Natural para Recuperación de Información

Recuperación y acceso a la información

                                                                   

Introducción

    En el último congreso internacional sobre Web Semántica la presencia de aplicaciones centradas en Procesamiento de Lenguaje Natural para la recuperacion de informacion(PLN) fue más que notable, de hecho, Gate, una conocida aplicación para ingeniería lingüística diseñada en la universidad de Sheffield, fue una de las estrellas invitadas  al figurar referenciada en un buen número de los trabajos presentados al congreso.

    Ahora bien, la utilidad del procesamiento natural del lenguaje para la implementación de una Web Semántica, no es un descubrimiento de este año. En el pasado 2004, Ricardo Baeza-Yates firmo un interesante trabajo sobre la aplicación de técnicas de procesamiento del lenguaje natural para la Recuperación de Información donde proponía a la Web Semántica como una de las principales aplicaciones prácticas de técnicas convinadas de PLN (procesamiento del lenguaje natural) y RI(recuperación de información).

    Muchos pueden argumentar que el propio padre de la idea defiende que la Web Semántica no es una Web basada en técnicas pertenecientes al área de Inteligencia Artificial (IA), pero esto no significa que no podamos utilizar estas técnicas como base y apoyo para la implementación de su idea, ya que, más allá de rencillas de carácter académico, todo lo que nos ayude a hacer realidad una nueva Web es útil independientemente de conceptualizaciones de
carácter teórico.

    Hay que tener en cuenta que, hoy por hoy la Web Semántica no existe como tal, más allá de implementaciones puntuales de carácter experimental. El hecho de que exista pasa inexorablemente por la generación de contenidos web semánticos que den cuerpo a la idea de una web más organizada. La generación de contenidos de carácter semántico no es asimilable de forma manual por lo usuarios y autores de la Web, por lo que es necesario la automatización de todas, o por lo menos parte de las tareas de generación de contenidos web semánticos. Es aquí donde
el PLN y la RI tienen mucho que aportar, ya que permiten la implementación de aplicaciones capaces de generar información de tipo semántico que dote de cuerpo a la Web Semántica y la conviertan en una realidad.

    Analizadores sintácticos, que permitan comprender la estructura de las frases de forma automática, etiquetadores léxicos, reconocedores de entidades como nombres, fechas lugares, todas ellas son herramientas automáticas esenciales para la generación de contenidos web semánticos, es más, me atrevo a decir que sin ellas no es posible una Web Semántica real, ya que el coste de elaboración manual de contenidos semánticos no es asimilable desde ningún punto de vista.


Fecha ultima actualizacion: 10 de Abril de 2.007
Free Web Hosting