Procesamiento del Lenguaje Natural para Recuperación de Información

Recuperación y acceso a la información

                                                                   

Procesadores de lenguaje natural


Como mencionamos anteriormente el Lenguaje Natural(LN) es el medio que utilizamos de manera cotidiana para establecer nuestra comunicación con las demás personas

Este tipo de lenguaje es el que nos permite el designar las cosas actuales  y razonar a cerca de ellas, fue desarrollado y organizado a partir de la experiencia humana y puede ser utilizado para analizar situaciones altamente complejas y razonar muy sutilmente. 

La riqueza de sus componentes semánticos da a los lenguajes naturales su gran poder expresivo  y su valor como una herramienta para razonamiento sutil.  

Por otro lado la sintaxis de un LN (Lenguaje Natural) puede ser modelada fácilmente  por un lenguaje formal, similar a los utilizados en las matemáticas y la lógica. Otra propiedad de los lenguajes naturales es la polisemantica, es decir la posibilidad de que una palabra en una oración tenga diversos significados.

En un primer resumen, los lenguajes naturales se caracterizan por las siguientes propiedades:

  1. Desarrollados por enriquecimiento progresivo antes de cualquier intento de formación de una teoría.
  2. La importancia de su carácter expresivo debido grandemente a la riqueza del componente semántico(polisemantica).
  3. Dificultad o imposibilidad de una formalización completa.

Las aplicaciones del Procesamiento de Lenguajes Naturales son muy variadas, ya que su alcance es muy grande, algunas de las aplicaciones del PLN son:


  • Traducción automática: se refiere más que nada a la traducción correcta de un lenguaje a otro, tomando en cuenta lo que se quiere expresar en cada oración, y no solo palabra por palabra. Una aproximación a este tipo de traductores es el babylon.

  • Recuperación de la información: en esta aplicación, un claro ejemplo seria el siguiente: Una persona llega a la computadora y le dice(en LN) que es lo que busca, esta busca y le dice que es lo que tiene referente al tema.

  • Extracción de Información y Resúmenes: Los nuevos programas, deben tener la capacidad de crear un resumen de un documento basándose en los datos proporcionados, realizando un análisis detallado del contenido y no solo la truncando las primeras Lineas de los párrafos.

  • Resolución cooperativa de problemas: La computadora debe tener la capacidad de cooperar con los humanos para la solución de problemas complejos, proporcionando datos e información, incluyendo también, la demanda de información por parte del ordenador al usuario, debiendo existir una excelente interactividad entre el usuario y el ordenador.

  • Tutores inteligentes: La aplicación del PLN en este aspecto, vienen por computadora, debiendo esta ser aprox. en  un 99%, al tener esta la capacidad de evaluar al educando  y tener la capacidad de  adaptándose a cada tipo de alumno.

  • Reconocimiento de Voz: Esta es una aplicación del PLN que más éxito ha obtenido en la actualidad, ya que las computadoras de hoy ya tienen esta característica, el reconocimiento de voz puede tener dos posibles usos: para identificar al usuario o para procesar lo que el usuario dicte,  existiendo ya programas comerciales, que son accesibles por la mayoría de los usuarios, ejemplo: ViaVoice.

Para continuar nuestro estudio de los lenguajes naturales, es necesario el que conozcamos los niveles del lenguaje, los cuales serán utilizados para la explicación de el siguiente tema que es la Arquitectura de un sistema de PLN. Los niveles de lenguaje que daremos a conocer son los siguientes: fonológico, morfológico, sintáctico, semántico, y pragmático.

  • Nivel Fonológico: trata de cómo las palabras se relacionan con los sonidos que representan. 
  • Nivel Morfológico: trata de cómo las palabras se construyen a partir de unas unidades de significado mas pequeñas llamadas morfemas.
  • Nivel Sintáctico: trata de cómo las palabras pueden unirse para formar oraciones, fijando el papel estructural que cada palabra juega en la oración  y que sintagmas son parte de otros sintagmas. 
  • Nivel Semántico:  trata del significado de las palabras y de cómo los significados se unen para dar significado a una oración, también se refiere al significado independiente del contexto, es decir de la oración aislada. 
  • Nivel Pragmático: trata de cómo las oraciones se usan en distintas situaciones y de cómo el uso afecta al significado de las oraciones. Se suele reconocer un subnivel recursivo: discursivo, que trata de cómo el significado de una oración se ve afectado por las oraciones inmediatamente anteriores.

Arquitectura de un sistema de PLN

La explicación a la arquitectura mostrada para los sistemas PLN  es sencilla:

  1. El usuario le expresa a la computadora que es lo que desea hacer.
  2. La computadora analiza las oraciones proporcionadas, en el sentido  morfológico y sintáctico, es decir, si las frases contienen palabras compuestas por morfemas y si la estructura de las oracioneses correcta.
  3. El siguiente paso, es analizar las oraciones semánticamente, es decir saber cual es el significado de cada oración, y asignar el significado de estas a expresiones lógicas.
  4. Una vez realizado el paso anterior, ahora podemos hacer el análisis  pragmático de la instrucción, es decir una vez analizadas las oraciones, ahora se analizan todas juntas, tomando en cuenta la situación de cada oración, analizando las  oraciones anteriores, una vez realizado este paso, la computadora ya sabe que es lo que va a hacer, es decir, ya tiene la expresión final.
  5. Una vez obtenida la expresión final, el siguiente paso es la ejecución de esta, para obtener así el Resultado y poder proporcionárselo al usuario.

    Uno de los grandes problemas del PLN se produce cuando una expresión en lenguaje natural posee más de una interpretación, es decir, cuando en el lenguaje de destino se le pueden asignar dos o más expresiones distintas. Este problema de la ambigüedad se presenta en todos los niveles del lenguaje, sin excepción. Ejemplo:

"Juan vio a María, con el telescopio"

"Juan vio a María con el telescopio"


   
En apariencia este problema es demasiado sencillo, pero en realidad, es uno de los mas complicados y que más complicaciones ha dado para que el PLN pueda desarrollarse por completo, ya que al presentarse en todos los niveles del lenguaje, se tienen que desarrollar programas( en lenguaje formal) para solucionarlos en cada caso.

    Entre las técnicas inductivas aplicadas para resolver estas tareas de desambiguación se puede encontrar el aprendizaje basado en ejemplos, aprendizaje basado en reglas de transformación, inferencia gramatical, y aproximaciones estadísticas basadas en modelos de máxima entropía o en modelos ocultos de Markov (HMM).

    Estos últimos se han utilizado ampliamente en el campo del reconocimiento automático del habla tanto para el modelado acústico como para la construcción de modelos del lenguaje para el reconocimiento, tanto de palabras aisladas, como del discurso continuo.

    El éxito en estos sistemas y la disponibilidad de recursos ha permitido su extensión a los sistemas de PLN. Para poder llevar a cabo otras tareas de desambiguación en PLN utilizando modelos de Markov es necesario abordar cada una de éstas como problemas de etiquetado.

    Además del etiquetado morfosintáctico, otros problemas como son el análisis sintáctico superficial o la desambigüación del sentido de las palabras, también pueden reducirse a un problema de etiquetado.

    Por ejemplo, en la tarea de análisis superficial o chunking, el análisis de una oración puede representarse mediante etiquetas que indican a qué sintagma pertenece una palabra.

    En este caso, la secuencia de observaciones pueden ser etiquetas morfosintácticas y los estados del modelo representan etiquetas de sintagma o de chunk.

    En caso de considerarse un análisis más complejo, como es el caso de la detección de cláusulas, pueden utilizarse etiquetas estructuradas que marquen el nivel de anidamiento de la palabra dentro del análisis. La desambiguación semántica puede verse como la asignación de la secuencia más probable de etiquetas semánticas (o sentidos) a las palabras de una oración.



Fecha ultima actualizacion: 05 de Abril de 2.007

Free Web Hosting