recursos

Hay información valiosa en los datos no estructurados de las organizaciones

Hay información valiosa en los datos no estructurados de las organizaciones

Hay información valiosa en los datos no estructurados de las organizaciones

¿Qué son los datos no estructurados? Se consideran como tales los datos que no están organizados en una estructura rígida, como texto, vídeo o fotografías. Hasta hace unos años extraer información de estas fuentes era muy complejo y, sobre todo, requería mucho tiempo. Sin embargo, con los avances tecnológicos de los últimos años, ya sea en términos de algoritmos y técnicas o de potencia computacional, esta tarea se ha vuelto mucho más sencilla. Hoy en día clasificar segmentos de un vídeo, identificar/catalogar imágenes o extraer información de textos es algo relativamente común. Sin embargo, sólo las universidades, los centros de investigación o las grandes empresas se aprovechan de esta revolución tecnológica, porque muchas veces las pequeñas y medianas empresas ni siquiera conocen esa posibilidad.

Para dar a conocer el potencial de estas tecnologías y métodos, y principalmente su impacto en el turismo y la hostelería, con este post iniciaré una serie de publicaciones sobre Procesamiento del Lenguaje Natural (PNL), una de las áreas con mayor crecimiento en la actualidad.

De manera simplista, se puede decir que la PNL es una subárea de la inteligencia artificial, cuyo objetivo es permitir que las computadoras comprendan y procesen el lenguaje humano . Esta comprensión y procesamiento normalmente se dividen en un conjunto de tareas que a veces se aplican juntas, a saber:

  • Análisis de sentimiento : le permite analizar la polaridad del sentimiento en un texto (sentimiento negativo o positivo);
  • Análisis de similitud : permite comparar la similitud entre textos;
  • Coherencia textual : permite analizar y estudiar la coherencia de la redacción de un texto;
  • Conversión de texto a voz y de voz a texto : le permite convertir grabaciones de voz a texto y viceversa;
  • Extracción de terminología : permite extraer términos específicos de un área basándose en textos de esa misma área;
  • Generación de texto : le permite crear textos automáticamente;
  • Identificación de entidades : permite identificar entidades en un texto (sin conocimiento previo de los nombres o tipos de entidades);
  • Identificación de temas : permite identificar temas abordados por un conjunto de textos;
  • Conexión de entidad : le permite identificar conexiones entre entidades en función de un conjunto de textos;
  • Traducción automática : te permite traducir textos automáticamente;
  • Resumen automático de texto : le permite resumir textos grandes en unos pocos párrafos u oraciones;
  • Entre muchos otros.

En esta secuencia, el próximo post estará dedicado a algunos ejemplos del potencial de PLN en el turismo y la hostelería, comenzando por el análisis de sentimientos y la extracción de terminología aplicada a los comentarios publicados por los clientes de los hoteles en los distintos sitios web a tal efecto. Con estos ejemplos podremos comprobar que la información extraída de los textos de miles de comentarios online es mucho más rica y tiene potencial de ser procesable en términos de gestión que la información extraída de las valoraciones de estos comentarios.

¿quiere saber más?

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

¿Está preparado para llevar su negocio al siguiente nivel?