recursos

7 mandamientos para utilizar fuentes de datos de calidad en Business Analytics

7 mandamientos para utilizar fuentes de datos de calidad en Business Analytics

7 mandamientos para utilizar fuentes de datos de calidad en Business Analytics

Cada vez más, las decisiones en las empresas tienen que basarse en evidencia y menos en los instintos o intuiciones de los gerentes. Por supuesto, la experiencia y los conocimientos personales de cada directivo siempre influirán en sus decisiones, pero esencialmente los hechos deben ser la base de las decisiones. ¿Y de dónde vienen esos hechos? Los hechos, y el conocimiento que los sustenta, resultan principalmente de los datos que tienen las organizaciones y de cómo los organizan , es decir, de cómo transforman los datos en información y posteriormente, en conocimiento y sabiduría.

Sin embargo, si los datos tienen lo que técnicamente se llama falta de “calidad”, las decisiones que puedan surgir al tomar decisiones basadas en ellos pueden resultar incorrectas. Entonces, ¿cómo deberían ser las fuentes de datos de calidad? A ver, deberían ser:

1. Exacta : la muestra utilizada debe reflejar la población.

Por ejemplo, para estudiar la evolución de los precios no se puede simplemente estudiar una pequeña muestra de datos de hoteles o unos pocos hoteles de una cadena. Se deben utilizar todos los datos disponibles o una muestra estadísticamente válida.

2. Confiable : los datos no cambian si se extraen durante varios períodos.

Por ejemplo, si vamos a analizar reservas de un determinado periodo de tiempo que ya ha transcurrido, y tomamos dos muestras en fechas diferentes, ¿sufrirán cambios los datos contenidos en ambas muestras? No deberían sufrir.

3. Preciso - Debe contener la información necesaria para el problema en estudio en la forma más atómica posible.

Por ejemplo, si el problema es estudiar los patrones de cancelación de reservas por nacionalidad, los datos deben estar disponibles por reserva y no agregados por segmento, canal de distribución u otro atributo.

4. Imparcial - Los datos extraídos no deben verse afectados por ningún criterio que pueda poner en duda su validez estadística.

Por ejemplo, si para predecir el precio medio futuro el analista no incluye en la muestra de datos los datos de reserva de un operador o nacionalidad concretos, esto influirá en los modelos creados.

5. Válido - Se debe asegurar que se hayan implementado procesos adecuados para la extracción, organización y análisis de datos.

Por ejemplo, si se extrajeron datos que dicen que en un año determinado hubo un determinado número de noches-habitaciones ocupadas, ese número debe ser exactamente igual a lo que indica el PMS del hotel para esa misma medida.

6. Adecuada - Los datos a utilizar deben ser adecuados al problema en estudio.

Por ejemplo, si el objetivo es estudiar las no presentaciones en un hotel y los datos en cuestión no permiten distinguir las no presentaciones de las cancelaciones, la fuente de datos no es adecuada para el problema en estudio.

7. Oportuno - Los datos deben estar relacionados con el período en estudio y deben contener todas las observaciones posibles para ese período.

Por ejemplo, si desea desarrollar un modelo de overbooking para los próximos 5 días, pero la fuente de datos utilizada solo se actualiza una vez por semana, no debe usarse.

Dicho esto, la realidad es que, cuando se trabajan bien, los datos pueden darnos respuestas muy fiables a las preguntas que generan los resultados que buscamos. Sin embargo, es imperativo prestar atención a su calidad para que estas respuestas también sean las más precisas.

¿quiere saber más?

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

¿Está preparado para llevar su negocio al siguiente nivel?