7 mandamientos para utilizar fuentes de datos de calidad en Business Analytics
7 mandamientos para utilizar fuentes de datos de calidad en Business Analytics
Cada vez más, las decisiones en las empresas tienen que basarse en evidencia y menos en los instintos o intuiciones de los gerentes. Por supuesto, la experiencia y los conocimientos personales de cada directivo siempre influirán en sus decisiones, pero esencialmente los hechos deben ser la base de las decisiones. ¿Y de dónde vienen esos hechos? Los hechos, y el conocimiento que los sustenta, resultan principalmente de los datos que tienen las organizaciones y de cómo los organizan , es decir, de cómo transforman los datos en información y posteriormente, en conocimiento y sabiduría.
Sin embargo, si los datos tienen lo que técnicamente se llama falta de “calidad”, las decisiones que puedan surgir al tomar decisiones basadas en ellos pueden resultar incorrectas. Entonces, ¿cómo deberían ser las fuentes de datos de calidad? A ver, deberían ser:
Por ejemplo, para estudiar la evolución de los precios no se puede simplemente estudiar una pequeña muestra de datos de hoteles o unos pocos hoteles de una cadena. Se deben utilizar todos los datos disponibles o una muestra estadísticamente válida.
Por ejemplo, si vamos a analizar reservas de un determinado periodo de tiempo que ya ha transcurrido, y tomamos dos muestras en fechas diferentes, ¿sufrirán cambios los datos contenidos en ambas muestras? No deberían sufrir.
Por ejemplo, si el problema es estudiar los patrones de cancelación de reservas por nacionalidad, los datos deben estar disponibles por reserva y no agregados por segmento, canal de distribución u otro atributo.
Por ejemplo, si para predecir el precio medio futuro el analista no incluye en la muestra de datos los datos de reserva de un operador o nacionalidad concretos, esto influirá en los modelos creados.
Por ejemplo, si se extrajeron datos que dicen que en un año determinado hubo un determinado número de noches-habitaciones ocupadas, ese número debe ser exactamente igual a lo que indica el PMS del hotel para esa misma medida.
Por ejemplo, si el objetivo es estudiar las no presentaciones en un hotel y los datos en cuestión no permiten distinguir las no presentaciones de las cancelaciones, la fuente de datos no es adecuada para el problema en estudio.
Por ejemplo, si desea desarrollar un modelo de overbooking para los próximos 5 días, pero la fuente de datos utilizada solo se actualiza una vez por semana, no debe usarse.
Dicho esto, la realidad es que, cuando se trabajan bien, los datos pueden darnos respuestas muy fiables a las preguntas que generan los resultados que buscamos. Sin embargo, es imperativo prestar atención a su calidad para que estas respuestas también sean las más precisas.
¿quiere saber más?