Análisis de datos: Más datos no significa más información.

La búsqueda perpetua de datos cada vez más ricos es quizás el motor más poderoso de la era digital. Hemos llegado a aceptar sin lugar a dudas que con más datos se obtienen mejores conocimientos. El aumento del aprendizaje profundo que necesita mucha información solo ha intensificado este impulso, incluso con modelos rudimentarios que requieren
 
serman, laboratorio de recuperación de datos en españa

La búsqueda perpetua de datos cada vez más ricos es quizás el motor más poderoso de la era digital. Hemos llegado a aceptar sin lugar a dudas que con más datos se obtienen mejores conocimientos. El aumento del aprendizaje profundo que necesita mucha información solo ha intensificado este impulso, incluso con modelos rudimentarios que requieren enormes volúmenes de datos seleccionados para obtener resultados suficientemente sólidos. En realidad, es importante identificar en estas nuevas tendencias que lo importante no es tener más datos, sino saber cómo llevar a cabo un buen análisis.

Los vastos archivos de datos íntimos de clientes retenidos por las compañías actuales para potenciar su análisis de datos no están exentos de riesgos de seguridad cibernética enormes y a menudo novedosos. Al acumular colecciones cada vez más grandes y ricas de datos sobre los clientes, las empresas se exponen a crecientes riesgos de reputación, legales y financieros. Esto sugiere que los beneficios de todos esos datos deben ser mucho mayores que los riesgos de reunirlos y archivarlos.

¿Qué son los datos de baja calidad?

Desafortunadamente, la realidad es que pocas organizaciones hacen un uso sólido y significativo de todos los datos que recopilan y conservan.

A medida que los datos se combinan cada vez más con la “verdad”, se politizan cada vez más. Los líderes recurren al análisis de datos para otorgar credibilidad falsa a las decisiones que ya han tomado. Grandes archivos de datos se seleccionan y se ejecutan a través de algoritmos que se ajustan cuidadosamente hasta que producen conclusiones predeterminadas, que luego se justifican como “probadas por los datos”.

Los datos que las empresas pueden recopilar sobre sus clientes a menudo no son adecuados para las acciones específicas que desean ejecutar sobre ellos. Sabiendo que un usuario busca repetidamente en su sitio web un producto específico, pero nunca lo compra, le dice que puede estar interesado en ese producto. Lo que no le dice es por qué nunca compran ese producto, ya sea simplemente comparando precios, si su sitio tiene más detalles que un competidor más barato o cuál es precisamente el obstáculo de la conversación. Del mismo modo, las marcas quieren saber qué les gusta y qué no les gusta a sus clientes de sus productos. El monitoreo de publicaciones en redes sociales captura solo a los clientes más vocales y es vulnerable a publicaciones falsas y campañas activistas. También refleja solo los problemas que los clientes sienten más fuertemente.

Las empresas están inundadas de datos, pero generalmente están mal alineados con sus necesidades comerciales reales.

Diferencias en el análisis de datos

En una era anterior, las empresas trabajaban para recopilar los datos que necesitaban. Organizaban grupos focales, encuestas, colocaban representantes en las tiendas y muchas otras técnicas para recopilar datos de alto valor y contacto que respondieran a las preguntas específicas que tenían. Las compañías fabricantes incluso ofrecerían a los clientes y potenciales clientes prototipos de nuevos productos para probar. Si bien estos enfoques aún se usan, hay una presión cada vez mayor en muchas compañías para que se alejen de estos enfoques de medición que requieren mano de obra y costos para la cosecha, en comparación al análisis de datos “gratuitos” extraídos de la Web o transmitidos desde plataformas de redes sociales.

El aumento de datos “gratuitos” y la priorización de grandes volúmenes de datos sin costo pero de baja calidad sobre la creación paga de datos de alta calidad pero costosos ha tenido un impacto particularmente peligroso en el análisis de datos.

Después de todo, el sesgo de IA no proviene de algoritmos sesgados inherentemente, sino de datos de entrenamiento sesgados porque las empresas no están dispuestas a pagar por datos lo más objetivos posibles de alta calidad.

¿Y teniendo datos fiables qué ocurre?

Lo más importante, incluso cuando las empresas tienen los datos correctos y las herramientas adecuadas, con frecuencia no están dispuestas a hacer los cambios que los datos les dicen que necesitan. Si los datos sugieren que el mayor generador de dinero de una empresa debería abandonarse a favor de la inversión en una tecnología nueva y no probada, pocos ejecutivos están dispuestos a arriesgar sus carreras con el asesoramiento de un algoritmo en comparación con sus propios instintos.

Tal resistencia a actuar sobre las ideas de los datos se extiende incluso al público en general. En una era de medición personal casi ilimitada donde podemos rastrear cada caloría que comemos, cada paso que damos, nuestro peso, presión arterial, pulso, oxigenación de la sangre y un número cada vez mayor de indicadores biomédicos en tiempo real, las tasas de obesidad están aumentando . Parece que incluso con datos ilimitados sobre nuestra salud, no podemos tomar medidas sobre esos datos.

Al final, las empresas corren grandes riesgos para acumular volúmenes cada vez mayores de datos sobre sus clientes. La verdadera pregunta es si todos estos datos realmente están conduciendo a mejores resultados.

serman, laboratorio de recuperación de datos en españa
 

Los comentarios están cerrados.