lunes, 20 de noviembre de 2017

La ingeniería del Big Data; Cómo trabajar con datos


Estimad@s amig@s

Sinopsis
Big data es más que una propiedad de una masa de datos o un conjunto de tecnologías. Utilizado efectivamente es el vehículo para implementar un paradigma data driven, tal vez el mayor desafío y salto de calidad al que pueden aspirar las organizaciones actualmente, y una necesidad estratégica para ser competitivos en el futuro. Este libro recorre los estadios necesarios para ejecutar eficazmente estas iniciativas: un entendimiento de los datos y la información, los tipos de tecnologías, cómo comenzar un proyecto desde cero, errores de novatos, alcanzando la madurez y perspectivas sobre el futuro.

«La solución adecuada para el problema equivocado solo generará los problemas nuevos del mañana»

La ingeniería del big data, aún está poco madura en las organizaciones. Trabajar con datos sigue siendo cosa de cuatro frikis, no somos conscientes del valor y la información que aportan los datos en la mejora de los procesos de toma de decisiones.

Dentro de poco esperemos que hablar de trabajar con datos, o tomar decisiones a tiempo real basadas en datos, no sea una rara avis, sino más bien todo lo contrario, y forme parte de las dinámicas de gestión de las organizaciones.

« No soy producto de mis circunstancias,
soy producto de mis decisiones»
Steven Covey  

Un territorio sin un mapa incomoda a muchos, especialmente si sienten que su valor está siendo disputado (…) significa tener una imagen clara del pasado y del presente para reconocer tendencias y cambios verdaderos, significa evaluar y explorar los principios para exponer los sesgos (…) poder ver el bosque, pero a la vez el árbol, sin deslumbrarse con las apariencias.

Tipos de análisis

● Descriptivo
● Predictivo
● Prescriptivo
●  Asistido

Big data se refiere normalmente a la aplicación de un enfoque científico-práctico a la resolución de problemas de datos en los cuales se necesita atacar eficientemente a uno o más de los tres atributos principales: volumen o cantidad de datos, variedad en el origen y/o formato de los datos, y velocidad de generación y/o consumo de los datos.

En el momento de arrancar un proyecto de big data, uno de los errores más comunes en anteponer la tecnología a la resolución de los objetivos y conocimiento de negocio (…)

(…) siempre debemos comenzar por el entendimiento de las condiciones de negocio y de la problemática a resolver.

1.   entendimiento de negocio,
2.   maquetado de perspectivas,
3.   definición de infraestructuras y soporte[i],
4.   definición de interfaces y etapas, planteo del esquema de deployment continuo.

La contracara de «simple es hermoso» es que un proyecto de data science bien ejecutado, aun cuando sea dificultoso, parecerá, ante ojos ajenos, relativamente fácil de ejecutar. Este problema de relaciones públicas ocurre, siendo difícil mostrar avances a clientes cuando la mayor parte del trabajo no parece ser impresionante.

La maduración ocurre en el momento en que es la organización la que sabe lidiar con datos y existe un uso estratégico en la operación cotidiana de los mismos.

«El riesgo de una decisión incorrecta
es preferible al terror de la indecisión»
Maimónides  



Link de interés

«Piensa 100 veces antes de tomar una decisión.
Pero una vez que la decisión es tomada,
mantente en pie como un hombre»
Muhammad Ali Jinnah

Recibid un cordial saludo


[i] Cada una de las etapas puede ser un MVP per se.