Hablemos de Big Data, el futuro que ya es presente

Si alguien dice que es experto en Big Data, la pregunta que nos surge a los que nos dedicamos al mundo de los datos es interesarnos por cuál es su especialidad dentro del campo de los grandes datos. Si uno nos dice que es médico, nos entra la curiosidad de saber cuál es su especialidad, porque no es lo mismo un neurocirujano que un pediatra, por ejemplo, y eso es algo que somos muy capaces de entender. ¿Por qué? Porque ir al médico forma parte de nuestra vida cotidiana, pero no tenemos conciencia de que Big Data forme parte de nuestra vida cotidiana.

Al ser el campo de los grandes datos, en el fondo, un desconocido, puede que no nos surja este interrogante. Precisamente, esa idea me ha hecho decidirme a escribir este artículo.

¿Qué entendemos por Big Data?

Es la gran y diversa cantidad de información que crece a tasas cada vez mayores, que se encuentra en Internet: en webs y redes sociales, y también se encuentra en manos de grandes corporaciones, como multinacionales y gobiernos.

Para hacernos una idea de las dimensiones en cuanto a volumen de información sugiero visitar el siguiente enlace donde veremos información en tiempo real de las búsquedas realizadas en el mundo a través de Google. En el momento de escribir este artículo, las cifras son estas: “Google ahora procesa más de 40,000 consultas de búsqueda por segundo en promedio, lo que se traduce en más de 3,5 mil millones de búsquedas por día y 1,2 trillones de búsquedas por año en todo el mundo”.

¿Cómo podemos manejar semejante volumen de información? Es como si tuviéramos miles de millones de bolas numeradas metidas en un recinto de forma desordenada y tratásemos de buscar unas cuantas bolas concretas. Si nos ponemos a hacerlo sin una herramienta que nos ayude a detectar dónde están las bolas que buscamos, es muy probable que no consigamos encontrarlas en un tiempo razonable. Es aquí donde entran en juego las diferente herramientas de Big Data, y también los diferentes especialistas, cada uno con su cometido.

Databases Specialists o Especialistas en Bases de Datos

Son los encargados de que los datos se almacenen, protejan, limpien, y transformen de forma correcta, lo que incluye instalar sistemas de bases de datos, escalar a múltiples máquinas e implementar planes de recuperación ante posibles desastres. En resumen, se encargan de que la información permanezca íntegra, accesible y de que no se pierda.

Son las personas capaces de manejar bases de datos SQL como MySQL y PostgreSQL, y tecnologías NoSQL como MongoDB y Redis.

Business Analysts o Analistas de Negocio

Son los expertos en su industria, deben ser capaces de evaluar de las necesidades de su organización y, posteriormente, traducir esas necesidades en especificaciones para los sistemas informáticos. Más tarde, buscarán las opciones de financiamiento más adecuadas para llevar a cabo los cambios necesarios.

Deben ser capaces de comunicarse con los especialistas en bases de datos, a fin de llevar a cabo de forma conjunta el modelado de las mismas, es decir, la estructura de las bases de datos.

Data Analysts o Analistas de Datos

Utilizan herramientas y algoritmos ya existentes para resolver problemas relacionados con los datos. A diferencia de los científicos de datos, no tienen que inventar nuevos algoritmos o herramientas.

Deben ser capaces de programar y tener un profundo conocimiento de Estadística. También deben ser capaces de comunicarse con los comerciales para responder a preguntas relacionadas con el negocio, y de mejorar la calidad de los datos y contribuir a la correcta adquisición de nuevos datos.

En resumen, lo que les caracteriza es su capacidad de recopilación, manipulación y análisis de datos, utilizando fórmulas y métodos estándar.

Data Scientists o Científicos de Datos

Son capaces de crear modelos para poder tomar decisiones basadas en datos.

Deben poseer fuertes conocimientos técnicos: Hadoop, programación en R y Python, Matemáticas y Estadística. Tienen que ser capaces llevar a cabo investigaciones que aporten beneficios comerciales a la organización.

Son el vínculo entre los recursos de datos de una empresa y los ejecutivos, que buscan la manera de hacer que el negocio funcione mejor.

Big Data: Un futuro prometedor que ya es presente

Es de conocimiento público que los datos son uno de los bienes más valiosos que existen hoy en día, más incluso que el oro y me atrevería a decir que más valioso incluso que Bitcoin, al menos en términos de uso diario, relevancia y demanda. Por esa razón algunas de las profesiones que tienen mayor tasa de ocupación tras su estudio son las relacionadas con Big Data.

Aunque tenga algunos años más que la propia tecnología blockchain, sigue siendo una tecnología incipiente a la que aún estás a tiempo de llegar, así que si tienes la oportunidad, te invito sin duda alguna a formarte sobre el tema y explorar conmigo todo ese universo de datos que componen Internet.

 

2 comentarios en “Hablemos de Big Data, el futuro que ya es presente

  1. Claro conciso y directo. Es muy agradable y satisfactorio leer algo tan complicado para un lego en la materia como yo, y entenderlo y encontrarlo atrayente para seguir sabiendo más.
    Gracias

Deja un comentario