Big Data — La inversión interna que convirtió a Hispavista Labs en una unidad lista para el dato

Capacitación interna en el ecosistema completo de tecnologías Big Data —Hadoop, Spark, Kafka, OpenStack— para construir la base sobre la que se han apoyado, una década después, los principales proyectos de inteligencia de datos de la compañía.

El reto

Sin dominio interno del Big Data, no se sirve bien a un cliente que pide servicios de datos.

En 2013, las tecnologías de procesamiento masivo de información empezaban a definir la frontera entre las empresas digitales que iban a sostener su posición y las que no. Hispavista Labs, con un negocio basado en internet y una clara apuesta por el Internet de las Cosas, tenía que dominar el ecosistema completo de Big Data —no de forma superficial, sino con criterio arquitectónico— para seguir prestando un servicio diferencial a sus clientes. La pregunta era cómo hacerlo sin disparar la estructura de costes: aplicar los principios de eficiencia y optimización al propio proceso de capacitación.

"Big Data fue una inversión deliberada en capacidad interna. Aprendimos las tecnologías que después han sostenido nuestro trabajo en eólica, industria, smart cities y consumo, y lo hicimos buscando eficiencia desde el primer minuto."

Iker Barrena — Director de Hispavista Labs

Datos del proyecto

Cliente

Proyecto individual interno de capacitación

Periodo

Julio 2013 – Diciembre 2014 (18 meses)

Rol HVLabs

Diseño de la arquitectura, capacitación del equipo y despliegue interno

Tecnología

Hadoop · Spark · Kafka

Timeline del proyecto

18 meses, de la inversión individual a la capacidad operativa

El proyecto encadenó tres bloques: diagnóstico de la infraestructura existente, diseño de la nueva arquitectura y capacitación del equipo en el ecosistema de herramientas seleccionado.

Diagnóstico de infraestructura

Análisis del hardware y los servicios existentes

Diseño de arquitectura

Nueva estructura con escalado automático

Capacitación en Apache stack

Hadoop, Spark, Kafka aplicados al uso interno

Sistemas de virtualización

OpenStack como base de gestión y despliegue

Optimización de logs

Tratamiento de uso en tiempo real

La solución

Cuatro componentes que convierten una infraestructura tradicional en una base Big Data

Diseño arquitectónico orientado a eficiencia

Análisis del hardware existente y diseño de una nueva arquitectura que libera capacidad mediante una mayor carga de los equipos actuales, identificando puntos donde automáticamente entran nuevas máquinas según la demanda puntual. Eficiencia antes que inversión.

Stack Apache desplegado y dominado internamente

Capacitación del equipo en Hadoop para procesamiento batch, Spark para procesamiento en memoria y Kafka para gestión de eventos. Tres pilares del ecosistema Apache que siguen vigentes una década después.

OpenStack como base de virtualización

Infraestructura de gestión, escalado y despliegue construida sobre OpenStack, alineada con la filosofía de software libre que caracteriza el trabajo de HV Labs y permite operar sin dependencias propietarias.

Optimización de logs y datos de uso

Tratamiento estructurado de los logs y datos de uso de los servicios para reconfigurar sistemas en tiempo real según las necesidades de cada momento. La observabilidad operativa como parte del propio sistema.

Por qué te importa

Lo que aprendemos aquí se aplica a cualquier organización que necesita prepararse internamente antes de dar el siguiente salto técnico

Big Data no es solo un proyecto de capacitación interna. Es la base sobre la que después se han construido proyectos como Yawite, DAEKIN, JasanGIS, Janby o J4Match. Cada caso de uso posterior se apoya en las decisiones arquitectónicas y la solvencia técnica adquiridas en este proyecto.

01

Invertir en capacidad propia antes que comprarla externamente

La diferencia entre un equipo que aprende una tecnología y un equipo que la integra es la base de cualquier consultoría que aspire a ser estratégica. Sin dominio interno, la consultoría se queda en intermediación.

02

Eficiencia como principio de partida

Aplicar los principios del Big Data al propio proceso de adopción del Big Data. Optimizar el hardware existente antes de comprar más, escalar automáticamente según demanda, sostener la capacidad con la estructura de costes actual.

03

Cimientos para una década de trabajo

Las decisiones tomadas en 2013-2014 —stack abierto, OpenStack, criterio arquitectónico— son las que han permitido que HV Labs aborde con solvencia cualquier proyecto de datos durante los diez años posteriores. La inversión correcta en el momento correcto.

Casos de éxito