Tag: Spark

Apache Flink y Apache Spark – Estudio comparativo – Parte 1

Prefacio Una frase bastante común en el ámbito del Big Data, adjudicada al matemático y emprendedor británico Clive Humby, es que los datos son el nuevo petróleo; y el grupo de tecnologías referenciadas como Big Data definitivamente representan la mejor estrategia para explotarlos. Lejos de ser una solución mágica como suele considerarse, por el contrario, […]

Read More

Imai labs – Partnership – Strategic Alliance

Committed to growing, we want to thank IMAI Labs for their partnership and confidence on Virtual Dev. We started walking down a path where our ideas will come forth. Thank you. https://imailabs.com/

Read More

Grandes modelos del lenguaje desde un enfoque de procesamiento con grandes datos

Desde el surgimiento de las técnicas basadas en el aprendizaje de representaciones y el aprendizaje profundo (Hochreiter & Schmidhuber, 1997; Mikolov, Sutskever et al., 2013; Pennington et al., 2014; LeCun et al., 2015; He et al. 2016) se ha podido observar un buen número de publicaciones mostrando su utilidad en el campo de la medicina […]

Read More

Apache Flink y Apache Spark – Estudio comparativo – Parte 2

Parquet. Apache Parquet es un formato para Hadoop de tipo columnar de código abierto que está optimizado para trabajar con datos complejos y estructurados dando buen tiempo de respuesta. Incluye mecanismos para optimizar el espacio de disco usando compresión y codificación de tipos. Este formato, al ser orientado a columnas, usa menos almacenamiento y tiene […]

Read More