Categoría: Community

Grandes modelos del lenguaje desde un enfoque de procesamiento con grandes datos – Español

Desde el surgimiento de las técnicas basadas en el aprendizaje de representaciones y el aprendizaje profundo (Hochreiter & Schmidhuber, 1997; Mikolov, Sutskever et al., 2013; Pennington et al., 2014; LeCun et al., 2015; He et al. 2016) se ha podido observar un buen número de publicaciones mostrando su utilidad en el campo de la medicina […]

Read More

Apache Flink y Apache Spark – Estudio comparativo – Parte 2 – Español

Parquet. Apache Parquet es un formato para Hadoop de tipo columnar de código abierto que está optimizado para trabajar con datos complejos y estructurados dando buen tiempo de respuesta. Incluye mecanismos para optimizar el espacio de disco usando compresión y codificación de tipos. Este formato, al ser orientado a columnas, usa menos almacenamiento y tiene […]

Read More

Apache Flink y Apache Spark – Estudio comparativo – Parte 1 – Español

Prefacio Una frase bastante común en el ámbito del Big Data, adjudicada al matemático y emprendedor británico Clive Humby, es que los datos son el nuevo petróleo; y el grupo de tecnologías referenciadas como Big Data definitivamente representan la mejor estrategia para explotarlos. Lejos de ser una solución mágica como suele considerarse, por el contrario, […]

Read More