Con el acelerado crecimiento de los datos en nuestros negocios llega un punto en dónde es imprescindible peguntarnos como es la mejor manera de relacionarnos con nuestros datos a la hora de realizar analítica sobre ellos. Es entonces cuando entramos
Seguir leyendoEtiqueta: Spark
Diferencias entre Pandas y PySpark
Dos de las librerías más utilizadas en el mundo de Python para el procesamiento de datos son Pandas y Pyspark(libreria de Python para spark) con características muy similares entre ellas incluyendo los nombres de algunos métodos o funciones. Generalmente la
Seguir leyendoCreando un primer experimento en Databricks
Primero creemos un experimento a mano y posteriormente lo haremos con un notebook en Python Vaya al lugar donde desea almacenar el experimento Dele un nombre al experimento y una localización, tenga en cuenta que en caso de no agregar
Seguir leyendoComo agregar librerias a Databricks
Algo bastante común al momento de utilizar Databricks es la necesidad de cargar o instalar librerias en el o los cluster sobre los que estamos trabajando, aquí veremos como hacerlo. Vaya al workspace de su databricks De clic en Import
Seguir leyendo