Memory Juego de Memoria: Métodos de Transformación en Ciencia de DatosVersión en línea Descubre los métodos clave de transformación en ciencia de datos mientras juegas y aprendes. por Derek Adán Sánchez Valverde Las agregaciones son operaciones matemáticas que combinan múltiples datos o registros en un solo valor resumen Normalización escalar los datos a un rango específico, generalmente entre 0 y 1, para evitar que una característica tenga más peso que otra en el modelado Codificación One-Hot crea una columna para cada categoría, con valores binarios (0 o 1), representando la presencia o ausencia de esa categoría Reducción de Dimensionalidad reduce el número de variables conservando la mayor cantidad de información posible, eliminando características redundantes o irrelevantes La compresión de datos es el proceso de reducir el tamaño de los datos, de modo que ocupen menos espacio de almacenamiento o se transmitan más rápidamente Un histograma es una representación gráfica de la distribución de un conjunto de datos continuos Transformación Logarítmica aplica el logarittmo a los valores de una variable para reducir su escala Un histograma es una representación gráfica de la distribución de un conjunto de datos continuos Transformación de Variables es la aplicación de funciones matemáticas a las variables para hacerlas más lineales o ajustar su distribución Estandarización ajustar los datos para que tengan una media de 0 y una desviación estándar de 1 Discretización o binning que es convertir variables continuas en grupos o intervalos Estandarización ajustar los datos para que tengan una media de 0 y una desviación estándar de 1 Codificación One-Hot crea una columna para cada categoría, con valores binarios (0 o 1), representando la presencia o ausencia de esa categoría La compresión de datos es el proceso de reducir el tamaño de los datos, de modo que ocupen menos espacio de almacenamiento o se transmitan más rápidamente Las agregaciones son operaciones matemáticas que combinan múltiples datos o registros en un solo valor resumen Imputación de Datos reemplazar valores faltantes con estimaciones, como la media, la mediana o el valor más frecuente Reducción de Dimensionalidad reduce el número de variables conservando la mayor cantidad de información posible, eliminando características redundantes o irrelevantes Normalización escalar los datos a un rango específico, generalmente entre 0 y 1, para evitar que una característica tenga más peso que otra en el modelado Imputación de Datos reemplazar valores faltantes con estimaciones, como la media, la mediana o el valor más frecuente Escalado de Características ajustan los datos en función de un rango específico Transformación de Variables es la aplicación de funciones matemáticas a las variables para hacerlas más lineales o ajustar su distribución Escalado de Características ajustan los datos en función de un rango específico Discretización o binning que es convertir variables continuas en grupos o intervalos Transformación Logarítmica aplica el logarittmo a los valores de una variable para reducir su escala