Diferencia entre revisiones de «Exceso de datos»
De iMMAP-Colombia Wiki
(Página creada con «Se considera que un analista de datos se enfrenta al exceso de datos cuando: *La alta cantidad de datos impide ver una tendencia *Hay variables o un periodo de tiempo inne…») |
|||
Línea 5: | Línea 5: | ||
*Hay duplicidad de información | *Hay duplicidad de información | ||
*Se requieren usar modelos o estrategias de reducción de dimensión | *Se requieren usar modelos o estrategias de reducción de dimensión | ||
+ | |||
+ | ===¿Qué hacer cuando hay exceso de datos?=== | ||
+ | *Limpiar la base de datos | ||
+ | *Eliminar datos innecesarios | ||
+ | *Describir mejor los datos o promediar | ||
+ | *Estimar un modelo | ||
+ | *Mezclar las distintas variables para crear índices |
Revisión actual del 18:24 9 ene 2023
Se considera que un analista de datos se enfrenta al exceso de datos cuando:
- La alta cantidad de datos impide ver una tendencia
- Hay variables o un periodo de tiempo innecesario
- Hay duplicidad de información
- Se requieren usar modelos o estrategias de reducción de dimensión
¿Qué hacer cuando hay exceso de datos?
- Limpiar la base de datos
- Eliminar datos innecesarios
- Describir mejor los datos o promediar
- Estimar un modelo
- Mezclar las distintas variables para crear índices