Acciones

Diferencia entre revisiones de «Exceso de datos»

De iMMAP-Colombia Wiki

(Página creada con «Se considera que un analista de datos se enfrenta al exceso de datos cuando: *La alta cantidad de datos impide ver una tendencia *Hay variables o un periodo de tiempo inne…»)
 
 
Línea 5: Línea 5:
 
*Hay duplicidad de información
 
*Hay duplicidad de información
 
*Se requieren usar modelos o estrategias de reducción de dimensión
 
*Se requieren usar modelos o estrategias de reducción de dimensión
 +
 +
===¿Qué hacer cuando hay exceso de datos?===
 +
*Limpiar la base de datos
 +
*Eliminar datos innecesarios
 +
*Describir mejor los datos o promediar
 +
*Estimar un modelo
 +
*Mezclar las distintas variables para crear índices

Revisión actual del 19:24 9 ene 2023

Se considera que un analista de datos se enfrenta al exceso de datos cuando:

  • La alta cantidad de datos impide ver una tendencia
  • Hay variables o un periodo de tiempo innecesario
  • Hay duplicidad de información
  • Se requieren usar modelos o estrategias de reducción de dimensión

¿Qué hacer cuando hay exceso de datos?

  • Limpiar la base de datos
  • Eliminar datos innecesarios
  • Describir mejor los datos o promediar
  • Estimar un modelo
  • Mezclar las distintas variables para crear índices