* Datos estructurados: Este tipo de datos se almacena en un formato estructurado, como una hoja de cálculo o una base de datos.
* Datos no estructurados: Este tipo de datos no se almacena en un formato estructurado, como texto o imágenes.
El SID puede provenir de una variedad de fuentes, que incluyen:
* Datos internos: Estos datos se generan dentro de su organización y normalmente se almacenan en una base de datos o en un sistema de planificación de recursos empresariales (ERP).
* Datos externos: Estos datos se generan fuera de su organización y se pueden encontrar en la web, en las redes sociales o en bases de datos gubernamentales.
La calidad de su SID es fundamental para el éxito de su modelo. Los malos datos conducirán a malos resultados. Por lo tanto, es importante tomarse el tiempo para limpiar y preparar su SID antes de usarlo para modelar.
A continuación se ofrecen algunos consejos para preparar su SID:
* Limpiar tus datos: Esto implica eliminar cualquier dato duplicado o erróneo.
* Estandariza tus datos: Esto implica convertir todos sus datos a un formato consistente.
* Enriquece tus datos: Esto implica agregar datos adicionales a su SID, como información demográfica o datos meteorológicos.
Una vez que haya preparado su SID, puede comenzar a usarlo para construir su modelo.