Servicios de Ciencia de Datos

Servicios de Ciencia de Datos

202data brinda servicios de ciencia de datos que se adaptan a los procesos ETL de sus clientes y a sus necesidades de Machine Learning, con el objetivo de generar información valiosa y optimizar sus procesos, productos y servicios empresariales.

Las empresas de hoy aplican distintas técnicas de ciencia de datos para obtener información valiosa que les permita tomar decisiones basadas en datos, con el objetivo de reducir la fricción del cliente, mejorar la satisfacción, optimizar las operaciones, redefinir las estrategias comerciales y aumentar los ingresos.

Qué hacemos

Recopilación de datos
  • Estructurados y no estructurados
  • Semiestructurados
  • RDBMS y Big Data
  • Sistema de archivos distribuido (HDFS)
  • Archivos planos (texto, csv, json, registros)
  • Correos electrónicos, sitios web y APIs
Optimización y evaluación
  • Validación cruzada
  • Ajuste de hiperparámetros
  • Gradient Descent, SGD
  • Ensemble & Boosting
  • RSS, RSME, MSE
  • Log-loss, F-measure, Precision-Recall
Procesamiento de datos
  • Limpieza de datos
  • Perfilado de datos
  • Normalización, text mining
  • Extractor de datos
  • Transformación de datos
  • Alimentación de Data Warehouse
Machine Learning
  • Regresión, Algoritmos de Clasificación
  • Simulaciones de Monte Carlo
  • Support Vector Machine (SVM)
  • KD-Tree, Decision tree, Random Forest
  • K Nearest Neighbors (KNN)
  • K-means, Latent Drichlet Allocation
  • Sistemas de recomendación
Feature Engineering
  • Locality Sensitive Hashing (LSH)
  • Principal Component Analysis (PCA)
  • Singular Value Decomposition (SVD)
  • Transformación de texto (word2vect, TF-IDF)
  • Vectorización, indexador
  • Feature Scaling
Despliegue
  • Despliegue de modelos
  • Model Serving
  • Model Pipeline
  • Despliegue gestionado
  • Monitoreo
  • Evaluación

Herramientas y tecnologías que utilizamos