Ingeniero de Datos Líder Remoto para Plataforma IA de Redes Sociales
Remoto
Jornada completa
Tiempo parcial
Nuestra plataforma está revolucionando la forma en que creadores, marcas y profesionales del marketing interactúan con las redes sociales. Aprovechamos algoritmos avanzados de inteligencia artificial para ofrecer soluciones intuitivas. Estas optimizan la creación de contenido, maximizan el engagement y proporcionan análisis detallados del rendimiento en múltiples plataformas sociales simultáneamente.
Responsabilidades Principales
- Diseñar, desarrollar y mantener pipelines de datos robustos y escalables para la recopilación, procesamiento y almacenamiento de datos provenientes de diversas fuentes de redes sociales e interacciones de usuarios.
- Arquitectar e implementar soluciones de almacén de datos utilizando tecnologías modernas como Amazon Redshift, Azure Synapse Analytics o Google BigQuery, optimizadas específicamente para el análisis de datos de redes sociales.
- Implementar procesos rigurosos de verificación de calidad y validación para mantener la integridad, precisión y fiabilidad de los datos utilizados por nuestros modelos de IA.
- Automatizar procesos ETL mediante herramientas como Apache Airflow, AWS Glue o Azure Data Factory para agilizar la ingesta y transformación de datos, reduciendo así la intervención manual y mejorando la eficiencia operativa.
- Monitorizar y optimizar continuamente los pipelines de datos para mejorar velocidad, fiabilidad y escalabilidad, garantizando el funcionamiento fluido de nuestro Asistente de IA en entornos de alta demanda.
- Colaborar estrechamente con Científicos de Datos, Ingenieros de ML y equipos multifuncionales para comprender requisitos de datos específicos y proporcionar la infraestructura necesaria para el desarrollo y entrenamiento de modelos avanzados.
- Aplicar prácticas estrictas de gobernanza de datos, garantizando privacidad, seguridad y cumplimiento normativo, incluyendo GDPR, en el contexto de datos sensibles de redes sociales.
- Establecer benchmarks de rendimiento e implementar soluciones de monitorización proactiva para identificar y resolver cuellos de botella o anomalías en el pipeline de datos antes de que afecten al usuario final.
- Diseñar junto con analistas de datos y equipos de negocio dashboards interactivos que faciliten la toma de decisiones estratégicas basadas en datos actualizados.
- Desarrollar y dar soporte a data marts y dashboards que proporcionen insights en tiempo real sobre tendencias, comportamientos y patrones en datos de redes sociales.
- Mantenerse al día con tecnologías emergentes, herramientas y frameworks, evaluando cuidadosamente su potencial para mejorar los procesos de ingeniería de datos existentes.
Requisitos
- Licenciatura o Maestría en Ciencias de la Computación, Ingeniería de Datos o campo relacionado.
- Experiencia demostrada de al menos 5 años en ingeniería de datos, con enfoque específico en procesos ETL, desarrollo de pipelines y garantía de calidad de datos.
- Dominio sólido de Python 3.9+, SQL avanzado y conocimiento profundo de bibliotecas como Pandas, NumPy, PySpark y Dask.
- Experiencia práctica con soluciones cloud: AWS (S3, Redshift, EMR, Glue), Azure (Data Lake, Synapse, Databricks) o Google Cloud (BigQuery, Dataflow).
- Historial comprobado en implementación de pipelines de datos en entornos de producción de alto rendimiento, preferiblemente en el sector de redes sociales o marketing digital.
- Conocimiento avanzado de bases de datos SQL (PostgreSQL, MySQL) y NoSQL (MongoDB, Cassandra, DynamoDB), incluyendo optimización de consultas complejas.
- Experiencia con frameworks de procesamiento de big data como Apache Spark 3.x, Hadoop o Flink para el análisis de grandes volúmenes de datos sociales.
- Familiaridad con principios de DataOps y metodologías Ágiles (Scrum, Kanban), aplicados específicamente a proyectos de ingeniería de datos.
- Competencia en herramientas de visualización como Tableau, Power BI o Looker para transformar datos complejos en visualizaciones comprensibles.
- Excelentes habilidades de resolución de problemas y capacidad demostrada para trabajar eficazmente en equipos multidisciplinares.
- Fuertes habilidades comunicativas para transmitir conceptos técnicos complejos a stakeholders no técnicos de manera clara y concisa.
- Conocimiento actualizado de estándares de gobernanza de datos y regulaciones de privacidad internacionales.
Habilidades Adicionales Valoradas
- Experiencia con APIs de redes sociales (Twitter, Facebook, Instagram, TikTok, LinkedIn) y sus particularidades técnicas.
- Conocimiento de integración de datos en aplicaciones impulsadas por IA/ML, especialmente modelos de procesamiento de lenguaje natural.
- Experiencia con contenedores Docker y orquestación con Kubernetes para despliegues escalables.
- Familiaridad con sistemas de mensajería como Kafka o RabbitMQ para arquitecturas orientadas a eventos.
- Implementación de CI/CD para pipelines de datos utilizando GitHub Actions, Jenkins o GitLab CI.
- Comprensión de arquitecturas de microservicios y su impacto en las estrategias de datos distribuidos.
Por Qué Unirse a Nosotros
Al formar parte de nuestro equipo, trabajará con tecnologías de vanguardia en la intersección de la inteligencia artificial y las redes sociales. Ofrecemos un entorno laboral flexible completamente remoto con proyectos desafiantes e impacto global. Valoramos profundamente la innovación, el aprendizaje continuo y brindamos oportunidades concretas para crecer profesionalmente. Nuestro ecosistema fomenta el desarrollo de soluciones creativas en un campo tecnológico en rápida evolución con impacto directo en millones de usuarios.