Ingeniero de Datos Líder Remoto para Plataforma IA de Redes Sociales

Remoto
Jornada completa
Tiempo parcial
Nuestra plataforma está revolucionando la forma en que creadores, marcas y profesionales del marketing interactúan con las redes sociales. Aprovechamos algoritmos avanzados de inteligencia artificial para ofrecer soluciones intuitivas. Estas optimizan la creación de contenido, maximizan el engagement y proporcionan análisis detallados del rendimiento en múltiples plataformas sociales simultáneamente. Responsabilidades Principales - Diseñar, desarrollar y mantener pipelines de datos robustos y escalables para la recopilación, procesamiento y almacenamiento de datos provenientes de diversas fuentes de redes sociales e interacciones de usuarios. - Arquitectar e implementar soluciones de almacén de datos utilizando tecnologías modernas como Amazon Redshift, Azure Synapse Analytics o Google BigQuery, optimizadas específicamente para el análisis de datos de redes sociales. - Implementar procesos rigurosos de verificación de calidad y validación para mantener la integridad, precisión y fiabilidad de los datos utilizados por nuestros modelos de IA. - Automatizar procesos ETL mediante herramientas como Apache Airflow, AWS Glue o Azure Data Factory para agilizar la ingesta y transformación de datos, reduciendo así la intervención manual y mejorando la eficiencia operativa. - Monitorizar y optimizar continuamente los pipelines de datos para mejorar velocidad, fiabilidad y escalabilidad, garantizando el funcionamiento fluido de nuestro Asistente de IA en entornos de alta demanda. - Colaborar estrechamente con Científicos de Datos, Ingenieros de ML y equipos multifuncionales para comprender requisitos de datos específicos y proporcionar la infraestructura necesaria para el desarrollo y entrenamiento de modelos avanzados. - Aplicar prácticas estrictas de gobernanza de datos, garantizando privacidad, seguridad y cumplimiento normativo, incluyendo GDPR, en el contexto de datos sensibles de redes sociales. - Establecer benchmarks de rendimiento e implementar soluciones de monitorización proactiva para identificar y resolver cuellos de botella o anomalías en el pipeline de datos antes de que afecten al usuario final. - Diseñar junto con analistas de datos y equipos de negocio dashboards interactivos que faciliten la toma de decisiones estratégicas basadas en datos actualizados. - Desarrollar y dar soporte a data marts y dashboards que proporcionen insights en tiempo real sobre tendencias, comportamientos y patrones en datos de redes sociales. - Mantenerse al día con tecnologías emergentes, herramientas y frameworks, evaluando cuidadosamente su potencial para mejorar los procesos de ingeniería de datos existentes. Requisitos - Licenciatura o Maestría en Ciencias de la Computación, Ingeniería de Datos o campo relacionado. - Experiencia demostrada de al menos 5 años en ingeniería de datos, con enfoque específico en procesos ETL, desarrollo de pipelines y garantía de calidad de datos. - Dominio sólido de Python 3.9+, SQL avanzado y conocimiento profundo de bibliotecas como Pandas, NumPy, PySpark y Dask. - Experiencia práctica con soluciones cloud: AWS (S3, Redshift, EMR, Glue), Azure (Data Lake, Synapse, Databricks) o Google Cloud (BigQuery, Dataflow). - Historial comprobado en implementación de pipelines de datos en entornos de producción de alto rendimiento, preferiblemente en el sector de redes sociales o marketing digital. - Conocimiento avanzado de bases de datos SQL (PostgreSQL, MySQL) y NoSQL (MongoDB, Cassandra, DynamoDB), incluyendo optimización de consultas complejas. - Experiencia con frameworks de procesamiento de big data como Apache Spark 3.x, Hadoop o Flink para el análisis de grandes volúmenes de datos sociales. - Familiaridad con principios de DataOps y metodologías Ágiles (Scrum, Kanban), aplicados específicamente a proyectos de ingeniería de datos. - Competencia en herramientas de visualización como Tableau, Power BI o Looker para transformar datos complejos en visualizaciones comprensibles. - Excelentes habilidades de resolución de problemas y capacidad demostrada para trabajar eficazmente en equipos multidisciplinares. - Fuertes habilidades comunicativas para transmitir conceptos técnicos complejos a stakeholders no técnicos de manera clara y concisa. - Conocimiento actualizado de estándares de gobernanza de datos y regulaciones de privacidad internacionales. Habilidades Adicionales Valoradas - Experiencia con APIs de redes sociales (Twitter, Facebook, Instagram, TikTok, LinkedIn) y sus particularidades técnicas. - Conocimiento de integración de datos en aplicaciones impulsadas por IA/ML, especialmente modelos de procesamiento de lenguaje natural. - Experiencia con contenedores Docker y orquestación con Kubernetes para despliegues escalables. - Familiaridad con sistemas de mensajería como Kafka o RabbitMQ para arquitecturas orientadas a eventos. - Implementación de CI/CD para pipelines de datos utilizando GitHub Actions, Jenkins o GitLab CI. - Comprensión de arquitecturas de microservicios y su impacto en las estrategias de datos distribuidos. Por Qué Unirse a Nosotros Al formar parte de nuestro equipo, trabajará con tecnologías de vanguardia en la intersección de la inteligencia artificial y las redes sociales. Ofrecemos un entorno laboral flexible completamente remoto con proyectos desafiantes e impacto global. Valoramos profundamente la innovación, el aprendizaje continuo y brindamos oportunidades concretas para crecer profesionalmente. Nuestro ecosistema fomenta el desarrollo de soluciones creativas en un campo tecnológico en rápida evolución con impacto directo en millones de usuarios.