AI Data Engineer Senior (FDE)
Brazil · Brasil · Remoto ou Híbrido (depende do cliente)ContractReports to: Negócio: Gustavo Batista (Head de Operações) + cliente · Técnico: Cezar Vasconcelos (CTO)
Você é Senior Data Engineer na squad de Forward Deployed Engineers — responsável pelo pipeline completo de ETL → Knowledge Base.
Extrai dados dos sistemas existentes do cliente, refina, estrutura e entrega conhecimento acionável pros agentes.
É a fundação de qualidade que determina se os agentes performam ou não.
O que você vai fazer
Context mining e ETL
- Identificar quais dados do cliente têm valor semântico pros agentes.
- Projetar e implementar ETL via APIs, bancos de dados e sistemas heterogêneos.
- Mapear o data layer do cliente e priorizar extrações por impacto no agente.
Context refinery
- Limpeza, deduplicação, normalização, chunking.
- Enriquecimento sintético dos dados brutos quando necessário.
- Versionamento dos artefatos refinados.
Data modeling e Knowledge Base
- Estruturar os dados extraídos em formatos úteis para consumo pelos agentes.
- Construir, versionar, curar e manter a KB ao longo do tempo.
- Definir métricas de freshness, completude e cobertura.
Retrieval architecture
- Cache-Augmented Generation (CAG).
- RLM e filesystem-based retrieval.
- Vector databases (Pinecone, Weaviate, Qdrant, pgvector — o que fizer sentido).
- Graph databases — modelagem de relações para Graph RAG.
Data quality e automação
- Garantir que o que entra na KB é confiável e atualizado.
- Pipelines event-driven de atualização contínua da KB a partir de novas entradas dos sistemas do cliente.
- Monitoramento de drift, freshness e lineage.
Quem você é
- 5+ anos em data engineering.
- Domínio de ETL design — extração via APIs, bancos de dados e sistemas legados.
- Data modeling — estruturar dados pra consumo por agentes (não só BI).
- Vector DBs (Pinecone, Weaviate, Qdrant, pgvector — qualquer um, hands-on).
- Graph DBs (Neo4j ou equivalente) com lógica de Graph RAG.
- CAG, RLM e filesystem-based retrieval — sabe escolher por caso.
- Pipelines de atualização contínua e automações event-driven.
- Data quality — validação, freshness, lineage.
- Databricks (relevante para integração com o data layer do cliente).
Diferenciais
- GenAI hands-on em produção — retrieval architecture para agentes, não só BI.
- Domain expertise em CX, healthcare, fintech ou utilities.
- Experiência liderando migração ou modernização de data layer enterprise.
Ciclo de Qualidade (esperado de toda a squad)
Criar agente → simular e gerar Agent Score → rodar em produção → coletar dados reais → iterar (context engineering, token optimization, caching, retrieval) → nova simulação → comparar scores → publicar versão melhorada → repetir até performance desejada.
O que oferecemos
- Remuneração acima da média — porque buscamos pessoas acima da média.
- Contratação PJ com férias remuneradas.
- Modelo de trabalho remoto ou híbrido — depende do cliente.
- Cultura que usa IA de verdade, não só fala sobre ela.
- Impacto real: agentes em produção em cliente enterprise top do Brasil desde o primeiro mês.
Apply
Interested in AI Data Engineer Senior (FDE)?
Hiring contact: Raphael Rosa · +55 34 99683 5777
See all roles