All open roles
Forward Deployed Engineering

AI Data Engineer Senior (FDE)

Brazil · Brasil · Remoto ou Híbrido (depende do cliente)ContractReports to: Negócio: Gustavo Batista (Head de Operações) + cliente · Técnico: Cezar Vasconcelos (CTO)
Mission

Você é Senior Data Engineer na squad de Forward Deployed Engineers — responsável pelo pipeline completo de ETL → Knowledge Base.

Extrai dados dos sistemas existentes do cliente, refina, estrutura e entrega conhecimento acionável pros agentes.

É a fundação de qualidade que determina se os agentes performam ou não.

O que você vai fazer

Context mining e ETL

  • Identificar quais dados do cliente têm valor semântico pros agentes.
  • Projetar e implementar ETL via APIs, bancos de dados e sistemas heterogêneos.
  • Mapear o data layer do cliente e priorizar extrações por impacto no agente.

Context refinery

  • Limpeza, deduplicação, normalização, chunking.
  • Enriquecimento sintético dos dados brutos quando necessário.
  • Versionamento dos artefatos refinados.

Data modeling e Knowledge Base

  • Estruturar os dados extraídos em formatos úteis para consumo pelos agentes.
  • Construir, versionar, curar e manter a KB ao longo do tempo.
  • Definir métricas de freshness, completude e cobertura.

Retrieval architecture

  • Cache-Augmented Generation (CAG).
  • RLM e filesystem-based retrieval.
  • Vector databases (Pinecone, Weaviate, Qdrant, pgvector — o que fizer sentido).
  • Graph databases — modelagem de relações para Graph RAG.

Data quality e automação

  • Garantir que o que entra na KB é confiável e atualizado.
  • Pipelines event-driven de atualização contínua da KB a partir de novas entradas dos sistemas do cliente.
  • Monitoramento de drift, freshness e lineage.

Quem você é

  • 5+ anos em data engineering.
  • Domínio de ETL design — extração via APIs, bancos de dados e sistemas legados.
  • Data modeling — estruturar dados pra consumo por agentes (não só BI).
  • Vector DBs (Pinecone, Weaviate, Qdrant, pgvector — qualquer um, hands-on).
  • Graph DBs (Neo4j ou equivalente) com lógica de Graph RAG.
  • CAG, RLM e filesystem-based retrieval — sabe escolher por caso.
  • Pipelines de atualização contínua e automações event-driven.
  • Data quality — validação, freshness, lineage.
  • Databricks (relevante para integração com o data layer do cliente).

Diferenciais

  • GenAI hands-on em produção — retrieval architecture para agentes, não só BI.
  • Domain expertise em CX, healthcare, fintech ou utilities.
  • Experiência liderando migração ou modernização de data layer enterprise.

Ciclo de Qualidade (esperado de toda a squad)

Criar agente → simular e gerar Agent Score → rodar em produção → coletar dados reais → iterar (context engineering, token optimization, caching, retrieval) → nova simulação → comparar scores → publicar versão melhorada → repetir até performance desejada.

O que oferecemos

  • Remuneração acima da média — porque buscamos pessoas acima da média.
  • Contratação PJ com férias remuneradas.
  • Modelo de trabalho remoto ou híbrido — depende do cliente.
  • Cultura que usa IA de verdade, não só fala sobre ela.
  • Impacto real: agentes em produção em cliente enterprise top do Brasil desde o primeiro mês.
Apply

Interested in AI Data Engineer Senior (FDE)?

Hiring contact: Raphael Rosa · +55 34 99683 5777

See all roles