Artigos

Notas de campo, séries e ensaios. Tudo escrito primeiro para mim - depois para você.

Todos Frameworks de Governança de IA Governança de IA, na prática Construindo um assistente conversacional em produção

Séries

Construindo um assistente conversacional em produção

Uma série técnica sobre roteamento, ferramentas, conformidade, observabilidade e tudo entre o LLM e a base de dados.

Construindo um assistente conversacional em produção · Parte 10FT.SEARCH

QueryBuilder: como transformar um objeto Pydantic numa query FT.SEARCH segura

Construir queries FT.SEARCH manualmente é onde você descobre que o RediSearch interpreta '&' como AND silenciosamente, sem erro nem exception.

20 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 9DSPy

dspy.Refine: autocorreção em runtime sem recompilar o modelo

O DSPy fora do modo offline: gera, avalia contra função de recompensa, e se não passar, tenta de novo - antes do critique_node entrar.

13 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 8Observability

Observabilidade num grafo LangGraph: o que o Langfuse vê que o log não vê

Logs cobrem o que aconteceu dentro de cada nó. Não respondem a 'a taxa de fallback subiu nos últimos 30 minutos?'. Para isso, o Langfuse.

8 ABR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 7LLM Routing

Três routers, três problemas diferentes: DSPy, Semantic Router customizado e Aurélio AI

Antes de construir o customizado avaliei uma biblioteca open-source que quase entrou no projeto. Esse post é o comparativo que eu queria ter lido antes de tomar essas decisões.

1 ABR 2026 · 10 min de leitura

Construindo um assistente conversacional em produção · Parte 6DSPy

DSPy na prática: o que muda quando o roteador já é LLM, mas ainda não é compilável

O problema que o DSPy resolve não é a ausência de IA no roteamento. É a ausência de contrato no output dessa IA.

26 MAR 2026 · 7 min de leitura

Construindo um assistente conversacional em produção · Parte 5Compliance

Guardrails regulatórios em assistentes de investimentos: CVM, ANBIMA e o paradoxo da LGPD

Entre o LLM gerar a resposta e ela chegar ao cliente é onde a infração regulatória pode acontecer sem intenção, sem malícia, e sem possibilidade de reverter.

21 MAR 2026 · 5 min de leitura

Construindo um assistente conversacional em produção · Parte 4Memória

Memória em agentes: episódica, semântica e procedural

Confundir os três tipos de memória é onde projetos bancários com LLM erram estruturalmente. A psicologia cognitiva já tinha a taxonomia certa; faltava traduzir para infraestrutura.

16 MAR 2026 · 6 min de leitura

Construindo um assistente conversacional em produção · Parte 3DSPy

DSPy, o framework que trata prompts como código compilável, não como strings

Em vez de escrever prompts, você programa módulos declarativos e deixa o framework compilar prompts otimizados - com base em dados, métricas e o modelo que você está usando.

14 MAR 2026 · 6 min de leitura

Construindo um assistente conversacional em produção · Parte 2Redis Stack

Fat vs Slim vs Híbrido no Redis Stack: o modelo que mudou minha forma de pensar em retrieval para LLM

Quando o volume cresce e o LLM começa a se perder no contexto, a decisão de modelagem é tão importante quanto a escolha do banco. Fat, Slim ou Híbrido - qual ficou no final?

11 MAR 2026 · 4 min de leitura

Construindo um assistente conversacional em produção · Parte 1Redis

Você já usou Redis além de cache simples?

Cache miss virou consulta lenta na API, p95 subiu, custo de LLM subiu. Foi onde descobri o Redis Stack como camada de retrieval e análise determinística pra aplicações com LLM.

4 MAR 2026 · 3 min de leitura