1 de julho de 2026 · 11 min de leitura

A LLM Wiki do Karpathy, mas para a tua campanha de D&D (e já está em produção)

Há três semanas Andrej Karpathy publicou um gist que acumulou milhares de estrelas: para de usar LLMs como motores de busca sobre os teus documentos e começa a usá-los como engenheiros de conhecimento que compilam uma wiki viva. Depois Garry Tan lançou o GBrain — um cérebro que não só recorda, mas age. O mundo IA decidiu que a memória era a próxima grande batalha.

Passámos um ano a construir a versão mais complicada possível desse problema, e não é uma base de conhecimento empresarial. É um jogo. Porque um Mestre IA tem de recordar a tua história, escrevê-la sem se contradizer e eventualmente agir sobre ela — as três camadas que toda a gente está a teorizar, a correr contra uma história que pune cada erro.

Por que razão a IA esquece a tua campanha?

A janela de contexto não é memória. É um quadro branco que se apaga depois de cada sessão. Um modelo pode lidar com um milhão de tokens, mas a qualidade começa a degradar-se muito antes disso, e quando a sessão termina, tudo desaparece. A conversa seguinte começa do zero.

Num chatbot isso é irritante. Numa campanha de RPG é fatal. Passas três sessões a construir uma rivalidade com uma contrabandista chamada Elara. Poupas-lhe a vida numa cripta. Duas semanas depois o Mestre apresenta-a de novo — como um homem, de outra cidade, que nunca te conheceu. A ilusão quebra. A história em que estavas investido deixa de ser tua. Se já jogaste com um LLM simples, conheces exatamente esse momento: o NPC morto que continua a falar.

O RAG foi a primeira solução séria: converte os teus documentos em vetores, guarda-os e recupera os fragmentos relevantes no momento da consulta. Funciona — milhões de sistemas em produção usam-no. Mas tem um limite estrutural que um artigo de 2024 mapeou em sete pontos de falha. Três importam para um Mestre: o chunking divide uma personagem em fragmentos de modo que o modelo encontra um e perde o resto; a re-derivação faz com que cada turno comece do zero sem aprender nada; e a passividade significa que o sistema apenas responde, sem detetar que duas fontes se contradizem.

Três formas de uma IA recordar: recuperar, compilar, agir

O debate atual alinha três arquiteturas. Apresentam-se como rivais. Não são — são três camadas do mesmo stack.

Recuperar (RAG) — encontra conteúdo relevante à escala. Excelente em amplitude, cego em profundidade; relê os mesmos livros em cada exame e nunca aprende a matéria.
Compilar (a LLM wiki) — a ideia de Karpathy: compila as fontes uma vez numa wiki persistente e interligada. O conhecimento acumula-se; simplesmente não escala a milhões de documentos.
Agir (competências autónomas) — o GBrain de Garry Tan: conhecimento que não fica parado mas dispara ações, corre com um calendário, trabalha enquanto dormes. Poderoso, e um compromisso de engenharia sério.

Diagrama de Venn de Recuperar (RAG), Compilar (Wiki) e Agir, a convergir numa camada de conhecimento viva, com AI Dungeon e Friends & Fables posicionados atrás do LoreKeeper numa linha de tempo — Recuperar, compilar, agir — e onde encaixa um Mestre IA que prioriza a memória.

A pergunta certa não é “qual ganha.” É qual é o trabalho do teu agente? O trabalho de um Mestre é os três em simultâneo — por isso é um caso de teste tão brutal. É aqui que estamos de facto.

Recuperar: RAG sobre a tua campanha

A camada base é RAG real. Cada artigo do Codex da tua campanha é convertido num vetor e guardado com pgvector no Postgres. Quando o Mestre precisa de algo que as pesquisas estruturadas não cobrem, executa uma pesquisa semântica sobre esses embeddings e recupera as passagens mais próximas.

Esta é a parte pouco glamorosa mas essencial. Escala, é rápida o suficiente para um turno em direto e é o fallback quando o grafo ainda não conhece a resposta. Mas por si só tem exatamente a fraqueza que Karpathy aponta: recupera, nunca acumula. Por isso não ficamos por aqui.

Compilar: o Codex é a LLM wiki do Karpathy

O Codex é a LLM wiki do Karpathy. Lançámo-lo para RPG de mesa em vez de artigos de investigação. As mesmas três camadas que ele descreve:

Fontes imutáveis — a tua partida real. A transcrição do que aconteceu à mesa. O modelo lê-a mas nunca a reescreve.
A wiki — o Codex: páginas de entidades escritas pelo LLM para cada NPC, local, missão e fio narrativo, com resumos, estado e referências cruzadas. O modelo é dono desta camada.
O esquema — as regras sobre como a wiki é mantida: o que conta como NPC, como se formam os backlinks, o que é uma contradição.

E acumula-se como Karpathy descreve. Quando uma cena termina, o Mestre não escreve apenas um resumo — lê os eventos novos contra o Codex existente e atualiza cada página que tocam: novas referências cruzadas, estado atualizado, uma nova entrada na linha do tempo. Uma entrada literalmente diz “O DM mantém esta entrada.” A wiki enriquece-se quanto mais jogas.

Uma entrada do Codex no LoreKeeper: página de um NPC com estado, primeira aparição, ligações a outras entidades e arte reutilizada do mundo da campanha — Uma entrada real do Codex — estado, ligações (backlinks) e arte do mundo, mantidos pelo DM.

O resultado foi lançado esta semana: o Mestre lê agora o seu próprio Codex em cada turno. Não despeja a wiki inteira no contexto — encaminha para as entidades que importam na cena atual, carrega as suas páginas mais um salto de backlinks, e injeta um bloco de memória compacto. Isso é a interseção recuperar + compilar que toda a indústria desenha num quadro branco, a correr numa partida real.

O problema que ninguém menciona: coerência, não memória

Os ensaios sobre “o RAG morreu” saltam a metade difícil. Numa história, recordar é a metade fácil. A metade difícil é não te contradizeres. Uma wiki que se compila sozinha irá acumular as suas próprias alucinações — um detalhe errado é referenciado em três páginas e torna-se cânone. O gist do Karpathy tem 200 linhas elegantes; em produção, o lint e a verificação são 80% do trabalho real.

Portanto a engenharia interessante não é o passo de compilação, mas as salvaguardas. O Codex separa o que um jogador pode ver dos segredos só para o DM, de modo que a memória que o Mestre lê pode incluir o twist sem o revelar nunca à mesa. E não confiamos em nada disto ao acaso — corremos evals. Com o bloco de memória ativo, o Mestre usa aproximadamente três vezes mais factos canónicos por cena e nunca revelou um segredo em execuções repetidas; sem ele, inventou três origens mutuamente contraditórias para a mesma personagem. Essa diferença é o produto inteiro.

Agir: o que vem a seguir

A terceira camada é a parte honesta do roadmap. Hoje o Mestre já age através de ferramentas — lança dados, resolve combate mecânico, regista NPCs, controla relógios de pressão. Mas disparam de forma reativa, enquanto narra o teu turno. O que ainda não faz é o que o GBrain de Garry Tan faz: correr por conta própria.

A versão que queremos é um Mestre que mantém o mundo em movimento entre sessões — a avançar o esquema de um rival, a gastar o favor que um NPC te devia, a deixar que uma ameaça que ignoraste ganhe força — para que regresses a um mundo que viveu sem ti. Essa é a camada de ação, e é o honesto “em breve” no diagrama acima. A memória e a wiki são os pré-requisitos difíceis, e já existem.

Então qual é a arquitetura vencedora?

Nenhuma por si só. Da mesma forma que as bases de dados deixaram de ser “SQL ou NoSQL” e se tornaram sistemas híbridos, a memória em agentes está a convergir num único stack: recuperar à escala, compilar em conhecimento persistente, agir sobre ele de forma autónoma. As equipas que ainda perguntam qual escolher estão a fazer a pergunta errada.

Não começámos isto para provar uma tese sobre memória IA. Começámos para construir um Mestre que não se esquece da tua história. São o mesmo projeto. E o lugar menos indulgente para o testar não é uma wiki empresarial — é uma mesa de jogadores que vai notar no segundo em que o seu rival morto voltar a falar.

Perguntas frequentes

O que é uma LLM wiki?

Uma LLM wiki é um padrão de memória popularizado por Andrej Karpathy: em vez de recuperar fragmentos de documentos em bruto no momento da consulta (RAG), usas o modelo de linguagem para pré-compilar as tuas fontes numa wiki persistente e interligada de resumos, páginas de entidades e referências cruzadas. A síntese acontece uma vez; cada pergunta futura beneficia dela. O conhecimento acumula-se em vez de ser derivado de novo em cada consulta.

Como é que um Mestre IA recorda a tua história?

Um Mestre IA capaz não depende da janela de contexto, que é apagada entre sessões. O LoreKeeper escreve no Codex — uma wiki viva — cada NPC, local e pacto que o teu grupo descobre, e faz com que o Mestre leia esse Codex em cada turno. Assim recorda quem te deve um favor e o que juraste há três sessões, em vez de inventar uma nova versão.

O RAG morreu?

Não. O RAG não é rival de uma LLM wiki nem das competências autónomas — é uma camada. O RAG é a camada de recuperação que encontra conteúdo relevante à escala. Uma wiki é a camada de síntese que o compila em conhecimento persistente. As competências são a camada de ação. Os sistemas em produção combinam as três; o debate sobre qual "ganha" apresenta-as como rivais quando fazem parte do mesmo stack.

Qual é a diferença entre RAG e uma LLM wiki?

O RAG recupera e esquece: cada consulta relê os mesmos fragmentos e começa do zero. Uma LLM wiki compila uma vez e reutiliza: lê os eventos novos contra a wiki existente, atualiza cada página afetada e cria referências cruzadas. O RAG escala a milhões de documentos mas nunca aprende; uma wiki melhora com o tempo mas não escala a corpora enormes sem uma camada de recuperação em cima.

Pode um Mestre IA agir sozinho entre sessões?

Ainda não na maioria dos produtos, incluindo o LoreKeeper — as ferramentas do Mestre são reativas: disparam enquanto narra o teu turno. A próxima fronteira (o que Garry Tan chama GBrain com competências autónomas) é um mestre que avança os enredos dos NPCs, gera consequências e atualiza o mundo enquanto estás offline. Essa é a camada de ação, e está no roadmap.

Joga com um Mestre que recorda

O Codex escreve-se sozinho enquanto jogas, e o DM lê-o em cada turno. Começa uma campanha grátis — 100 rondas, sem cartão, a solo ou com até cinco amigos.

Jogar grátis

1 de julho de 2026 · 11 min de leitura

A LLM Wiki do Karpathy, mas para a tua campanha de D&D (e já está em produção)

Por que razão a IA esquece a tua campanha?

Três formas de uma IA recordar: recuperar, compilar, agir

O debate atual alinha três arquiteturas. Apresentam-se como rivais. Não são — são três camadas do mesmo stack.

Recuperar (RAG) — encontra conteúdo relevante à escala. Excelente em amplitude, cego em profundidade; relê os mesmos livros em cada exame e nunca aprende a matéria.
Compilar (a LLM wiki) — a ideia de Karpathy: compila as fontes uma vez numa wiki persistente e interligada. O conhecimento acumula-se; simplesmente não escala a milhões de documentos.
Agir (competências autónomas) — o GBrain de Garry Tan: conhecimento que não fica parado mas dispara ações, corre com um calendário, trabalha enquanto dormes. Poderoso, e um compromisso de engenharia sério.

Recuperar: RAG sobre a tua campanha

Compilar: o Codex é a LLM wiki do Karpathy

O Codex é a LLM wiki do Karpathy. Lançámo-lo para RPG de mesa em vez de artigos de investigação. As mesmas três camadas que ele descreve:

Fontes imutáveis — a tua partida real. A transcrição do que aconteceu à mesa. O modelo lê-a mas nunca a reescreve.
A wiki — o Codex: páginas de entidades escritas pelo LLM para cada NPC, local, missão e fio narrativo, com resumos, estado e referências cruzadas. O modelo é dono desta camada.
O esquema — as regras sobre como a wiki é mantida: o que conta como NPC, como se formam os backlinks, o que é uma contradição.

O problema que ninguém menciona: coerência, não memória

Agir: o que vem a seguir

Então qual é a arquitetura vencedora?

Perguntas frequentes

O que é uma LLM wiki?

Como é que um Mestre IA recorda a tua história?

O RAG morreu?

Qual é a diferença entre RAG e uma LLM wiki?

Pode um Mestre IA agir sozinho entre sessões?

Joga com um Mestre que recorda

O Codex escreve-se sozinho enquanto jogas, e o DM lê-o em cada turno. Começa uma campanha grátis — 100 rondas, sem cartão, a solo ou com até cinco amigos.

Jogar grátis

A LLM Wiki do Karpathy, mas para a tua campanha de D&D (e já está em produção)

Por que razão a IA esquece a tua campanha?

Três formas de uma IA recordar: recuperar, compilar, agir

Recuperar: RAG sobre a tua campanha

Compilar: o Codex é a LLM wiki do Karpathy

O problema que ninguém menciona: coerência, não memória

Agir: o que vem a seguir

Então qual é a arquitetura vencedora?

Perguntas frequentes

O que é uma LLM wiki?

Como é que um Mestre IA recorda a tua história?

O RAG morreu?

Qual é a diferença entre RAG e uma LLM wiki?

Pode um Mestre IA agir sozinho entre sessões?

Joga com um Mestre que recorda

O Que É um Mestre de RPG com IA

Como Jogar RPG Online Sozinho com IA

Os Melhores Mestres de RPG com IA em 2026

A LLM Wiki do Karpathy, mas para a tua campanha de D&D (e já está em produção)

Por que razão a IA esquece a tua campanha?

Três formas de uma IA recordar: recuperar, compilar, agir

Recuperar: RAG sobre a tua campanha

Compilar: o Codex é a LLM wiki do Karpathy

O problema que ninguém menciona: coerência, não memória

Agir: o que vem a seguir

Então qual é a arquitetura vencedora?

Perguntas frequentes

O que é uma LLM wiki?

Como é que um Mestre IA recorda a tua história?

O RAG morreu?

Qual é a diferença entre RAG e uma LLM wiki?

Pode um Mestre IA agir sozinho entre sessões?

Joga com um Mestre que recorda

O Que É um Mestre de RPG com IA

Como Jogar RPG Online Sozinho com IA

Os Melhores Mestres de RPG com IA em 2026

Por que razão a IA esquece a tua campanha?

Três formas de uma IA recordar: recuperar, compilar, agir

Recuperar: RAG sobre a tua campanha

Compilar: o Codex é a LLM wiki do Karpathy

O problema que ninguém menciona: coerência, não memória

Agir: o que vem a seguir

Então qual é a arquitetura vencedora?

Perguntas frequentes

O que é uma LLM wiki?

Como é que um Mestre IA recorda a tua história?

O RAG morreu?

Qual é a diferença entre RAG e uma LLM wiki?

Pode um Mestre IA agir sozinho entre sessões?

Joga com um Mestre que recorda

Guias relacionados

O Que É um Mestre de RPG com IA

Como Jogar RPG Online Sozinho com IA

Os Melhores Mestres de RPG com IA em 2026

Por que razão a IA esquece a tua campanha?

Três formas de uma IA recordar: recuperar, compilar, agir

Recuperar: RAG sobre a tua campanha

Compilar: o Codex é a LLM wiki do Karpathy

O problema que ninguém menciona: coerência, não memória

Agir: o que vem a seguir

Então qual é a arquitetura vencedora?

Perguntas frequentes

O que é uma LLM wiki?

Como é que um Mestre IA recorda a tua história?

O RAG morreu?

Qual é a diferença entre RAG e uma LLM wiki?

Pode um Mestre IA agir sozinho entre sessões?

Joga com um Mestre que recorda

Guias relacionados

O Que É um Mestre de RPG com IA

Como Jogar RPG Online Sozinho com IA

Os Melhores Mestres de RPG com IA em 2026