#LLM

Every post I've written about LLM — 3 articles, across Engineering, AI. Most recent: “Transformando Engenharia de Contexto de LLM em um Loop de Avaliação com DSPy.”

Engineering01

Transformando Engenharia de Contexto de LLM em um Loop de Avaliação com DSPy

Notas de dois fins de semana cavando o DSPy. Parei de tratar prompts como a fonte da verdade e comecei a tratá-los como saída compilada de uma assinatura tipada, uma métrica e um otimizador. Aqui está o menor programa end-to-end que mantive, como o MIPROv2 de fato busca, e onde a abordagem cai por terra na prática.

3 de mai.

AI02

A Espinha Dorsal Determinística: Por Que Sistemas de IA em Produção Estão Se Afastando de Agentes Totalmente Autônomos

Agentes totalmente autônomos são difíceis de limitar, difíceis de testar e caros de operar. Uma espinha dorsal determinística com etapas de agente estreitas devolve o controle de fluxo a você enquanto mantém a inteligência onde ela importa. Veja como projetar, testar e migrar nessa direção.

19 de abr.

AI03

Avaliação de Memória: Medindo Como a Memória de IA se Degrada ao Longo da Vida de um Projeto

A maioria dos benchmarks de memória de IA avalia recall e para por aí. Isso esconde o modo de falha real: fatos desatualizados envenenando silenciosamente a janela de contexto. Aqui está um framework de avaliação baseado em ciclo de vida que testa recall, revisão e esquecimento controlado em todos os pontos de mudança pelos quais um projeto de longa duração passa.

17 de abr.

Posts tagged #LLM

Transformando Engenharia de Contexto de LLM em um Loop de Avaliação com DSPy

A Espinha Dorsal Determinística: Por Que Sistemas de IA em Produção Estão Se Afastando de Agentes Totalmente Autônomos

Avaliação de Memória: Medindo Como a Memória de IA se Degrada ao Longo da Vida de um Projeto