#IA

Every post I've written about IA — 4 articles, across Research, AI. Most recent: “Pré-registrando o Experimento #1: Quão Frágeis São os Prompts de Extração de JSON em Produção?.”

Research01

Pré-registrando o Experimento #1: Quão Frágeis São os Prompts de Extração de JSON em Produção?

O primeiro experimento concreto da linha de pesquisa de precisão — comprometido em público antes da coleta dos dados. Cinco classes de perturbação, quinze variantes, quatro métricas, quatro hipóteses falsificáveis e um repositório companion executável com testes.

21 de mai.

Research02

Prompts de IA: Quão Bons e Quão Ruins Eles São — Abrindo uma Nova Linha de Pesquisa

Um olhar honesto sobre onde os prompts funcionam, onde eles falham silenciosamente e a suposição que paramos de questionar — a de que a IA precisa cometer erros. O tiro de abertura de uma linha de pesquisa sobre sair do "melhor esforço" para a precisão especificável e mensurável.

16 de mai.

AI03

A Espinha Dorsal Determinística: Por Que Sistemas de IA em Produção Estão Se Afastando de Agentes Totalmente Autônomos

Agentes totalmente autônomos são difíceis de limitar, difíceis de testar e caros de operar. Uma espinha dorsal determinística com etapas de agente estreitas devolve o controle de fluxo a você enquanto mantém a inteligência onde ela importa. Veja como projetar, testar e migrar nessa direção.

19 de abr.

AI04

Avaliação de Memória: Medindo Como a Memória de IA se Degrada ao Longo da Vida de um Projeto

A maioria dos benchmarks de memória de IA avalia recall e para por aí. Isso esconde o modo de falha real: fatos desatualizados envenenando silenciosamente a janela de contexto. Aqui está um framework de avaliação baseado em ciclo de vida que testa recall, revisão e esquecimento controlado em todos os pontos de mudança pelos quais um projeto de longa duração passa.

17 de abr.

Posts tagged #IA

Pré-registrando o Experimento #1: Quão Frágeis São os Prompts de Extração de JSON em Produção?

Prompts de IA: Quão Bons e Quão Ruins Eles São — Abrindo uma Nova Linha de Pesquisa

A Espinha Dorsal Determinística: Por Que Sistemas de IA em Produção Estão Se Afastando de Agentes Totalmente Autônomos

Avaliação de Memória: Medindo Como a Memória de IA se Degrada ao Longo da Vida de um Projeto