| Domingo · 10 de maio de 2026 |
Issue № 004 |
14 min de leitura |
|
|
O Brief Semanal da FindSkill
The Skill
Só para membros do FindSkill Pro. As notícias de IA que realmente importam para o seu trabalho.
|
|
Só para membros Pro
|
Um brief privado
|
Não publicado em nenhum outro lugar
|
|
|
|
Mia
Editora de aprendizado IA · FindSkill.ai
|
Bem-vindo à Issue 004.
E aí. Sou a Mia. Toda segunda-feira eu chego na sua caixa de entrada pra fazer sentido das notícias de IA da semana, sem jargão, sem hype, sem aquela vibe de "10 coisas que você PRECISA saber". Esse brief não sai em mais lugar nenhum. Vai só pra membro Pro. É isso.
Olha só. Esta semana aconteceram três coisas que parecem três histórias diferentes. É a mesma. A Anthropic colocou o Claude dentro do Excel, do Word, do PowerPoint e do Outlook, e mandou 10 agentes prontos pra fazer trabalho que analista júnior leva uns vinte anos de carreira pra dominar. A OpenAI lançou o GPT-5.5 Instant e ligou memória através de chats antigos, arquivos e Gmail pra todo usuário pago. A Cloudflare lançou oficialmente o Agent Memory. Memória virou a próxima camada. A edição passada deu a lente pra escolha (qual IA pra qual tarefa). Essa aqui dá a lente pra continuidade: quando a IA lembra de você entre uma conversa e outra.
Voltando rapidinho na semana passada: pedi se você tinha de fato montado uma tabela de model router. As respostas vieram divididas no meio. Metade me mandou a tabela (algumas estavam boas; uma parecia checklist da NASA). A outra metade admitiu que não montou porque vivia esquecendo qual IA fazia o quê, e aí abria a de sempre. O que, ironicamente, é o tema desta edição. Memória não é só sobre a IA lembrar de você. É também sobre você não precisar lembrar da IA.
— Mia
|
01 |
Esta semana em IA
Três histórias que merecem sua atenção
|
Tool Launch
Claude entrou no Excel/Outlook do brasileiro. E o Brasil é o 3º maior mercado do Claude no mundo.
Antes de qualquer coisa, um dado pra calibrar a leitura: o Brasil é hoje o terceiro maior mercado do Claude no mundo, atrás só dos EUA e da Índia, segundo a Bloomberg Línea. A Anthropic admitiu que "chegou tarde", tá montando estrutura em São Paulo agora em 2026 e contratando ativamente. Pronto. Agora o anúncio: na segunda passada, a Anthropic liberou o Claude Opus 4.7, mesmo preço do 4.6, no topo do benchmark Vals AI de agentes financeiros com 64,4%. Essa é a frase chata. A que importa é outra: Claude agora roda dentro do Excel, do Word e do PowerPoint, com Outlook em beta. Mais 10 templates prontos de agentes financeiros (pitchbook, KYC, memorando de crédito, fechamento mensal). Mais a base completa da Moody's com dados de crédito de 600 milhões de empresas, embutida como app nativo. Jamie Dimon, do JPMorgan, foi citado dizendo que o Claude montou um dashboard "em 20 minutos com toda a documentação de apoio, toda a pesquisa, muito acertado". Os 20 minutos são a parte que o jornal citou. A parte que importa é o que tornou aquilo possível: o agente já tinha os últimos 12 meses de contexto da empresa pra puxar.
|
O que isso significa para você
Para de pensar em IA como uma aba do navegador. Abre os apps que você já usa mais (Outlook, Excel, Word, seu CRM, sua planilha de cliente) e procura o painel de IA. Tem um. Você provavelmente não ligou. O destrave não é um modelo mais inteligente; é o modelo já estar onde o seu trabalho acontece. Se você atende cliente PJ ou trabalha em empresa que assina Microsoft 365, abre o Excel hoje e procura o botão do Copilot. Vai ter.
|
Lançamento de modelo
A OpenAI lançou "Instant". A manchete é a velocidade. A história é que o ChatGPT agora lembra de você.
Terça-feira, a OpenAI trocou o GPT-5.3 Instant pelo GPT-5.5 Instant como modelo padrão pra todo mundo. Números de manchete: AIME 2025 de matemática subiu pra 81,2 (de 65,4), MMMU-Pro multimodal pra 76 (de 69,2), e, segundo a própria OpenAI, 52,5% menos alucinações em direito, medicina e finanças. Tudo real, tudo bem-vindo, e nada disso é a história. A história tá um parágrafo abaixo no anúncio: o ChatGPT agora "pesquisa conversas anteriores, arquivos e Gmail conectado" pra personalizar respostas, e uma nova interface "fontes de memória" mostra qual chat antigo ou e-mail moldou cada resposta. Você pode apagar fonte. Conversa compartilhada não expõe a fonte. Plus e Pro web já têm; Free, Go e enterprise nas próximas semanas.
|
O que isso significa para você
Roda uma auditoria de 10 minutos esta semana. Abre ChatGPT → Configurações → Personalização → Memória. Lê o que ele afirma lembrar de você. Metade vai ser útil. Parte vai estar errada. Algumas coisas você vai querer apagar por princípio. Importante: nunca cole CPF, conta bancária, número de cartão ou dado pessoal de cliente na memória. Enquanto você não fizer essa varredura, toda resposta "personalizada" tá sendo personalizada por dado que você não escolheu, e isso pode virar problema de compliance, não só de qualidade.
|
Tendência em foco
Memória virou categoria. Três coisas lançaram, uma direção só.
A Cloudflare lançou oficialmente o Agent Memory, serviço gerenciado com quatro operações (Ingestar, Lembrar, Recuperar, Esquecer) e quatro tipos de memória (Fatos, Eventos, Instruções, Tarefas), construído em Llama 4 Scout pra extração e Nemotron 3 pra síntese. Mem0 entrou em GA na sua camada open source de memória de agente. O paper Context-ReAct apresentou cinco operações atômicas e bateu 61,5% no BrowseComp com fine-tune Qwen de 30 bilhões de parâmetros. Já tem benchmark de memória (LongMemEval, LoCoMo, BEAM). Já tem vocabulário pra essa camada. Já tem fila de fornecedor em todo evento de IA. Doze meses atrás, "memória" significava tamanho da janela de contexto. Agora significa uma camada de recuperação separada que sobrevive entre sessões.
|
O que isso significa para você
Quando uma categoria aparece com benchmark, vocabulário e fornecedor no mesmo trimestre, você não precisa aprender o produto ainda. Precisa internalizar o conceito. A memória do ChatGPT que você ligou na Story 2 e a memória de agente dentro dos templates financeiros do Claude da Story 1 são a mesma ideia. Pega a ideia agora. Escolhe a ferramenta depois.
---
|
|
02 |
Termo da semana
O conceito pra entender nesta semana
|
| |
|
Termo №004
Memória de agente (agent memory)
< memória de agente *(sem expansão — o termo já é a descrição)* >
Uma camada que fica fora do modelo de IA e armazena fatos, eventos e instruções que a IA precisa lembrar sobre você entre sessões. Separada da janela de contexto que o modelo carrega a cada conversa.
|
Pensa assim →
Pensa no seu celular. Tem RAM (os apps abertos agora) e armazenamento (todo o resto: fotos, contato, WhatsApp). A janela de contexto é a RAM. A memória de agente é o armazenamento. A maioria das pessoas usa IA como celular sem armazenamento: toda conversa começa do zero, e quem carrega a memória é você, digitando contexto outra vez. Versão mais palpável: é como abrir o WhatsApp Business toda vez sem ver as conversas anteriores com o cliente. Funciona. Mas você gasta metade do tempo perguntando "desculpa, em que pé estamos mesmo?".
|
|
⚠ Equívoco comum
"Memória de agente é só uma janela de contexto maior." Não. Janela de contexto maior é uma área de trabalho maior dentro de uma conversa. Memória de agente é o que sobrevive entre conversas, e é curada, não jogada lá dentro. Memória ≠ prompt mais longo. Memória = estado que o modelo busca quando precisa. O ponto é justamente não ter que arrastar tudo de novo a cada vez.
|
Where you'll hear it: Cloudflare Agent Memory (serviço gerenciado, beta). Mem0 (open source, camada que várias plataformas de agente usam por baixo). Zep (comercial, enterprise). Interface "fontes de memória" do ChatGPT (a versão consumidora da mesma ideia, lançada esta semana). Os agentes financeiros do Claude que "fecham os livros no fim do mês": eles lembram dos livros entre sessões. Em PT-BR, o **RDD10+ (Roberto Dias Duarte)** tem série dedicada à arquitetura híbrida de memória. Vale assinar o feed dele se você atende cliente que precisa entender o termo em português.
MCP — como agentes conectam com memória e ferramentas →
|
|
03 |
Análise profunda
Memória virou a camada. E o que fazer antes da próxima segunda
|
A maior parte dos posts "tendência de IA" agora tá discutindo se agente é real. A discussão acabou. A pergunta interessante é o que tá empilhando em cima dos agentes. A resposta saiu esta semana.
Tô escrevendo este brief há quatro semanas. Cada edição te deu uma lente. RAG foi a lente pra respostas: quando a IA busca coisa. Agente foi a lente pra ação: quando a IA faz coisa. Routing foi a lente pra escolha: qual IA pra qual tarefa. Esta semana saiu a quarta lente, e é a mais estranha. Memória. A lente pra continuidade: quando a IA sabe no que você tá trabalhando sem você ter que reexplicar.
2023–2024 foi a era das respostas. IA era um Google mais esperto. Autocomplete melhor, resumo mais rápido. RAG (Issue 001) fez a resposta citar fonte real. A unidade de valor era uma boa resposta pra uma boa pergunta. A maioria das pessoas usa IA exatamente assim: cola, recebe resposta, fecha aba. Nada de errado nisso. Só que é raso.
2024–2025 foi a era da ação. Agente (Issue 002) fez a IA fazer coisa em vez de só descrever. Computer use, Atlas Browser, Operator. De repente a unidade de valor virou tarefa concluída, não parágrafo escrito. A régua subiu de "a resposta foi boa" pra "o trabalho foi feito". Tem gente já aqui. A maioria não.
Final de 2025 e começo de 2026 foi a era da escolha. Routing (Issue 003) reconheceu que nenhum modelo único ganha em tudo. O Foundry router, OpenRouter, Portkey, a indústria caseira de newsletter de comparação de modelo. A unidade de valor virou "a ferramenta certa pro momento", e o custo cognitivo virou decidir o que era certo. A maioria dos leitores Pro tá começando a viver aqui.
Maio de 2026 é a era da continuidade. Memória vira a camada acima das três. Cloudflare Agent Memory lançou. Mem0 entrou em GA. ChatGPT agora vasculha seus chats antigos, seus arquivos, seu Gmail. Os agentes financeiros da Anthropic lembram do deal entre sessões. É por isso que o JPMorgan ganhou um dashboard "em 20 minutos": porque o agente lembrava dos 12 meses anteriores. Já existe suite de benchmark (LongMemEval, LoCoMo, BEAM), vocabulário (Fatos, Eventos, Instruções, Tarefas) e lista de fornecedor. A unidade de valor virou IA que sabe no que você tá trabalhando.
O padrão é o mesmo toda vez. Cada camada torna a anterior pessoal. RAG fez a IA informada. Agente fez a IA útil. Routing fez a IA adequada. Memória faz a IA sua. A virada não é uma feature nova. É uma unidade de valor nova. E toda vez que a unidade vira, quem ganha não é quem tem a melhor ferramenta. É quem internalizou o conceito primeiro e mudou o jeito de usar a ferramenta que já tinha.
O que ninguém tá dizendo em alto e bom som. o vencedor de 2026 não é quem tem o melhor prompt. É quem tem a melhor higiene de memória. Cinco anos atrás a gente chamaria isso de "gestão do conhecimento" e seria um plug do Notion. Agora é a diferença entre uma IA que dá deriva a cada conversa e uma IA que compõe quanto mais você usa.
Recorte BR. Repara no que tá acontecendo no setor financeiro daqui. Bradesco com 87% de resolutividade em 25 milhões de interações. XP no Visa Agentic Ready. Stone com 93% de avaliação positiva e times trabalhando "lado a lado" com dezenas de agentes inteligentes. Nenhum desses números seria possível sem agente lembrando do contexto entre sessões. O que parece "atendimento melhor" é, no fundo, memória de agente em produção. E o BCB decidiu não normatizar IA financeira antes do fim de 2026. Janela aberta. Pra cliente Pro que atende fintech, contador ou advogado: esse é o terreno em que vocês vão ganhar projeto novo este ano.
Antes da próxima segunda, faz isso
| 1. | Auditoria. Abre a IA padrão sua (memória do ChatGPT, Claude Projects, Gemini). Lê o que ela já afirma saber sobre você. Apaga o que tá errado. Anota o que tá faltando. | | 2. | Curadoria. Escolhe seus 3 projetos ou clientes mais ativos. Pra cada um, escreve 5 fatos que a IA tem que sempre lembrar: quem é, em que pé está, o que pediu, o que você prometeu, o que nunca repetir. Fixa essas anotações no slot de memória da IA (toda plataforma tem um; o nome muda). | | 3. | Teste. Na próxima conversa sobre esse projeto, não reexplica. Pergunta a próxima coisa que você precisa de fato. Se o modelo usa a memória, você descarregou um pedaço de carga mental permanentemente. Se não usa, a memória não tava específica o bastante. | | 4. | Decida o que fica de fora. Memória que você não cura é memória que dá deriva. Menos é mais afiado que muito. O modelo não precisa saber o nome dos seus filhos. Precisa saber o que seu cliente disse em março sobre o roadmap dele. |
Para de pensar "qual o prompt?". Começa a pensar "o que essa IA sabe sobre mim, e é isso que eu quero que ela saiba?". O trabalho desta semana não é construir nada novo. É editar o que já tá lá.
|
04 |
O fluxo
Um jeito de usar IA no trabalho esta semana
|
| |
| ◆ IA no trabalho · Ideia №004 |
Monta pra sua IA uma "página de memória do cliente": quinze minutos uma vez, salvo em toda conversa pra sempre.
Abre a IA que você mais usa. ChatGPT Projects, Claude Projects, Gemini Gems, área de trabalho do Notion AI: toda plataforma tem um slot de "memória" ou "conhecimento de projeto" com nome diferente. Pega um cliente ou projeto ativo. Abre um doc em branco. Escreve cinco fatos: (1) quem é em uma frase (nome, papel, empresa, o que comprou); (2) onde você está com ele agora (a pergunta aberta, a decisão pendente, o próximo entregável); (3) o que ele já disse antes que precisa enviesar toda resposta (preferências, restrições, coisas que ele já rejeitou); (4) o que você prometeu (prazo, entregável, follow-up); (5) o que não fazer (erro do passado, sensibilidade, coisa que ele não quer ouvir de novo). Cola esses cinco no slot de memória da IA. Salva.
Por que funciona: A maioria das conversas com IA gasta os primeiros 40% restabelecendo contexto que já deveria ser persistente. Quando você move cinco fatos por projeto pra memória permanente, recupera esses minutos e (mais importante) o modelo para de dar deriva. Toda conversa começa do mesmo ponto de ancoragem em vez de qualquer coisa que você tenha digitado naquela manhã. O trabalho não é escrever o prompt melhor. É dar ao prompt um chão melhor pra pisar. Importante: nunca cole CPF, conta, dado bancário ou dado pessoal sensível na memória. LGPD vale aqui, e a ANPD intensificou fiscalização em 2026.
|
Faça esta semana
Monta os 5 fatos de memória pra um projeto hoje. Usa na próxima conversa sobre esse projeto. Se o modelo usa bem, escala pra três projetos antes de sexta. Não pula direto pra dez. Cinco fatos × três projetos é o ponto certo. Dez projetos com memória ruim é pior que três projetos com memória boa.
|
|
|
05 |
Ideia de renda
Um jeito de fazer dinheiro com IA esta semana
|
| |
| ◆ Ideia de receita · Play №004 |
Vende um "Kit Memória de IA" pra um nicho brasileiro bem específico.
Pega um papel que você conhece de verdade: contador, dev solo, social media manager freelance, designer freela, corretor de imóveis, consultor PJ. Monta uma página única no Notion ou um PDF de umas 25 páginas, com nome tipo "Configura a memória da sua IA em 90 minutos pra [papel]". Dentro: (1) cinco templates de "o que sua IA deve lembrar de cada cliente", desenhados pro fluxo daquele papel; (2) oito prompts específicos pra fixar no slot de memória da IA; (3) um prompt mensal de auditoria onde você cola, a IA conta o que tá guardando e o que considerar apagar; (4) um fluxo de uma página de captação de cliente novo até entrada na memória.
Por que funciona: O lançamento da memória do ChatGPT da Story 2 atinge ~100 milhões de pessoas neste mês. A maioria não vai descobrir como usar bem: ou ignora, ou polui sem querer. Um guia curto e específico resolve um problema que o usuário sente sem saber descrever. O pack se escreve sozinho se você já sentou com cliente. Receita realista: R$ 1.500 a R$ 5.000/mês pra pack apertado sem audiência; R$ 5.000 a R$ 15.000/mês se você também manda DM no LinkedIn pra rede do seu próprio nicho. Não é vida nova. É número honesto.
|
Faça esta semana
Escolhe o papel hoje. Escreve o template de 5 fatos hoje à noite. Tudo o mais pode vir depois da primeira venda. O pack não precisa estar pronto pra ser listado. Precisa existir o suficiente pra primeira pessoa que comprar ficar feliz.
|
|
|
06 |
The Stack
Três ferramentas que tô testando esta semana
|
01 |
Mem0
Camada open source de memória de agente · OSS gratuito / Cloud a partir de ~US$ 20/mês (~R$ 100)
É a contraparte dev da Story 3. Mesmo que você não programe, conhecer o Mem0 é a diferença entre achar que memória é mágica e entender que memória é banco de dados curado. Lê a documentação uma vez (uns 20 minutos) e a feature de memória do ChatGPT que você ligou esta semana passa a fazer sentido completamente diferente. A feature não é inteligência. É recuperação contra um store curado. Esse reframe sozinho já vale a leitura. No Brasil, ainda não vi consultoria local empacotando isso em projeto. Janela aberta.
|
02 |
Maritaca AI (Sabiá-3.1)
Modelo BR treinado em PT-BR · API por token / freemium pra teste
Trocando uma das ferramentas internacionais aqui pra honrar o contexto BR. Sabiá-3.1 é o modelo da Maritaca AI treinado em português brasileiro com gírias e contexto regional, e tem performance igual ou superior ao GPT-4-turbo em 23 dos 64 exames brasileiros. Por que cabe na seção de memória? Porque se sua aplicação atende cliente PT-BR e você quer que o modelo "lembre" de jargão local, regulação local ou cultura local sem ter que injetar contexto em todo prompt, partir de uma base treinada em PT-BR é caminho mais curto. Não é substituto do Claude ou do GPT-5.5. É uma carta extra no stack pra projeto BR específico.
|
03 |
Reflect
Notas com backlinks + IA · US$ 10/mês (~R$ 50)
O app de notas que silenciosamente comeu meu hábito de Notion nos últimos 30 dias. O truque são os backlinks: toda nota sobre um projeto se conecta automaticamente com toda outra nota sobre o mesmo projeto, e a IA usa esse grafo pra responder. Coisa mais próxima de "infraestrutura de memória pessoal" que dá pra comprar como usuário normal esta semana. Se você já tentou Roam, Obsidian ou Tana e bateu na complexidade, Reflect é a versão amigável que ainda acerta o grafo. Custo em USD, mas R$ 50/mês cabe na conta de profissional Pro. ---
|
|
07 |
Dentro da FindSkill
O que tem de novo pros membros esta semana
|
|
|
↵ Hit reply
|
|
The Skill · by FindSkill.ai
|
|