Estudo revela “macete” para educarmos as IAs
Um novo estudo da Anthropic revela que comportamentos como bajulação, malícia ou alucinações em modelos de linguagem de grande porte (LLMs) estão ligados a padrões específicos de atividade neural simulada.…