🟢 Foundation

O que é IA generativa: o guia conceitual para gestores não-técnicos brasileiros

Explicação em PT-BR de IA generativa, LLM, prompt, contexto, agente e hallucination — sem jargão, com analogias do dia a dia corporativo brasileiro.

15 de maio de 2026 · 10 min · ai-foundations

Você é diretor, gestor, head de RH, head de operações. Em reuniões, ouve “vamos colocar IA aí” como se fosse café — algo que se serve. Mas quando precisa decidir comprar Copilot, contratar consultoria, autorizar piloto, percebe que falta o vocabulário básico. Este guia resolve isso.

Sem código, sem matemática, sem hype. Os 10 conceitos que você precisa para conversar com qualquer fornecedor de IA em 2026 e não ser empurrado.

1 · LLM (Large Language Model)

LLM é a fundação. Pense num funcionário que leu basicamente tudo o que está publicado em texto na internet até o ano de treinamento. Esse funcionário não tem memória entre conversas (cada conversa começa do zero) e não tem opinião própria — ele compõe respostas a partir de padrões que viu.

Exemplos práticos: Claude, GPT-4, Gemini, Llama. Diferenças entre eles vêm de quem treinou, como treinou, e o que foi enfiado no treinamento. Não confunda LLM com “IA” — IA é o termo guarda-chuva, LLM é a tecnologia específica que faz ChatGPT funcionar.

2 · Prompt

Prompt é a instrução que você dá ao LLM. “Resuma este relatório em 3 bullets” é um prompt. “Escreva um email pedindo desculpas pelo atraso, tom profissional brasileiro, máximo 5 linhas” também é. A qualidade do prompt define a qualidade da resposta — não é “a IA é inteligente”, é “o prompt é claro”.

3 · Contexto

Contexto é o que o LLM consegue ler de uma vez. Imagine uma janela: o prompt e tudo que você anexou (PDF, planilha, histórico de conversa) precisa caber dentro dessa janela. Quando ultrapassa, a IA “esquece” o início.

Janelas hoje (2026) são gigantes — 200 mil palavras é comum, 1 milhão de palavras em modelos premium. Mas grande não é grátis: contexto longo custa mais tempo e mais dinheiro, e a IA presta menos atenção ao meio do contexto.

4 · Hallucination (alucinação)

Quando o LLM responde com confiança total uma informação inventada. Cita um livro que não existe, inventa um juíz que nunca julgou aquele caso, fabrica uma estatística. Não é “bug” — é como o modelo funciona. Modelos completam padrões; quando o padrão “soa convincente”, eles entregam mesmo sem dado real.

Mitigação: nunca aceite afirmação factual sem verificação independente. Especialmente: nomes próprios, datas, citações de leis, números específicos, links.

5 · Tool use

Capacidade do LLM de chamar ferramentas externas: pesquisar na web, ler arquivo, executar código, mandar email. Quando uma IA “lê seu Outlook” ou “agenda reunião no Google Calendar”, é tool use. Eleva drasticamente o que dá pra automatizar — e o risco. Tool use sem governance é a maior causa de incidente de agente em produção.

6 · Agente

Agente é um LLM + tools + um loop. Em vez de você fazer cada pergunta, o agente lê o objetivo (“agendar reunião com João sobre projeto Y”), planeja, chama as tools necessárias (calendar, email), e executa. Pode ser autônomo ou pausar em pontos críticos pedindo confirmação.

Diferença com chatbot: chatbot responde. Agente age.

7 · RAG (Retrieval-Augmented Generation)

Técnica que combina LLM com base de conhecimento sua. Em vez de o modelo só saber o que aprendeu no treinamento, ele consulta documentos seus em tempo real e responde com base neles. É como dar ao funcionário acesso ao Drive da empresa antes de ele responder.

Aplicação típica: chatbot da sua empresa que responde sobre política interna usando os PDFs do RH.

8 · Fine-tuning

Treinar o modelo adicionalmente nos seus dados, para ele “aprender” o tom da empresa. Caro, demorado, raramente necessário em 2026 — RAG resolve 80% dos casos. Se um fornecedor está te empurrando fine-tuning, pergunte se RAG não resolve primeiro.

9 · Multimodal

LLM que processa texto + imagem + áudio + vídeo. Você manda foto de uma planilha em papel, ele extrai os números. Manda gravação de reunião, ele transcreve e resume. Em 2026 já é o padrão para os modelos de ponta.

10 · Token

A unidade de medida que o fornecedor cobra. Aproximadamente: 1 token = 0,75 palavra em inglês, ~0,5 palavra em português. Quando alguém fala “Claude tem janela de 200K tokens”, são ~150 mil palavras.

Token também é a métrica que define se o seu uso vai estourar o orçamento. Pergunte sempre ao fornecedor: quantos tokens médio por interação? Custo por mil tokens?

O que isso muda para você

Com esses 10 conceitos, você sai de “vamos colocar IA aí” para “qual modelo, qual contexto, qual tool use, qual governance, qual orçamento de tokens”. É a diferença entre comprar caixa preta e comprar capacidade.

Próximo passo prático: rode o diagnóstico AI Agency Ladder no seu time. Saberá em qual nível operam, e o investimento que destrava o salto.