Neste artigo

Base de conhecimento dos agentes de IA

A base de conhecimento é o que evita o agente de IA inventar. Suba documentos, sites e textos pra ele consultar antes de responder — funciona via busca semântica.

Atualizado em 24 de maio de 2026

A base de conhecimento é o que evita o agente de IA inventar. Sem ela, o agente só sabe o que vem na personalidade e instruções. Com ela, ele consulta seus documentos, sites e textos antes de responder.

Como funciona

Quando o cliente faz uma pergunta:

  1. O Codewo converte a pergunta em uma "impressão digital" matemática (vetor).
  2. Busca os trechos da sua base que mais combinam com a pergunta.
  3. Manda esses trechos como contexto pra IA responder.
  4. A resposta vai pro cliente, com o registro de qual fonte foi usada.

Esse processo se chama RAG (Retrieval-Augmented Generation). Você não precisa entender o nome — só precisa subir os documentos certos.

A grande virtude: o agente não usa fato que não está na base. Se você não subiu informação sobre preço do plano Enterprise, ele não inventa um valor — ele diz "não tenho essa informação" ou transfere pra humano.

Tipos de fonte aceitos

  • PDFs — Documentos, manuais, contratos. Precisam ter texto extraível (PDFs feitos de imagem escaneada não funcionam sem OCR prévio).
  • URLs — Páginas do seu site. O Codewo baixa o conteúdo HTML e indexa o texto visível.
  • Texto puro — Cole texto direto. Útil pra FAQs, listas de produtos, políticas curtas.

Configuração

Em Configurações → IA → Base de conhecimento:

  1. Clique em Nova fonte.
  2. Escolha o tipo (PDF, URL, ou Texto).
  3. Faça upload do arquivo, cole a URL ou digite o texto.
  4. Dê um nome interno (ex: "Política de Cancelamento") — ajuda você a se organizar; o cliente não vê.
  5. Salve. O sistema entra em status Processando enquanto indexa.
  6. Quando o status virar Pronta, a fonte já está disponível pros agentes consultarem.

Depois de criar a fonte, em Configurações → IA → Agentes → [seu agente], marque quais fontes esse agente específico vai usar. Um mesmo documento pode atender a vários agentes; cada agente pode usar fontes diferentes.

Exemplo prático

Loja de software com plano Free, Pro e Enterprise:

  • Fonte 1 (PDF): "Tabela de planos.pdf" — Lista detalhada de recursos por plano.
  • Fonte 2 (URL): https://meusite.com.br/faq — Página de perguntas frequentes.
  • Fonte 3 (Texto): "Política de cancelamento" — Texto explicando como cancelar.
  • Fonte 4 (PDF): "Guia de integração de API.pdf" — Tutorial técnico pra desenvolvedores.

O agente "Sofia" (atendimento geral) usa Fontes 1, 2 e 3.
O agente "TechBot" (suporte técnico) usa Fontes 1, 3 e 4.

Cliente pergunta pra Sofia: "Como cancelar minha assinatura?"
→ Sofia consulta Fontes 1, 2 e 3 (que ela tem acesso).
→ Encontra resposta na Fonte 3.
→ Responde citando o procedimento.

Pegadinhas comuns

  • Reindexação leva tempo. Após subir/editar uma fonte, o processamento pode levar de segundos a vários minutos (depende do tamanho). Se o agente "não sabe" algo que você acabou de subir, espere o status virar Pronta.
  • PDFs escaneados não funcionam. Se o PDF é foto de página (sem texto selecionável), o sistema não extrai conteúdo. Precisa OCR prévio (use Adobe Acrobat ou ferramenta online pra converter).
  • URLs com login bloqueiam. Página que exige autenticação não pode ser indexada — o Codewo acessa como visitante anônimo. Páginas atrás de login não entram.
  • URL dinâmica (JavaScript-only). Sites SPA modernos (React/Vue sem SSR) podem ter conteúdo renderizado só por JS. O Codewo lê o HTML servidor — se a info aparece só depois do JS rodar, não captura.
  • Documento gigante = busca menos precisa. Subir o manual inteiro de 500 páginas faz a busca devolver trechos menos focados. Quebrar em vários documentos menores (um por tópico) gera melhores respostas.
  • Conteúdo bilíngue confunde. Misturar PT e EN no mesmo documento pode resultar em respostas trocando idioma. Mantenha um idioma por documento.
  • Mudou a base? Cache da resposta NÃO refletir imediatamente. Conversas em andamento mantêm o contexto antigo. Conversas novas pegam o atualizado.

Boas práticas

  • Qualidade > quantidade. Um PDF limpo com as 10 perguntas mais frequentes vence 50 PDFs bagunçados.
  • Nomeie fontes claramente. "Política de Reembolso v3" ajuda você a manter; o cliente não vê.
  • Documentos curtos e focados. Quebra por tópico, não por departamento. Um doc "Tudo sobre Vendas" é pior que três docs específicos.
  • Mantenha a base atualizada. Política mudou? Atualize o doc. Senão, agente continua respondendo com info velha.
  • Audite o que o agente usa. Em Configurações → IA → Histórico, veja qual fonte ele citou em cada resposta. Se a fonte errada está sendo citada muito, ajuste o conteúdo.
  • Combine documentos formais com texto coloquial. O agente responde melhor quando a base tem o tom da resposta que você quer ouvir.

Veja também

Este artigo foi útil?

Continue lendo