🌀 Sumário do Artigo
- A Anatomia de um Bom Prompt
- Técnica 1: Chain-of-Thought (Cadeia de Raciocínio)
- Técnica 2: Few-Shot Prompting (Aprendizado por Exemplo)
- Técnica 3: Prompts com Estrutura XML
- Técnica 4: Role Prompting (Atribuição de Persona)
- Técnica 5: Prompt Chaining (Encadeamento de Prompts)
- Exemplos Comparativos: Prompt Ruim vs. Prompt Bom
- Diferenças Entre ChatGPT, Claude e Gemini
- •Claude (Anthropic)
- •ChatGPT (OpenAI)
- •Gemini (Google)
- Recursos Adicionais no Turbina IA
- Perguntas Frequentes
- •1. O que é prompt engineering?
- •2. Chain-of-thought funciona com todos os modelos?
- •3. Quantos exemplos devo incluir em um few-shot prompt?
- •4. Preciso usar tags XML nos meus prompts?
- •5. Existe diferença entre o prompt para uso pessoal e para APIs?
- Fontes e Referências
Uma pesquisa publicada no arXiv em 2025 mapeou 58 técnicas distintas de prompting para LLMs — e a maioria das pessoas usa, no máximo, uma ou duas delas. A diferença entre um prompt genérico e um prompt bem engenheirado não é cosmética: é a diferença entre uma resposta que você descarta e uma que vai direto para o seu documento final. Plataformas de suporte ao cliente que adotaram prompt engineering estruturado relatam melhoras de 17% para 91% na taxa de resolução de problemas sem intervenção humana.
Resposta Rápida (TL;DR): Prompts de alta performance combinam três elementos: contexto claro (quem, para quê, em qual cenário), instrução direta com verbo de ação (Escreva, Analise, Resuma) e exemplos de formato esperado (few-shot prompting). Adicionar a frase "pense passo a passo" a problemas lógicos (chain-of-thought) é a técnica individual com melhor custo-benefício documentada pela pesquisa acadêmica.
A Anatomia de um Bom Prompt
A documentação oficial da Anthropic descreve o modelo como "um funcionário brilhante que ainda não conhece seus processos internos". Quanto mais você contextualiza e delimita a tarefa, menos o modelo precisa adivinhar — e menos ele erra.
Segundo o guia oficial de prompt engineering da Anthropic, todo prompt eficaz é composto de camadas:
- Papel (Role): Define a perspectiva e o repertório de conhecimento que o modelo deve usar.
- Contexto: Explica o cenário, o público-alvo e o motivo da tarefa.
- Instrução principal: Verbo de ação no imperativo + tarefa específica.
- Restrições: Tom, tamanho, formatos proibidos, termos a evitar.
- Exemplo de saída (Few-Shot): Uma amostra do resultado esperado.
A Anthropic define um "teste de clareza" simples para verificar um prompt: mostre-o a um colega sem contexto adicional e pergunte se ele conseguiria seguir as instruções. Se o colega hesitar, o Claude também vai hesitar.
A OpenAI, em seu guia de prompt engineering, recomenda uma estrutura semelhante com quatro seções: Identidade → Instruções → Exemplos → Contexto. Os dois guias convergem no mesmo ponto: ambiguidade é a principal causa de respostas ruins, não limitação do modelo.
Técnica 1: Chain-of-Thought (Cadeia de Raciocínio)
Chain-of-Thought (CoT) é a técnica com maior impacto documentado em pesquisas para tarefas que envolvem múltiplas etapas de raciocínio — cálculos, diagnósticos, análises lógicas.
O princípio é direto: ao invés de pedir a resposta final, você instrui o modelo a "mostrar o trabalho" antes de concluir. A frase mais testada academicamente é:
"Pense passo a passo antes de responder."
Variações igualmente eficazes:
- "Desenvolva um raciocínio intermediário antes de chegar à conclusão."
- "Liste as premissas envolvidas e depois resolva."
A documentação da Anthropic recomenda o uso de tags XML para separar o raciocínio da resposta final em contextos de API:
<thinking>
[raciocínio do modelo aqui]
</thinking>
<answer>
[resposta final aqui]
</answer>
Isso evita que o "rascunho mental" polua a saída exibida ao usuário.
Quando usar: Qualquer tarefa com mais de dois passos lógicos — planejamento de projetos, análises financeiras, debugging de código, tomada de decisão com múltiplos critérios.
Técnica 2: Few-Shot Prompting (Aprendizado por Exemplo)
Few-Shot Prompting consiste em fornecer de 3 a 5 exemplos de entrada e saída desejada dentro do próprio prompt. Em vez de descrever o que você quer, você mostra.
A Anthropic recomenda que os exemplos sejam:
- Relevantes: espelhem o caso de uso real.
- Diversos: cubram variações e casos extremos.
- Estruturados: envoltos em tags
<example>para que o modelo os distinga das instruções.
Exemplo prático de Few-Shot para classificação de e-mails:
Classifique o e-mail abaixo como URGENTE, NORMAL ou PODE AGUARDAR.
<examples>
<example>
<input>Assunto: Servidor de produção fora do ar</input>
<output>URGENTE</output>
</example>
<example>
<input>Assunto: Pauta para reunião da semana que vem</input>
<output>PODE AGUARDAR</output>
</example>
<example>
<input>Assunto: Aprovação do relatório trimestral até sexta</input>
<output>NORMAL</output>
</example>
</examples>
E-mail para classificar:
Assunto: Cliente principal solicitando call urgente sobre contrato
A OpenAI especifica no seu guia que o Few-Shot é especialmente eficaz em tradução, geração de código e tarefas de classificação, onde consistência de formato é crítica.
Técnica 3: Prompts com Estrutura XML
Esta é uma técnica específica para Claude, documentada como best practice no guia da Anthropic. Tags XML ajudam o modelo a delimitar tipos de conteúdo sem ambiguidade — separando instruções de contexto, de exemplos e de entrada variável.
Estrutura recomendada:
<instructions>
Você é um analista financeiro sênior. Analise o relatório e identifique os 3 principais riscos.
</instructions>
<context>
Empresa: Startup de fintech, série B, 200 funcionários.
Mercado: Brasil, foco em crédito para MEIs.
</context>
<document>
[conteúdo do relatório aqui]
</document>
Apresente cada risco em formato: Nome do Risco | Probabilidade | Impacto Estimado.
A Anthropic documenta que colocar dados longos (documentos, planilhas, relatórios) antes da pergunta e das instruções pode melhorar a qualidade das respostas em até 30% em tarefas com múltiplos documentos.
Técnica 4: Role Prompting (Atribuição de Persona)
Atribuir um papel ao modelo direciona o vocabulário, o nível de tecnicidade e o ponto de vista adotado na resposta. A Anthropic recomenda que isso seja feito no início do prompt (ou no "system prompt" em contextos de API):
"Você é um redator publicitário com 10 anos de experiência em campanhas B2B para o setor de tecnologia."
O impacto é concreto: o mesmo pedido de "escrever um e-mail de prospecção" entregará resultados radicalmente diferentes com e sem a persona definida. Com a persona, o modelo tende a usar linguagem mais adequada ao público, evitar erros de tom e manter consistência ao longo de textos mais longos.
Dica da documentação da Anthropic: Explique o motivo de uma restrição, não apenas a restrição em si. Em vez de "nunca use reticências", escreva: "Não use reticências porque o texto será lido por software de text-to-speech, que não sabe como pronunciá-las." O modelo generaliza melhor quando entende o raciocínio por trás da instrução.
Técnica 5: Prompt Chaining (Encadeamento de Prompts)
Prompt chaining divide tarefas complexas em uma sequência de chamadas menores e interdependentes. Em vez de pedir tudo de uma vez, você usa a saída de um prompt como entrada do próximo.
A Anthropic documenta o padrão mais comum: gerar → revisar → refinar:
- Prompt 1: "Escreva um rascunho de artigo sobre [tema] com 500 palavras, focado em [público]."
- Prompt 2: "Revise o artigo abaixo contra estes critérios: [lista]. Identifique os três pontos mais fracos."
- Prompt 3: "Reescreva o artigo incorporando as correções apontadas: [output do prompt 2]."
Esse padrão é especialmente útil porque permite inspecionar e aprovar os resultados intermediários, algo impossível em um único prompt longo.
Exemplos Comparativos: Prompt Ruim vs. Prompt Bom
| Situação | Prompt Ruim | Prompt Melhorado |
|---|---|---|
| E-mail de prospecção | "Escreva um e-mail de vendas para cliente." | "Aja como consultor de vendas B2B. Escreva um e-mail de prospecção frio para o diretor de TI de uma empresa de logística de médio porte, convidando para um demo de 20 min do nosso software de rastreamento de frotas. Tom: profissional mas direto. Máximo 150 palavras. Sem jargões como 'solução inovadora'." |
| Análise de dados | "Analise esses dados de vendas." | "Aja como analista de dados. Analise a tabela abaixo e identifique: (1) os 3 produtos com maior crescimento MoM, (2) regiões com queda acima de 10%, (3) uma hipótese para o padrão encontrado. Formato de saída: tabela + parágrafo de conclusão." |
| Resumo de documento | "Resuma esse texto." | "Resuma o documento abaixo em exatamente 5 bullet points, cada um com no máximo 20 palavras. Público: executivos sem contexto técnico. Foque em implicações de negócio, não em detalhes técnicos." |
| Geração de código | "Escreva código Python para processar CSV." | "Escreva uma função Python que leia um CSV com colunas [nome, data, valor], filtre linhas onde valor > 1000, e exporte para novo CSV. Adicione tratamento de erro para arquivo não encontrado. Use pandas. Inclua docstring e comentários em português." |
| Brainstorm | "Me dê ideias de conteúdo." | "Gere 10 ideias de posts para LinkedIn direcionados a gerentes de RH de empresas com 100-500 funcionários. Tema geral: automação de processos de RH com IA. Tom educativo, não comercial. Inclua um possível gancho emocional para cada ideia." |
Diferenças Entre ChatGPT, Claude e Gemini
Cada modelo tem características distintas que afetam como os prompts devem ser estruturados. Conhecer essas diferenças evita frustração e permite aproveitar os pontos fortes de cada ferramenta.
Claude (Anthropic)
Melhor para: documentos longos, análise detalhada, revisão crítica, código com explicações.
Claude processa janelas de contexto extensas com alta fidelidade. A Anthropic documenta que o modelo segue instruções de forma literal — se você não delimitar o escopo, ele vai além do solicitado. Sempre defina tamanho máximo e restrições de formato.
Técnicas que funcionam melhor no Claude:
- Tags XML para separar contexto, instruções e exemplos
- Solicitar que o modelo cite trechos do documento antes de responder
- Definir persona + explicar o motivo das restrições
Atenção: Sem restrição de tamanho, Claude tende a escrever respostas mais longas do que o necessário. Adicione sempre: "Responda em no máximo X palavras" ou "Seja direto e conciso."
ChatGPT (OpenAI)
Melhor para: saídas estruturadas (JSON, tabelas, código), tarefas com formato rígido, brainstorm rápido.
A OpenAI recomenda usar constraints numéricas explícitas: "3 bullets", "máximo 50 palavras", "em formato JSON com os campos X, Y, Z". O ChatGPT responde bem a esse tipo de instrução objetiva e tende a priorizar o formato especificado.
Técnicas que funcionam melhor no ChatGPT:
- Especificar o formato de saída logo no início do prompt
- Quebrar tarefas complexas em etapas numeradas
- Usar a instrução de developer/system para regras fixas
Atenção: O modelo pode priorizar formato em detrimento de precisão em alguns casos — revise o conteúdo com atenção quando a acurácia factual for crítica.
Gemini (Google)
Melhor para: pesquisa com fontes recentes, tarefas multimodais (texto + imagem), síntese de informações da web.
Por ter integração nativa com a busca do Google, o Gemini é especialmente útil para tarefas que exigem dados atualizados. Defina sempre o escopo temporal ("dados de 2025") e solicite links para as fontes ("inclua URLs para cada afirmação").
Técnicas que funcionam melhor no Gemini:
- Definir o escopo de pesquisa e período temporal
- Solicitar explicitamente links de referência
- Especificar como lidar com incerteza ("se não tiver certeza, diga explicitamente")
Atenção: Sem solicitação explícita, o Gemini pode fornecer fontes de baixa qualidade ou omiti-las. Peça sempre: "Liste as fontes utilizadas com URLs."
Recursos Adicionais no Turbina IA
Para aprofundar sua prática de prompting, explore os recursos do próprio site:
- Biblioteca de Prompts: Mais de 100 prompts prontos e categorizados para uso imediato em marketing, programação, análise de dados, redação e muito mais.
- Gerador de Prompts com IA: Descreva o que você precisa e receba um prompt otimizado automaticamente, baseado nas melhores práticas documentadas pela Anthropic e OpenAI.
Perguntas Frequentes
1. O que é prompt engineering?
Prompt engineering é a prática de estruturar instruções para modelos de linguagem (LLMs) de forma a maximizar a qualidade, precisão e relevância das respostas. Não é programação no sentido técnico — é a habilidade de comunicar com clareza o que você precisa, para quem, em qual formato e com quais restrições. O survey de 2025 publicado no arXiv catalogou 58 técnicas distintas usadas em pesquisa e aplicações profissionais.
2. Chain-of-thought funciona com todos os modelos?
Sim, mas com variações. A técnica foi originalmente documentada em pesquisas com GPT-4 e modelos de raciocínio da OpenAI, mas funciona com Claude, Gemini e outros LLMs modernos. A Anthropic recomenda seu uso especialmente para tarefas com múltiplas etapas lógicas. Em Claude Opus 4.7 e modelos com "thinking" nativo, o raciocínio intermediário pode ser ativado de forma mais robusta via parâmetros de API (modo adaptativo).
3. Quantos exemplos devo incluir em um few-shot prompt?
A Anthropic recomenda entre 3 e 5 exemplos para a maioria dos casos. Menos de 3 pode não ser suficiente para estabelecer o padrão; mais de 5 ocupa espaço de contexto sem ganho proporcional. O mais importante é que os exemplos sejam diversos — cobrindo variações do problema — e estruturados de forma consistente.
4. Preciso usar tags XML nos meus prompts?
Não é obrigatório para uso casual, mas é fortemente recomendado pela Anthropic para tarefas complexas ou uso profissional. As tags eliminam ambiguidade sobre o que é instrução, o que é contexto e o que é exemplo. Para o ChatGPT, a estrutura com markdown (cabeçalhos, listas) cumpre função semelhante.
5. Existe diferença entre o prompt para uso pessoal e para APIs?
Sim. No uso pessoal via chat (ChatGPT.com, Claude.ai), você interage diretamente. Via API, você tem acesso ao "system prompt" — uma camada de instrução de alta prioridade que define regras fixas independentemente do que o usuário digitar. A documentação da OpenAI descreve isso como a diferença entre "a função e seus argumentos": o system prompt é a função (regras estáveis), o user prompt é o argumento (tarefa específica).
Fontes e Referências
- Anthropic — Prompting Best Practices (documentação oficial)
- Anthropic — Prompt Engineering Overview
- OpenAI — Prompt Engineering Guide (API Docs)
- The Prompt Report: A Systematic Survey of Prompt Engineering Techniques (arXiv 2406.06608)
- A Systematic Survey of Prompt Engineering in Large Language Models (arXiv 2402.07927)
- Lakera — The Ultimate Guide to Prompt Engineering (2026)
- PromptBuilder — Claude vs ChatGPT vs Gemini Best Practices