Fundamentos de Engenharia de Prompt

Introdução

Este módulo aborda conceitos e técnicas essenciais para criar prompts eficazes em modelos de IA generativa. A forma como você escreve seu prompt para um LLM também é importante. Um prompt bem elaborado pode gerar uma resposta de melhor qualidade. Mas o que exatamente significam termos como prompt e engenharia de prompt? E como posso melhorar o input do prompt que envio para o LLM? Essas são as perguntas que tentaremos responder neste capítulo e no próximo.

A IA generativa é capaz de criar novos conteúdos (por exemplo, texto, imagens, áudio, código etc.) em resposta a solicitações dos usuários. Ela faz isso utilizando Modelos de Linguagem Grande como a série GPT ("Generative Pre-trained Transformer") da OpenAI, que são treinados para usar linguagem natural e código.

Os usuários agora podem interagir com esses modelos usando paradigmas familiares, como chat, sem necessidade de conhecimento técnico ou treinamento. Os modelos são baseados em prompts - os usuários enviam um texto de entrada (prompt) e recebem a resposta da IA (completamento). Eles podem então "conversar com a IA" de forma iterativa, em conversas de múltiplas etapas, refinando seu prompt até que a resposta atenda às suas expectativas.

Os "prompts" agora se tornam a principal interface de programação para aplicativos de IA generativa, dizendo aos modelos o que fazer e influenciando a qualidade das respostas retornadas. A "Engenharia de Prompt" é um campo de estudo em rápido crescimento que se concentra no design e otimização de prompts para fornecer respostas consistentes e de qualidade em escala.

Objetivos de Aprendizagem

Nesta lição, aprenderemos o que é Engenharia de Prompt, por que ela é importante e como podemos criar prompts mais eficazes para um modelo e objetivo de aplicação específicos. Vamos entender os conceitos principais e as melhores práticas para engenharia de prompt - e aprender sobre um ambiente interativo de "sandbox" no Jupyter Notebooks onde podemos ver esses conceitos aplicados a exemplos reais.

Ao final desta lição, seremos capazes de:

Explicar o que é engenharia de prompt e por que ela é importante.
Descrever os componentes de um prompt e como eles são usados.
Aprender melhores práticas e técnicas para engenharia de prompt.
Aplicar as técnicas aprendidas a exemplos reais, usando um endpoint da OpenAI.

Termos-Chave

Engenharia de Prompt: A prática de projetar e refinar entradas para guiar modelos de IA a produzir os resultados desejados.
Tokenização: O processo de converter texto em unidades menores, chamadas tokens, que um modelo pode entender e processar.
LLMs Ajustados por Instrução: Modelos de Linguagem Grande (LLMs) que foram ajustados com instruções específicas para melhorar a precisão e relevância de suas respostas.

Sandbox de Aprendizagem

A engenharia de prompt atualmente é mais arte do que ciência. A melhor maneira de melhorar nossa intuição sobre ela é praticar mais e adotar uma abordagem de tentativa e erro que combina expertise no domínio de aplicação com técnicas recomendadas e otimizações específicas para o modelo.

O Jupyter Notebook que acompanha esta lição fornece um ambiente de sandbox onde você pode experimentar o que aprende - conforme avança ou como parte do desafio de código no final. Para executar os exercícios, você precisará de:

Uma chave de API do Azure OpenAI - o endpoint de serviço para um LLM implantado.
Um ambiente de execução Python - no qual o Notebook pode ser executado.
Variáveis de ambiente locais - complete os passos de CONFIGURAÇÃO agora para se preparar.

O notebook vem com exercícios iniciais - mas você é incentivado a adicionar suas próprias seções de Markdown (descrição) e Código (solicitações de prompt) para experimentar mais exemplos ou ideias - e construir sua intuição para design de prompts.

Guia Ilustrado

Quer ter uma visão geral do que esta lição cobre antes de mergulhar? Confira este guia ilustrado, que dá uma ideia dos principais tópicos abordados e os principais aprendizados para você refletir em cada um deles. O roteiro da lição leva você desde a compreensão dos conceitos e desafios principais até abordá-los com técnicas relevantes de engenharia de prompt e melhores práticas. Observe que a seção "Técnicas Avançadas" neste guia refere-se ao conteúdo abordado no próximo capítulo deste currículo.

Nossa Startup

Agora, vamos falar sobre como este tópico se relaciona com nossa missão de startup de trazer inovação em IA para a educação. Queremos construir aplicativos de aprendizado personalizado com tecnologia de IA - então vamos pensar em como diferentes usuários de nosso aplicativo podem "projetar" prompts:

Administradores podem pedir à IA para analisar dados curriculares e identificar lacunas na cobertura. A IA pode resumir os resultados ou visualizá-los com código.
Educadores podem pedir à IA para gerar um plano de aula para um público-alvo e tema específicos. A IA pode criar o plano personalizado em um formato especificado.
Estudantes podem pedir à IA para ajudá-los em uma matéria difícil. A IA pode orientar os alunos com lições, dicas e exemplos adaptados ao nível deles.

Isso é apenas a ponta do iceberg. Confira Prompts para Educação - uma biblioteca de prompts de código aberto curada por especialistas em educação - para ter uma ideia mais ampla das possibilidades! Experimente executar alguns desses prompts no sandbox ou usando o OpenAI Playground para ver o que acontece!

O que é Engenharia de Prompt?

Começamos esta lição definindo Engenharia de Prompt como o processo de projetar e otimizar entradas de texto (prompts) para fornecer respostas consistentes e de qualidade (completamentos) para um objetivo de aplicação e modelo específicos. Podemos pensar nisso como um processo de 2 etapas:

projetar o prompt inicial para um modelo e objetivo específicos
refinar o prompt de forma iterativa para melhorar a qualidade da resposta

Esse é necessariamente um processo de tentativa e erro que exige intuição e esforço do usuário para obter resultados ideais. Então, por que isso é importante? Para responder a essa pergunta, primeiro precisamos entender três conceitos:

Tokenização = como o modelo "vê" o prompt
Base LLMs = como o modelo base "processa" um prompt
LLMs Ajustados por Instrução = como o modelo pode agora ver "tarefas"

Tokenização

Um LLM vê prompts como uma sequência de tokens, onde diferentes modelos (ou versões de um modelo) podem tokenizar o mesmo prompt de maneiras diferentes. Como os LLMs são treinados em tokens (e não em texto bruto), a forma como os prompts são tokenizados tem um impacto direto na qualidade da resposta gerada.

Para ter uma ideia de como a tokenização funciona, experimente ferramentas como o Tokenizador da OpenAI mostrado abaixo. Copie seu prompt - e veja como ele é convertido em tokens, prestando atenção em como os caracteres de espaço e pontuação são tratados. Observe que este exemplo mostra um LLM mais antigo (GPT-3) - então, tentar isso com um modelo mais recente pode produzir um resultado diferente.

Conceito: Modelos Fundamentais

Uma vez que um prompt é tokenizado, a função principal do "Base LLM" (ou modelo fundamental) é prever o próximo token nessa sequência. Como os LLMs são treinados em conjuntos de dados massivos de texto, eles têm uma boa noção das relações estatísticas entre os tokens e podem fazer essa previsão com alguma confiança. Observe que eles não entendem o significado das palavras no prompt ou token; eles apenas veem um padrão que podem "completar" com sua próxima previsão. Eles podem continuar prevendo a sequência até serem interrompidos pela intervenção do usuário ou por alguma condição pré-estabelecida.

Quer ver como funciona a conclusão baseada em prompt? Insira o prompt acima no Chat Playground do Azure OpenAI Studio com as configurações padrão. O sistema está configurado para tratar os prompts como solicitações de informações - então você deve ver uma conclusão que satisfaça esse contexto.

Mas e se o usuário quiser ver algo específico que atenda a alguns critérios ou objetivos de tarefa? É aqui que os LLMs ajustados por instrução entram em cena.

Conceito: LLMs Ajustados por Instrução

Um LLM Ajustado por Instrução começa com o modelo base e o ajusta com exemplos ou pares de entrada/saída (por exemplo, "mensagens" de múltiplas etapas) que podem conter instruções claras - e a resposta da IA tenta seguir essa instrução.

Isso utiliza técnicas como Aprendizado por Reforço com Feedback Humano (RLHF) que podem treinar o modelo para seguir instruções e aprender com feedback, de modo que ele produza respostas mais adequadas para aplicações práticas e mais relevantes para os objetivos do usuário.

Vamos experimentar - revise o prompt acima, mas agora altere a mensagem do sistema para fornecer a seguinte instrução como contexto:

Resuma o conteúdo fornecido para um aluno da segunda série. Mantenha o resultado em um parágrafo com 3-5 tópicos.

Veja como o resultado agora está ajustado para refletir o objetivo e o formato desejados? Um educador agora pode usar diretamente essa resposta em seus slides para a aula.

Por que precisamos de Engenharia de Prompt?

Agora que sabemos como os prompts são processados pelos LLMs, vamos falar sobre por que precisamos de engenharia de prompt. A resposta está no fato de que os LLMs atuais apresentam uma série de desafios que tornam mais difícil alcançar completamentos confiáveis e consistentes sem investir esforço na construção e otimização de prompts. Por exemplo:

As respostas dos modelos são estocásticas. O mesmo prompt provavelmente produzirá respostas diferentes com diferentes modelos ou versões de modelos. E pode até produzir resultados diferentes com o mesmo modelo em momentos diferentes. As técnicas de engenharia de prompt podem nos ajudar a minimizar essas variações, fornecendo melhores diretrizes.
Os modelos podem fabricar respostas. Os modelos são pré-treinados com conjuntos de dados grandes, mas finitos, o que significa que eles não têm conhecimento sobre conceitos fora desse escopo de treinamento. Como resultado, podem produzir completamentos que são imprecisos, imaginários ou diretamente contraditórios aos fatos conhecidos. As técnicas de engenharia de prompt ajudam os usuários a identificar e mitigar essas fabricações, por exemplo, pedindo citações ou raciocínios à IA.
As capacidades dos modelos variam. Modelos mais novos ou gerações de modelos terão capacidades mais ricas, mas também trarão peculiaridades únicas e compensações em custo e complexidade. A engenharia de prompt pode nos ajudar a desenvolver melhores práticas e fluxos de trabalho que abstraem as diferenças e se adaptam aos requisitos específicos dos modelos de maneira escalável e eficiente.

Vamos ver isso em ação no OpenAI ou no Azure OpenAI Playground:

Use o mesmo prompt com diferentes implantações de LLM (por exemplo, OpenAI, Azure OpenAI, Hugging Face) - você percebeu as variações?
Use o mesmo prompt repetidamente com a mesma implantação de LLM (por exemplo, playground do Azure OpenAI) - como essas variações diferiram?

Exemplo de Fabricações

Neste curso, usamos o termo "fabricação" para nos referirmos ao fenômeno em que os LLMs às vezes geram informações factualmente incorretas devido a limitações em seu treinamento ou outras restrições. Você também pode ter ouvido isso ser chamado de "alucinações" em artigos populares ou trabalhos de pesquisa. No entanto, recomendamos fortemente o uso do termo "fabricação" para evitar antropomorfizar o comportamento, atribuindo uma característica humana a um resultado gerado por máquina. Isso também reforça as diretrizes de IA Responsável do ponto de vista terminológico, removendo termos que também podem ser considerados ofensivos ou não inclusivos em alguns contextos.

Quer ter uma ideia de como as fabricações funcionam? Pense em um prompt que instrua a IA a gerar conteúdo para um tópico inexistente (para garantir que não seja encontrado no conjunto de dados de treinamento). Por exemplo - eu tentei este prompt:

Prompt: gere um plano de aula sobre a Guerra Marciana de 2076. Uma pesquisa na web mostrou que existem relatos fictícios (por exemplo, séries de televisão ou livros) sobre guerras em Marte - mas nenhum em 2076. O senso comum também nos diz que 2076 está no futuro e, portanto, não pode estar associado a um evento real.

Então, o que acontece quando executamos este prompt com diferentes provedores de LLM?

Resposta 1: OpenAI Playground (GPT-35)

Resposta 2: Azure OpenAI Playground (GPT-35)

Resposta 3: Hugging Face Chat Playground (LLama-2)

Como esperado, cada modelo (ou versão de modelo) produz respostas ligeiramente diferentes devido ao comportamento estocástico e às variações de capacidade do modelo. Por exemplo, um modelo direciona-se a um público de 8ª série, enquanto outro assume um estudante do ensino médio. Mas todos os três modelos geraram respostas que poderiam convencer um usuário desinformado de que o evento era real.

Técnicas de engenharia de prompts como metaprompting e configuração de temperatura podem reduzir as fabricações do modelo até certo ponto. Novas arquiteturas de engenharia de prompts também incorporam novas ferramentas e técnicas de forma integrada ao fluxo de prompts, para mitigar ou reduzir alguns desses efeitos.

Estudo de Caso: GitHub Copilot

Vamos encerrar esta seção entendendo como a engenharia de prompts é usada em soluções do mundo real, analisando um Estudo de Caso: GitHub Copilot.

GitHub Copilot é seu "Programador Parceiro de IA" - ele converte prompts de texto em sugestões de código e está integrado ao seu ambiente de desenvolvimento (por exemplo, Visual Studio Code) para uma experiência de usuário fluida. Conforme documentado na série de blogs abaixo, a versão inicial foi baseada no modelo OpenAI Codex - com os engenheiros rapidamente percebendo a necessidade de ajustar o modelo e desenvolver melhores técnicas de engenharia de prompts para melhorar a qualidade do código. Em julho, eles lançaram um modelo de IA aprimorado que vai além do Codex para sugestões ainda mais rápidas.

Leia os posts na ordem para acompanhar a jornada de aprendizado deles.

Maio 2023 | GitHub Copilot está ficando melhor em entender seu código
Maio 2023 | Por dentro do GitHub: Trabalhando com os LLMs por trás do GitHub Copilot.
Junho 2023 | Como escrever melhores prompts para o GitHub Copilot.
Julho 2023 | .. GitHub Copilot vai além do Codex com modelo de IA aprimorado
Julho 2023 | Guia do Desenvolvedor para Engenharia de Prompts e LLMs
Setembro 2023 | Como construir um aplicativo empresarial com LLM: Lições do GitHub Copilot

Você também pode explorar o blog de engenharia para mais posts como este, que mostra como esses modelos e técnicas são aplicados para impulsionar aplicações no mundo real.

Construção de Prompts

Já vimos por que a engenharia de prompts é importante - agora vamos entender como os prompts são construídos para que possamos avaliar diferentes técnicas para um design de prompt mais eficaz.

Prompt Básico

Vamos começar com o prompt básico: uma entrada de texto enviada ao modelo sem nenhum outro contexto. Aqui está um exemplo - quando enviamos as primeiras palavras do hino nacional dos EUA para a API de Completação da OpenAI, ela instantaneamente completa a resposta com as próximas linhas, ilustrando o comportamento básico de previsão.

Prompt (Entrada)	Completação (Saída)
Oh say can you see	Parece que você está começando a letra de "The Star-Spangled Banner", o hino nacional dos Estados Unidos. A letra completa é ...

Prompt Complexo

Agora vamos adicionar contexto e instruções ao prompt básico. A API de Completação de Chat nos permite construir um prompt complexo como uma coleção de mensagens com:

Pares de entrada/saída refletindo a entrada do usuário e a resposta do assistente.
Mensagem do sistema definindo o contexto para o comportamento ou personalidade do assistente.

A solicitação agora está no formato abaixo, onde a tokenização captura efetivamente informações relevantes do contexto e da conversa. Agora, alterar o contexto do sistema pode ser tão impactante na qualidade das respostas quanto as entradas fornecidas pelo usuário.

response = openai.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Who won the world series in 2020?"},
        {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
        {"role": "user", "content": "Where was it played?"}
    ]
)

Prompt de Instrução

Nos exemplos acima, o prompt do usuário era uma consulta de texto simples que pode ser interpretada como uma solicitação de informação. Com prompts de instrução, podemos usar esse texto para especificar uma tarefa com mais detalhes, fornecendo orientações melhores para a IA. Aqui está um exemplo:

Prompt (Entrada)	Completação (Saída)	Tipo de Instrução
Escreva uma descrição da Guerra Civil	retornou um parágrafo simples	Simples
Escreva uma descrição da Guerra Civil. Forneça datas e eventos importantes e descreva sua relevância	retornou um parágrafo seguido por uma lista de datas de eventos importantes com descrições	Complexo
Escreva uma descrição da Guerra Civil em 1 parágrafo. Forneça 3 tópicos com datas importantes e sua relevância. Forneça mais 3 tópicos com figuras históricas importantes e suas contribuições. Retorne a saída como um arquivo JSON.	retornou detalhes mais extensos em uma caixa de texto, formatados como JSON que você pode copiar e colar em um arquivo e validar conforme necessário	Complexo. Formatado.

Conteúdo Principal

Nos exemplos acima, o prompt ainda era bastante aberto, permitindo que o LLM decidisse qual parte de seu conjunto de dados pré-treinado era relevante. Com o padrão de design de conteúdo principal, o texto de entrada é dividido em duas partes:

uma instrução (ação)
conteúdo relevante (que influencia a ação)

Aqui está um exemplo onde a instrução é "resuma isso em 2 frases".

Prompt (Entrada)	Completação (Saída)
Júpiter é o quinto planeta do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa de um milésimo da do Sol, mas duas vezes e meia a de todos os outros planetas do Sistema Solar juntos. Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno e é conhecido pelas civilizações antigas desde antes da história registrada. Ele é nomeado em homenagem ao deus romano Júpiter.[19] Quando visto da Terra, Júpiter pode ser brilhante o suficiente para que sua luz refletida projete sombras visíveis,[20] e é, em média, o terceiro objeto natural mais brilhante no céu noturno depois da Lua e Vênus. Resuma isso em 2 frases curtas	Júpiter, o quinto planeta do Sol, é o maior do Sistema Solar e conhecido por ser um dos objetos mais brilhantes no céu noturno. Nomeado em homenagem ao deus romano Júpiter, é um gigante gasoso cuja massa é duas vezes e meia a de todos os outros planetas do Sistema Solar juntos.

Prompt (Entrada)

Completação (Saída)

Júpiter é o quinto planeta do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa de um milésimo da do Sol, mas duas vezes e meia a de todos os outros planetas do Sistema Solar juntos. Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno e é conhecido pelas civilizações antigas desde antes da história registrada. Ele é nomeado em homenagem ao deus romano Júpiter.[19] Quando visto da Terra, Júpiter pode ser brilhante o suficiente para que sua luz refletida projete sombras visíveis,[20] e é, em média, o terceiro objeto natural mais brilhante no céu noturno depois da Lua e Vênus.
Resuma isso em 2 frases curtas

Júpiter, o quinto planeta do Sol, é o maior do Sistema Solar e conhecido por ser um dos objetos mais brilhantes no céu noturno. Nomeado em homenagem ao deus romano Júpiter, é um gigante gasoso cuja massa é duas vezes e meia a de todos os outros planetas do Sistema Solar juntos.

O segmento de conteúdo principal pode ser usado de várias maneiras para impulsionar instruções mais eficazes:

Exemplos - em vez de dizer ao modelo o que fazer com uma instrução explícita, forneça exemplos do que fazer e deixe-o inferir o padrão.
Dicas - siga a instrução com uma "dica" que prepara a resposta, orientando o modelo para respostas mais relevantes.
Modelos - são 'receitas' repetíveis para prompts com espaços reservados (variáveis) que podem ser personalizados com dados para casos de uso específicos.

Vamos explorar essas técnicas em ação.

Usando Exemplos

Esta é uma abordagem onde você usa o conteúdo principal para "alimentar o modelo" com alguns exemplos da saída desejada para uma determinada instrução e deixa-o inferir o padrão para a saída desejada. Com base no número de exemplos fornecidos, podemos ter prompts de zero-shot, one-shot, few-shot etc.

O prompt agora consiste em três componentes:

Uma descrição da tarefa
Alguns exemplos da saída desejada
O início de um novo exemplo (que se torna uma descrição implícita da tarefa)

Tipo de Aprendizado	Prompt (Entrada)	Completação (Saída)
Zero-shot	"O Sol está brilhando". Traduza para espanhol	"El Sol está brillando".
One-shot	"O Sol está brilhando" => ""El Sol está brillando". "É um dia frio e ventoso" =>	"Es un día frío y ventoso".
Few-shot	O jogador correu as bases => Beisebol O jogador acertou um ace => Tênis O jogador acertou um seis => Críquete O jogador fez uma enterrada =>	Basquete

Note como tivemos que fornecer uma instrução explícita ("Traduza para espanhol") no prompt de zero-shot, mas ela é inferida no exemplo de one-shot. O exemplo de few-shot mostra como adicionar mais exemplos permite que os modelos façam inferências mais precisas sem instruções adicionais.

Dicas de Prompt

Outra técnica para usar o conteúdo principal é fornecer dicas em vez de exemplos. Nesse caso, estamos dando ao modelo um empurrão na direção certa ao começar com um trecho que reflete o formato de resposta desejado. O modelo então "segue a dica" para continuar nesse formato.

Número de Dicas	Prompt (Entrada)	Completação (Saída)
0	Júpiter é o quinto planeta do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa de um milésimo da do Sol, mas duas vezes e meia a de todos os outros planetas do Sistema Solar juntos. Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno e é conhecido pelas civilizações antigas desde antes da história registrada. Resuma Isso	Júpiter é o maior planeta do Sistema Solar e o quinto do Sol. É um gigante gasoso com uma massa de 1/1000 da do Sol, mas é mais pesado que todos os outros planetas juntos. Civilizações antigas conhecem Júpiter há muito tempo, e ele é facilmente visível no céu noturno.
1	Júpiter é o quinto planeta a partir do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa equivalente a um milésimo da massa do Sol, mas duas vezes e meia maior que a massa de todos os outros planetas do Sistema Solar juntos. Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno e é conhecido pelas civilizações antigas desde antes da história registrada. Resuma Isso O que aprendemos é que Júpiter	é o quinto planeta a partir do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa equivalente a um milésimo da massa do Sol, mas duas vezes e meia maior que a massa de todos os outros planetas juntos. É facilmente visível a olho nu e conhecido desde os tempos antigos.
2	Júpiter é o quinto planeta a partir do Sol e o maior do Sistema Solar. É um gigante gasoso com uma massa equivalente a um milésimo da massa do Sol, mas duas vezes e meia maior que a massa de todos os outros planetas do Sistema Solar juntos. Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno e é conhecido pelas civilizações antigas desde antes da história registrada. Resuma Isso 3 Principais Fatos Que Aprendemos:	1. Júpiter é o quinto planeta a partir do Sol e o maior do Sistema Solar. 2. É um gigante gasoso com uma massa equivalente a um milésimo da massa do Sol... 3. Júpiter é visível a olho nu desde os tempos antigos ...

Modelos de Prompt

Um modelo de prompt é uma receita pré-definida para um prompt que pode ser armazenada e reutilizada conforme necessário, para proporcionar experiências de usuário mais consistentes em escala. Na sua forma mais simples, é apenas uma coleção de exemplos de prompt como este da OpenAI que fornece tanto os componentes interativos do prompt (mensagens do usuário e do sistema) quanto o formato de solicitação orientado por API - para suportar a reutilização.

Na sua forma mais complexa, como este exemplo da LangChain, ele contém espaços reservados que podem ser substituídos por dados de várias fontes (entrada do usuário, contexto do sistema, fontes de dados externas etc.) para gerar um prompt dinamicamente. Isso nos permite criar uma biblioteca de prompts reutilizáveis que podem ser usados para proporcionar experiências de usuário consistentes programaticamente em escala.

Por fim, o verdadeiro valor dos modelos está na capacidade de criar e publicar bibliotecas de prompts para domínios de aplicação vertical - onde o modelo de prompt agora é otimizado para refletir o contexto ou exemplos específicos da aplicação, tornando as respostas mais relevantes e precisas para o público-alvo. O repositório Prompts For Edu é um ótimo exemplo dessa abordagem, curando uma biblioteca de prompts para o domínio educacional com ênfase em objetivos-chave como planejamento de aulas, design curricular, tutoria de estudantes etc.

Conteúdo de Apoio

Se pensarmos na construção de prompts como tendo uma instrução (tarefa) e um alvo (conteúdo principal), então o conteúdo secundário é como um contexto adicional que fornecemos para influenciar a saída de alguma forma. Pode ser parâmetros de ajuste, instruções de formatação, taxonomias de tópicos etc., que podem ajudar o modelo a personalizar sua resposta para atender aos objetivos ou expectativas do usuário.

Por exemplo: Dado um catálogo de cursos com metadados extensivos (nome, descrição, nível, tags de metadados, instrutor etc.) sobre todos os cursos disponíveis no currículo:

podemos definir uma instrução para "resumir o catálogo de cursos para o outono de 2023"
podemos usar o conteúdo principal para fornecer alguns exemplos do formato desejado para a saída
podemos usar o conteúdo secundário para identificar as 5 principais "tags" de interesse.

Agora, o modelo pode fornecer um resumo no formato mostrado pelos poucos exemplos - mas, se um resultado tiver várias tags, ele pode priorizar as 5 tags identificadas no conteúdo secundário.

Melhores Práticas de Prompting

Agora que sabemos como os prompts podem ser construídos, podemos começar a pensar em como projetá-los para refletir as melhores práticas. Podemos pensar nisso em duas partes - ter a mentalidade certa e aplicar as técnicas certas.

Mentalidade de Engenharia de Prompt

A Engenharia de Prompt é um processo de tentativa e erro, então mantenha três fatores amplos em mente:

Entendimento do Domínio Importa. A precisão e relevância da resposta são uma função do domínio em que essa aplicação ou usuário opera. Use sua intuição e expertise no domínio para personalizar técnicas ainda mais. Por exemplo, defina personalidades específicas do domínio em seus prompts de sistema ou use modelos específicos do domínio em seus prompts de usuário. Forneça conteúdo secundário que reflita contextos específicos do domínio ou use pistas e exemplos específicos do domínio para guiar o modelo em padrões de uso familiares.
Entendimento do Modelo Importa. Sabemos que os modelos são estocásticos por natureza. Mas as implementações de modelos também podem variar em termos do conjunto de dados de treinamento que utilizam (conhecimento pré-treinado), das capacidades que fornecem (por exemplo, via API ou SDK) e do tipo de conteúdo para o qual são otimizados (por exemplo, código vs. imagens vs. texto). Entenda os pontos fortes e limitações do modelo que você está usando e use esse conhecimento para priorizar tarefas ou construir modelos personalizados otimizados para as capacidades do modelo.
Iteração e Validação Importam. Os modelos estão evoluindo rapidamente, assim como as técnicas de engenharia de prompt. Como especialista no domínio, você pode ter outros contextos ou critérios específicos da sua aplicação que podem não se aplicar à comunidade mais ampla. Use ferramentas e técnicas de engenharia de prompt para "dar o pontapé inicial" na construção de prompts, depois itere e valide os resultados usando sua própria intuição e expertise no domínio. Registre seus insights e crie uma base de conhecimento (por exemplo, bibliotecas de prompts) que pode ser usada como um novo ponto de partida por outros, para iterações mais rápidas no futuro.

Melhores Práticas

Agora vamos olhar para práticas recomendadas comuns que são sugeridas por OpenAI e por profissionais da Azure OpenAI.

O que	Por quê
Avalie os modelos mais recentes.	As novas gerações de modelos provavelmente terão recursos e qualidade aprimorados - mas também podem gerar custos mais altos. Avalie o impacto e tome decisões de migração.
Separe instruções e contexto	Verifique se seu modelo/provedor define delimitadores para distinguir instruções, conteúdo principal e secundário mais claramente. Isso pode ajudar os modelos a atribuir pesos mais precisos aos tokens.
Seja específico e claro	Dê mais detalhes sobre o contexto desejado, resultado, comprimento, formato, estilo etc. Isso melhorará tanto a qualidade quanto a consistência das respostas. Capture receitas em modelos reutilizáveis.
Seja descritivo, use exemplos	Os modelos podem responder melhor a uma abordagem de "mostrar e contar". Comece com uma abordagem `zero-shot`, onde você dá uma instrução (mas sem exemplos), depois tente `few-shot` como refinamento, fornecendo alguns exemplos do resultado desejado. Use analogias.
Use pistas para iniciar respostas	Direcione para um resultado desejado dando algumas palavras ou frases iniciais que podem ser usadas como ponto de partida para a resposta.
Reforce	Às vezes, você pode precisar repetir-se para o modelo. Dê instruções antes e depois do conteúdo principal, use uma instrução e uma pista, etc. Itere e valide para ver o que funciona.
A ordem importa	A ordem em que você apresenta informações ao modelo pode impactar a saída, mesmo nos exemplos de aprendizado, devido ao viés de recência. Experimente diferentes opções para ver o que funciona melhor.
Dê ao modelo uma "saída"	Dê ao modelo uma resposta de fallback que ele pode fornecer se não conseguir completar a tarefa por qualquer motivo. Isso pode reduzir as chances de o modelo gerar respostas falsas ou fabricadas.

Como em qualquer prática recomendada, lembre-se de que sua experiência pode variar dependendo do modelo, da tarefa e do domínio. Use estas práticas como ponto de partida e itere para descobrir o que funciona melhor para você. Reavalie constantemente seu processo de engenharia de prompt à medida que novos modelos e ferramentas se tornam disponíveis, com foco na escalabilidade do processo e na qualidade das respostas.

Tarefa

Parabéns! Você chegou ao final da aula! É hora de testar alguns desses conceitos e técnicas com exemplos reais!

Para nossa tarefa, usaremos um Jupyter Notebook com exercícios que você pode completar interativamente. Você também pode estender o Notebook com suas próprias células de Markdown e Código para explorar ideias e técnicas por conta própria.

Para começar, faça um fork do repositório e, em seguida:

(Recomendado) Inicie o GitHub Codespaces
(Alternativamente) Clone o repositório para seu dispositivo local e use-o com o Docker Desktop
(Alternativamente) Abra o Notebook com seu ambiente de execução de Notebook preferido.

Em seguida, configure suas variáveis de ambiente

Copie o arquivo .env.copy na raiz do repositório para .env e preencha os valores de AZURE_OPENAI_API_KEY, AZURE_OPENAI_ENDPOINT e AZURE_OPENAI_DEPLOYMENT. Volte para a seção Learning Sandbox para aprender como.

Depois, abra o Jupyter Notebook

Selecione o kernel de execução. Se estiver usando as opções 1 ou 2, basta selecionar o kernel padrão Python 3.10.x fornecido pelo contêiner de desenvolvimento.

Você está pronto para executar os exercícios. Note que não há respostas certas ou erradas aqui - apenas explorar opções por tentativa e erro e construir intuição sobre o que funciona para um determinado modelo e domínio de aplicação.

Por essa razão, não há segmentos de Solução de Código nesta aula. Em vez disso, o Notebook terá células de Markdown intituladas "Minha Solução:" que mostram um exemplo de saída para referência.

Verificação de Conhecimento

Qual das seguintes é um bom prompt seguindo algumas práticas recomendadas razoáveis?

Mostre-me uma imagem de um carro vermelho
Mostre-me uma imagem de um carro vermelho da marca Volvo e modelo XC90 estacionado perto de um penhasco com o sol se pondo
Mostre-me uma imagem de um carro vermelho da marca Volvo e modelo XC90

R: 2, é o melhor prompt, pois fornece detalhes sobre "o quê" e entra em especificidades (não apenas qualquer carro, mas uma marca e modelo específicos) e também descreve o cenário geral. 3 é o próximo melhor, pois também contém muitas descrições.

🚀 Desafio

Veja se você consegue usar a técnica de "pista" com o prompt: Complete a frase "Mostre-me uma imagem de um carro vermelho da marca Volvo e ". O que ele responde e como você melhoraria isso?

Ótimo Trabalho! Continue Aprendendo

Quer aprender mais sobre diferentes conceitos de Engenharia de Prompt? Acesse a página de aprendizado contínuo para encontrar outros ótimos recursos sobre este tópico.

Vá para a Aula 5, onde exploraremos técnicas avançadas de prompting!

Aviso Legal:
Este documento foi traduzido utilizando o serviço de tradução por IA Co-op Translator. Embora nos esforcemos para garantir a precisão, esteja ciente de que traduções automáticas podem conter erros ou imprecisões. O documento original em seu idioma nativo deve ser considerado a fonte autoritativa. Para informações críticas, recomenda-se a tradução profissional humana. Não nos responsabilizamos por quaisquer mal-entendidos ou interpretações incorretas decorrentes do uso desta tradução.

Provide feedback

Saved searches