Создание сложных запросов

Давайте вспомним основные моменты из предыдущей главы:

Инженерия запросов — это процесс, с помощью которого мы направляем модель к более релевантным ответам, предоставляя более полезные инструкции или контекст.

Существует два этапа написания запросов: создание запроса, предоставляя релевантный контекст, и оптимизация, то есть постепенное улучшение запроса.

На данный момент у нас есть базовое понимание того, как писать запросы, но нам нужно углубиться. В этой главе вы перейдете от простого тестирования различных запросов к пониманию, почему один запрос лучше другого. Вы научитесь создавать запросы, следуя некоторым базовым техникам, которые можно применить к любой модели LLM.

Введение

В этой главе мы рассмотрим следующие темы:

Расширение знаний в области инженерии запросов, применяя различные техники к вашим запросам.
Настройка запросов для получения разнообразных результатов.

Цели обучения

После завершения этого урока вы сможете:

Применять техники инженерии запросов для улучшения результатов ваших запросов.
Выполнять запросы, которые могут быть либо разнообразными, либо детерминированными.

Инженерия запросов

Инженерия запросов — это процесс создания запросов, которые приведут к желаемому результату. Инженерия запросов — это не инженерная дисциплина, а скорее набор техник, которые можно применять для достижения желаемого результата.

Пример запроса

Рассмотрим простой запрос, например:

Составьте 10 вопросов по географии.

В этом запросе вы фактически применяете набор различных техник создания запросов.

Давайте разберем его.

Контекст: вы указываете, что речь идет о "географии".
Ограничение результата: вы хотите получить не более 10 вопросов.

Ограничения простых запросов

Вы можете получить или не получить желаемый результат. Вопросы будут сгенерированы, но география — это большая тема, и вы можете не получить то, что хотите, по следующим причинам:

Широкая тема: вы не знаете, будут ли вопросы о странах, столицах, реках и так далее.
Формат: что, если вы хотите, чтобы вопросы были оформлены определенным образом?

Как видите, при создании запросов нужно учитывать множество факторов.

До сих пор мы рассматривали простой пример запроса, но генеративный ИИ способен на гораздо большее, чтобы помочь людям в различных ролях и отраслях. Давайте рассмотрим некоторые базовые техники.

Техники создания запросов

Сначала нам нужно понять, что создание запросов — это возникающее свойство LLM, то есть это не функция, встроенная в модель, а скорее то, что мы обнаруживаем в процессе ее использования.

Существуют некоторые базовые техники, которые мы можем использовать для создания запросов в LLM. Давайте их рассмотрим.

Запрос без примеров: это самая простая форма запроса. Это один запрос, который запрашивает ответ у LLM исключительно на основе его обучающих данных.
Запрос с несколькими примерами: этот тип запроса направляет LLM, предоставляя 1 или несколько примеров, на которые он может опираться для генерации ответа.
Цепочка рассуждений: этот тип запроса учит LLM разбивать задачу на этапы.
Сгенерированные знания: чтобы улучшить ответ на запрос, вы можете дополнительно предоставить сгенерированные факты или знания.
От простого к сложному: как и цепочка рассуждений, эта техника заключается в разбиении задачи на серию этапов и выполнении этих этапов по порядку.
Самоулучшение: эта техника заключается в критике ответа LLM и последующем запросе на его улучшение.
Майевтический запрос: здесь вы хотите убедиться, что ответ LLM правильный, и просите его объяснить различные части ответа. Это форма самоулучшения.

Запрос без примеров

Этот стиль запроса очень прост, он состоит из одного запроса. Эта техника, вероятно, используется вами, когда вы только начинаете изучать LLM. Вот пример:

Запрос: "Что такое алгебра?"
Ответ: "Алгебра — это раздел математики, изучающий математические символы и правила их преобразования."

Запрос с несколькими примерами

Этот стиль запроса помогает модели, предоставляя несколько примеров вместе с запросом. Он состоит из одного запроса с дополнительными данными, специфичными для задачи. Вот пример:

Запрос: "Напишите стихотворение в стиле Шекспира. Вот несколько примеров шекспировских сонетов: Сонет 18: 'Сравню ли тебя с летним днем? Ты прекраснее и нежнее...' Сонет 116: 'Не допущу препятствий в союзе двух душ. Любовь не есть любовь, которая изменяется при изменении...' Сонет 132: 'Твои глаза я люблю, и они, как жалея меня, Зная твое сердце, мучают меня презрением,...' Теперь напишите сонет о красоте луны."
Ответ: "На небесах луна мягко сияет, В серебристом свете, что льется нежно,..."

Примеры предоставляют LLM контекст, формат или стиль желаемого результата. Они помогают модели понять конкретную задачу и генерировать более точные и релевантные ответы.

Цепочка рассуждений

Цепочка рассуждений — это очень интересная техника, так как она заключается в проведении LLM через серию этапов. Идея состоит в том, чтобы инструктировать LLM таким образом, чтобы он понял, как что-то сделать. Рассмотрим следующий пример, с использованием и без использования цепочки рассуждений:

- Запрос: "У Алисы 5 яблок, она выбросила 3 яблока, дала 2 Бобу, и Боб вернул одно. Сколько яблок осталось у Алисы?"
- Ответ: 5

LLM отвечает 5, что неверно. Правильный ответ — 1 яблоко, учитывая расчет (5 - 3 - 2 + 1 = 1).

Как мы можем научить LLM делать это правильно?

Попробуем цепочку рассуждений. Применение цепочки рассуждений означает:

Дать LLM похожий пример.
Показать расчет и как его правильно выполнить.
Предоставить оригинальный запрос.

Вот как это выглядит:

Запрос: "У Лизы 7 яблок, она выбросила 1 яблоко, дала 4 яблока Барту, и Барт вернул одно: 7 - 1 = 6 6 - 4 = 2 2 + 1 = 3
У Алисы 5 яблок, она выбросила 3 яблока, дала 2 Бобу, и Боб вернул одно. Сколько яблок осталось у Алисы?" Ответ: 1

Обратите внимание, как мы пишем значительно более длинные запросы с другим примером, расчетом и затем оригинальным запросом, и приходим к правильному ответу — 1.

Как видите, цепочка рассуждений — это очень мощная техника.

Сгенерированные знания

Во многих случаях, когда вы хотите составить запрос, вы хотите сделать это, используя данные вашей компании. Вы хотите, чтобы часть запроса была от компании, а другая часть — это фактический запрос, который вас интересует.

Например, вот как может выглядеть ваш запрос, если вы работаете в страховом бизнесе:

{{company}}: {{company_name}}
{{products}}:
{{products_list}}
Please suggest an insurance given the following budget and requirements:
Budget: {{budget}}
Requirements: {{requirements}}

Выше вы видите, как запрос составлен с использованием шаблона. В шаблоне есть несколько переменных, обозначенных как {{variable}}, которые будут заменены фактическими значениями из API компании.

Вот пример того, как запрос может выглядеть после замены переменных содержимым вашей компании:

Insurance company: ACME Insurance
Insurance products (cost per month):
- Car, cheap, 500 USD
- Car, expensive, 1100 USD
- Home, cheap, 600 USD
- Home, expensive, 1200 USD
- Life, cheap, 100 USD

Please suggest an insurance given the following budget and requirements:
Budget: $1000
Requirements: Car, Home, and Life insurance

Запуск этого запроса через LLM приведет к следующему ответу:

Given the budget and requirements, we suggest the following insurance package from ACME Insurance:
- Car, cheap, 500 USD
- Home, cheap, 600 USD
- Life, cheap, 100 USD
Total cost: $1,200 USD

Как видите, он также предлагает страхование жизни, чего не должно быть. Этот результат указывает на то, что нам нужно оптимизировать запрос, изменив его, чтобы он был более четким в том, что можно разрешить. После некоторого метода проб и ошибок мы приходим к следующему запросу:

Insurance company: ACME Insurance
Insurance products (cost per month):
- type: Car, cheap, cost: 500 USD
- type: Car, expensive, cost: 1100 USD
- type: Home, cheap, cost: 600 USD
- type: Home, expensive, cost: 1200 USD
- type: Life, cheap, cost: 100 USD

Please suggest an insurance given the following budget and requirements:
Budget: $1000 restrict choice to types: Car, Home

Обратите внимание, как добавление типа и стоимости, а также использование ключевого слова ограничить помогает LLM понять, что мы хотим.

Теперь мы получаем следующий ответ:

Given the budget and requirements, we suggest the Car, Cheap insurance product which costs 500 USD per month.

Цель этого примера была показать, что даже если мы используем базовую технику, такую как сгенерированные знания, в большинстве случаев нам все равно нужно оптимизировать запрос, чтобы получить желаемый результат.

От простого к сложному

Идея техники "от простого к сложному" заключается в разбиении большой задачи на подзадачи. Таким образом, вы помогаете направить LLM, как "покорить" большую задачу. Хорошим примером может быть задача в области анализа данных, где вы можете попросить LLM разделить проблему следующим образом:

Запрос: Как выполнить анализ данных в 5 этапов?

Ваш AI-ассистент отвечает:

Сбор данных
Очистка данных
Анализ данных
Визуализация данных
Представление данных

Самоулучшение, критика результатов

С генеративными ИИ и LLM нельзя полностью доверять результатам. Нужно их проверять. В конце концов, LLM просто представляет вам то, что наиболее вероятно сказать дальше, а не то, что является правильным. Поэтому хорошей идеей является попросить LLM критиковать себя, что приводит нас к технике самоулучшения.

Как это работает:

Первоначальный запрос, в котором LLM решает задачу.
LLM отвечает.
Вы критикуете ответ и просите AI улучшить его.
LLM отвечает снова, учитывая критику и предлагая улучшения.

Вы можете повторять этот процесс столько раз, сколько захотите.

Вот пример использования этой техники:

Запрос: "Создайте Python Web API с маршрутами для продуктов и клиентов"

Ответ AI:

import flask
app = Flask(__name__)

@app.route('/products')
def products():
    return 'Products'

@app.route('/customers')
def customers():
    return 'Customers'

Запрос: предложите 3 улучшения к приведенному выше коду

Ответ AI:

Sure, here are three suggestions to improve the code:

Import the correct module: The first line should import Flask instead of flask. The correct import statement should be from flask import Flask.

Add a main function: Add a if __name__ == '__main__': block to the end of the file to run the application when the file is executed.

Use f-strings: Use f-strings to format the return statements in the route functions. For example, return 'Products' can be changed to return f'This is the {request.path} page'.

from flask import Flask, request

app = Flask(__name__)

@app.route('/products')
def products():
    return f'This is the {request.path} page'

@app.route('/customers')
def customers():
    return f'This is the {request.path} page'

if __name__ == '__main__':
    app.run()

Как видите, приведенный выше ответ AI улучшает первый предложенный код благодаря критике первого ответа.

Майевтический запрос

Майевтический запрос — это техника, которая похожа на самоулучшение, но больше связана с просьбой LLM объяснить себя. Цель состоит в том, чтобы уменьшить несоответствия в выводах LLM, чтобы убедиться, что он приходит к правильному ответу. Рабочий процесс следующий:

Попросите LLM ответить на вопрос.
Для каждой части ответа попросите LLM объяснить ее более подробно.
Если есть несоответствия, исключите части, которые не соответствуют.

Повторяйте шаги 2 и 3, пока не проверите все части и не будете удовлетворены ответом.

Вот пример запроса:

Запрос: Как я могу создать план действий в кризисной ситуации для смягчения последствий пандемии в 5 этапов? Ответ LLM:

1. Identify the risks
1. Identify the stakeholders
1. Identify the resources
1. Identify the actions
1. Identify the communication channels

Он определил 5 этапов, но можем ли мы определить, правильно ли это? Давайте попросим LLM объяснить каждый этап:

Запрос: Объясните первый этап более подробно, какие риски связаны с пандемией?

The risks are the following:

- Loss of life
- Loss of business
- Loss of reputation
- Loss of customers
- Loss of employees

На этом этапе мы хотим убедиться, что LLM прав, поэтому просим его объяснить первый риск более подробно и надеемся, что он будет согласован с приведенным выше ответом:

Запрос: В пандемии, какой самый большой риск и почему?

The biggest risk is loss of life because it's the most important thing to protect.

Какие два самых больших риска в пандемии?

The two biggest risks are loss of life and loss of business.

На этом этапе LLM согласован и упоминает "жизнь" и "бизнес" как два самых больших риска. Теперь мы можем перейти к следующему этапу и быть достаточно уверенными. Однако мы не должны слепо доверять LLM, всегда следует проверять результат.

Вариативность вывода

LLM по своей природе недетерминированны, что означает, что вы будете получать разные результаты каждый раз, когда запускаете один и тот же запрос. Попробуйте, например, следующий запрос:

"Сгенерируйте код для Python Web API"

# Import necessary modules
import flask
from flask import request, jsonify

# Create a Flask app
app = flask.Flask(__name__)

# Create a route for the API
@app.route('/api', methods=['GET'])
def api():
    # Get the data from the request
    data = request.args

    # Process the data
    result = process_data(data)

    # Return the result as JSON
    return jsonify(result)

# Function to process the data
def process_data(data):
    # Do something with the data
    result = data + 1

    # Return the result
    return result

# Run the app
if __name__ == '__main__':
    app.run()

Запуск того же запроса снова генерирует немного другой ответ:

#import necessary packages
import flask
from flask import request, jsonify

#create the Flask application
app = flask.Flask(__name__)
app.config["DEBUG"] = True

#create a list of books
books = [
    {'id': 0,
     'title': 'A Fire Upon the Deep',
     'author': 'Vernor Vinge',
     'first_sentence': 'The coldsleep itself was dreamless.',
     'year_published': '1992'},
    {'id': 1,
     'title': 'The Ones Who Walk Away From Omelas',
     'author': 'Ursula K. Le Guin',
     'first_sentence': 'With a clamor of bells that set the swallows soaring, the Festival of Summer came to the city Omelas, bright-towered by the sea.',
     'published': '1973'},
    {'id': 2,
     'title': 'Dhalgren',
     'author': 'Samuel R. Delany',
     'first_sentence': 'to wound the autumnal city.',
     'published': '1975'}
]

#create an endpoint for the API
@app.route('/', methods=['GET'])
def home():
    return '''<h1>Books API</h1>
<p>A prototype API for retrieving books.</p>'''

#create an endpoint to return all books
@app.route('/api/v1/resources/books/all', methods=['GET'])
def api_all():
    return jsonify(books)

#create an endpoint to return a single book
@app.route('/api/v1/resources/books', methods=['GET'])
def api_id():
    #check if an ID was provided as part of the URL
    #if ID is provided, assign it to a variable
    #if no ID is provided, display an error
    if 'id' in request.args:
        id = int(request.args['id'])
    else:
        return "Error: No id field provided. Please specify an id."

    #create an empty list for our results
    results = []

    #loop through the data and match results that fit the requested ID
    #IDs are unique, but other fields might return many results
    for book in books:
        if book['id'] == id:
            results.append(book)

    #use the jsonify function from Flask to convert our list of
    #Python dictionaries to the JSON format
    return jsonify(results)

app.run()

Так является ли вариативность вывода проблемой?

Это зависит от того, что вы пытаетесь сделать. Если вы хотите получить конкретный ответ, то это проблема. Если вас устраивает вариативный вывод, например, "Сгенерируйте любые 3 вопроса по географии", то это не проблема.

Использование температуры для вариативности вывода

Итак, мы решили, что хотим ограничить вывод, чтобы он был более предсказуемым, то есть более детерминированным. Как это сделать?

Температура — это значение от 0 до 1, где 0 — наиболее детерминированное, а 1 — наиболее вариативное. Значение по умолчанию — 0.7. Давайте посмотрим, что произойдет при двух запусках одного и того же запроса с температурой, установленной на 0.1:

"Сгенерируйте код для Python Web API"

#import necessary libraries
import flask
from flask import request, jsonify

#create an instance of the Flask class
app = flask.Flask(__name__)

#create an endpoint for the API
@app.route('/api/v1/endpoint', methods=['GET'])
def api_endpoint():
    #get the request data
    data = request.get_json()

    #process the data
    result = process_data(data)

    #return the result
    return jsonify(result)

#function to process the data
def process_data(data):
    #process the data
    result = {'result': 'success'}

    #return the result
    return result

#run the Flask app
if __name__ == '__main__':
    app.run()

Запуск запроса снова дает следующий результат:

#import necessary libraries
import flask
from flask import request, jsonify

#create a Flask app
app = flask.Flask(__name__)

#create a route for the API
@app.route('/api', methods=['GET'])
def api_call():
    #get the data from the request
    data = request.get_json()

    #process the data
    result = process_data(data)

    #return the result
    return jsonify(result)

#define the process_data function
def process_data(data):
    #do something with the data
    result = data + 1

    #return the result
    return result

#run the app
if __name__ == '__main__':
    app.run()

Разница между этими двумя выводами минимальна. Теперь сделаем наоборот, установим температуру на 0.9:

# Import necessary libraries
import flask
from flask import request, jsonify

# Create a Flask app
app = flask.Flask(__name__)

# Create a route for the API
@app.route('/api', methods=['GET'])
def api_call():
    # Get the data from the request
    data = request.args

    # Process the data
    result = process_data(data)

    # Return the result
    return jsonify(result)

# Function to process the data
def process_data(data):
    # Do something with the data
    result = data + 1

    # Return the result
    return result

# Run the app
if __name__ == '__main__':
    app.run()

и второй запуск с температурой 0.9:

import flask
from flask import request, jsonify

# create the Flask app
app = flask.Flask(__name__)
app.config['DEBUG'] = True

# create some test data
books = [
    {'id': 0, 'title': 'A Fire Upon The Deep', 'author': 'Vernor Vinge', 'first_sentence': 'The coldsleep itself was dreamless.', 'year_published': '1992'},
    {'id': 1, 'title': 'The Ones Who Walk Away From Omelas', 'author': 'Ursula K. Le Guin', 'first_sentence': 'With a clamor of bells that set the swallows soaring, the Festival of Summer came to the city Omelas, bright-towered by the sea.', 'published': '1973'},
    {'id': 2, 'title': 'Dhalgren', 'author': 'Samuel R. Delany', 'first_sentence': 'to wound the autumnal city.', 'published': '1975'}
]

# create an endpoint
@app.route('/', methods=['GET'])
def home():
    return '''<h1>Welcome to our book API!</h1>'''

@app.route('/api/v1/resources/books

Как вы видите, результаты не могли быть более разнообразными.

Обратите внимание, что есть больше параметров, которые можно изменить для разнообразия вывода, таких как top-k, top-p, штраф за повторение, штраф за длину и штраф за разнообразие, но они выходят за рамки данного курса.

Хорошие практики

Существует множество подходов, которые можно использовать, чтобы добиться желаемого результата. Вы найдете свой собственный стиль, чем больше будете использовать подсказки.

Помимо рассмотренных нами техник, есть несколько хороших практик, которые стоит учитывать при работе с LLM.

Вот некоторые из них:

Уточняйте контекст. Контекст имеет значение, чем больше вы можете уточнить, например, область, тему и т.д., тем лучше.
Ограничивайте вывод. Если вам нужно определенное количество элементов или определенная длина, укажите это.
Уточняйте, что и как. Не забывайте упоминать как то, что вы хотите, так и то, как вы хотите это получить, например: "Создайте Python Web API с маршрутами для продуктов и клиентов, разделите его на 3 файла".
Используйте шаблоны. Часто вам нужно будет обогатить свои подсказки данными вашей компании. Используйте шаблоны для этого. Шаблоны могут содержать переменные, которые вы заменяете реальными данными.
Пишите грамотно. LLM может предоставить вам правильный ответ, но если вы пишете грамотно, вы получите более качественный ответ.

Задание

Вот код на Python, показывающий, как создать простой API с использованием Flask:

from flask import Flask, request

app = Flask(__name__)

@app.route('/')
def hello():
    name = request.args.get('name', 'World')
    return f'Hello, {name}!'

if __name__ == '__main__':
    app.run()

Используйте AI-ассистента, такого как GitHub Copilot или ChatGPT, и примените технику "самоулучшения" для улучшения кода.

Решение

Попробуйте выполнить задание, добавив подходящие подсказки к коду.

Tip

Сформулируйте подсказку, чтобы попросить улучшить код, и ограничьте количество улучшений. Вы также можете попросить улучшить его определенным образом, например, с точки зрения архитектуры, производительности, безопасности и т.д.

Решение

Проверка знаний

Почему я бы использовал подсказки с цепочкой рассуждений? Покажите 1 правильный ответ и 2 неправильных.

Чтобы научить LLM решать задачу.
B, Чтобы научить LLM находить ошибки в коде.
C, Чтобы инструктировать LLM придумывать разные решения.

A: 1, потому что подсказки с цепочкой рассуждений помогают показать LLM, как решать задачу, предоставляя серию шагов, аналогичные задачи и способы их решения.

🚀 Вызов

Вы только что использовали технику самоулучшения в задании. Возьмите любую программу, которую вы создали, и подумайте, какие улучшения вы хотели бы внести. Теперь используйте технику самоулучшения, чтобы применить предложенные изменения. Как вы оцениваете результат, стал ли он лучше или хуже?

Отличная работа! Продолжайте обучение

После завершения этого урока ознакомьтесь с нашей коллекцией обучения генеративному ИИ, чтобы продолжить углублять свои знания о генеративном ИИ!

Перейдите к уроку 6, где мы применим наши знания о инженерии подсказок, создавая приложения для генерации текста.

Отказ от ответственности:
Этот документ был переведен с использованием сервиса автоматического перевода Co-op Translator. Хотя мы стремимся к точности, пожалуйста, учитывайте, что автоматические переводы могут содержать ошибки или неточности. Оригинальный документ на его родном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется профессиональный перевод человеком. Мы не несем ответственности за любые недоразумения или неправильные интерпретации, возникающие в результате использования данного перевода.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Создание сложных запросов

Введение

Цели обучения

Инженерия запросов

Пример запроса

Ограничения простых запросов

Техники создания запросов

Запрос без примеров

Запрос с несколькими примерами

Цепочка рассуждений

Сгенерированные знания

От простого к сложному

Самоулучшение, критика результатов

Майевтический запрос

Вариативность вывода

Использование температуры для вариативности вывода

Хорошие практики

Задание

Решение

Проверка знаний

🚀 Вызов

Отличная работа! Продолжайте обучение

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Создание сложных запросов

Введение

Цели обучения

Инженерия запросов

Пример запроса

Ограничения простых запросов

Техники создания запросов

Запрос без примеров

Запрос с несколькими примерами

Цепочка рассуждений

Сгенерированные знания

От простого к сложному

Самоулучшение, критика результатов

Майевтический запрос

Вариативность вывода

Использование температуры для вариативности вывода

Хорошие практики

Задание

Решение

Проверка знаний

🚀 Вызов

Отличная работа! Продолжайте обучение