Úkoly mohou být také nastaveny tak, aby pracovaly s jedním nebo více nasazeními velkých jazykových modelů (LLM) prostřednictvím podporovaného poskytovatele služeb, jako jsou OpenAI, Azure nebo Hugging Face. Tyto poskytují hostovaný endpoint (API), ke kterému můžeme programově přistupovat s příslušnými přihlašovacími údaji (API klíč nebo token). V tomto kurzu diskutujeme tyto poskytovatele:
- OpenAI s různými modely včetně základní série GPT.
- Azure OpenAI pro modely OpenAI s důrazem na připravenost pro podnikové použití
- Hugging Face pro open-source modely a inference server
Pro tyto cvičení budete potřebovat vlastní účty. Úkoly jsou nepovinné, takže si můžete vybrat nastavení jednoho, všech nebo žádného z poskytovatelů podle svých zájmů. Několik rad pro registraci:
| Registrace | Cena | API klíč | Playground | Komentáře |
|---|---|---|---|---|
| OpenAI | Ceník | Projektově založené | Bez kódu, web | Více dostupných modelů |
| Azure | Ceník | Rychlý start SDK | Rychlý start Studio | Přístup je nutné předem požádat |
| Hugging Face | Ceník | Přístupové tokeny | Hugging Chat | Hugging Chat má omezené modely |
Postupujte podle níže uvedených pokynů pro konfiguraci tohoto repozitáře pro použití s různými poskytovateli. Úkoly, které vyžadují konkrétního poskytovatele, budou mít v názvu souboru jednu z těchto značek:
aoai- vyžaduje Azure OpenAI endpoint, klíčoai- vyžaduje OpenAI endpoint, klíčhf- vyžaduje Hugging Face token
Můžete nakonfigurovat jednoho, žádného nebo všechny poskytovatele. Příslušné úkoly jednoduše skončí chybou při chybějících přihlašovacích údajích.
Předpokládáme, že jste již přečetli výše uvedené pokyny, zaregistrovali se u příslušného poskytovatele a získali požadované autentizační údaje (API_KEY nebo token). V případě Azure OpenAI předpokládáme, že máte také platné nasazení služby Azure OpenAI (endpoint) s alespoň jedním GPT modelem nasazeným pro chat completion.
Dalším krokem je nastavení vašich lokálních proměnných prostředí následovně:
-
Podívejte se v kořenové složce na soubor
.env.copy, který by měl obsahovat něco takového:# Poskytovatel OpenAI OPENAI_API_KEY='<add your OpenAI API key here>' ## Azure OpenAI AZURE_OPENAI_API_VERSION='2024-02-01' # Výchozí je nastaven! AZURE_OPENAI_API_KEY='<add your AOAI key here>' AZURE_OPENAI_ENDPOINT='<add your AOIA service endpoint here>' AZURE_OPENAI_DEPLOYMENT='<add your chat completion model name here>' AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT='<add your embeddings model name here>' ## Hugging Face HUGGING_FACE_API_KEY='<add your HuggingFace API or token here>'
-
Zkopírujte tento soubor do
.envpomocí níže uvedeného příkazu. Tento soubor je gitignore-ován, aby byly tajné údaje v bezpečí.cp .env.copy .env
-
Vyplňte hodnoty (nahraďte zástupné symboly napravo od
=) podle popisu v další sekci. -
(Volitelné) Pokud používáte GitHub Codespaces, máte možnost uložit proměnné prostředí jako Codespaces secrets spojené s tímto repozitářem. V takovém případě nebudete muset nastavovat lokální soubor .env. Poznámka: tato možnost funguje pouze pokud používáte GitHub Codespaces. Pokud používáte Docker Desktop, stále budete muset nastavit soubor .env.
Podívejme se rychle na názvy proměnných, abychom pochopili, co představují:
| Proměnná | Popis |
|---|---|
| HUGGING_FACE_API_KEY | Toto je uživatelský přístupový token, který nastavíte ve svém profilu |
| OPENAI_API_KEY | Toto je autorizační klíč pro použití služby mimo Azure OpenAI endpointy |
| AZURE_OPENAI_API_KEY | Toto je autorizační klíč pro použití této služby |
| AZURE_OPENAI_ENDPOINT | Toto je nasazený endpoint pro zdroj Azure OpenAI |
| AZURE_OPENAI_DEPLOYMENT | Toto je endpoint nasazení modelu pro generování textu |
| AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT | Toto je endpoint nasazení modelu pro textové embeddingy |
Poznámka: Poslední dvě proměnné Azure OpenAI odrážejí výchozí model pro chat completion (generování textu) a vyhledávání vektorů (embeddingy). Pokyny k jejich nastavení budou definovány v příslušných úkolech.
Hodnoty endpointu a klíče Azure OpenAI najdete v Azure Portálu, začněme tedy tam.
- Přejděte na Azure Portal
- Klikněte na možnost Keys and Endpoint v postranním panelu (menu vlevo).
- Klikněte na Show Keys - měli byste vidět následující: KEY 1, KEY 2 a Endpoint.
- Použijte hodnotu KEY 1 pro AZURE_OPENAI_API_KEY
- Použijte hodnotu Endpoint pro AZURE_OPENAI_ENDPOINT
Dále potřebujeme endpointy pro konkrétní nasazené modely.
- Klikněte na možnost Model deployments v postranním panelu (levé menu) pro zdroj Azure OpenAI.
- Na cílové stránce klikněte na Manage Deployments
Tím se dostanete na web Azure OpenAI Studio, kde najdeme další hodnoty, jak je popsáno níže.
- Přejděte na Azure OpenAI Studio ze svého zdroje, jak je popsáno výše.
- Klikněte na záložku Deployments (postranní panel, vlevo) pro zobrazení aktuálně nasazených modelů.
- Pokud váš požadovaný model není nasazen, použijte Create new deployment k jeho nasazení.
- Budete potřebovat model pro generování textu - doporučujeme: gpt-35-turbo
- Budete potřebovat model pro textové embeddingy - doporučujeme text-embedding-ada-002
Nyní aktualizujte proměnné prostředí tak, aby odrážely použité Deployment name. Obvykle to bude stejné jako název modelu, pokud jste jej explicitně nezměnili. Například můžete mít:
AZURE_OPENAI_DEPLOYMENT='gpt-35-turbo'
AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT='text-embedding-ada-002'Nezapomeňte soubor .env po úpravě uložit. Nyní můžete soubor zavřít a vrátit se k pokynům pro spuštění notebooku.
Váš OpenAI API klíč najdete ve svém OpenAI účtu. Pokud jej nemáte, můžete si vytvořit účet a vytvořit API klíč. Jakmile klíč máte, můžete jej použít k vyplnění proměnné OPENAI_API_KEY v souboru .env.
Váš Hugging Face token najdete ve svém profilu pod Access Tokens. Nezveřejňujte je ani nesdílejte veřejně. Místo toho si vytvořte nový token pro použití v tomto projektu a zkopírujte jej do souboru .env pod proměnnou HUGGING_FACE_API_KEY. Poznámka: Technicky to není API klíč, ale používá se pro autentizaci, proto zachováváme toto pojmenování pro konzistenci.
Prohlášení o vyloučení odpovědnosti:
Tento dokument byl přeložen pomocí AI překladatelské služby Co-op Translator. Přestože usilujeme o přesnost, mějte prosím na paměti, že automatické překlady mohou obsahovat chyby nebo nepřesnosti. Původní dokument v jeho mateřském jazyce by měl být považován za autoritativní zdroj. Pro důležité informace se doporučuje profesionální lidský překlad. Nejsme odpovědní za jakékoliv nedorozumění nebo nesprávné výklady vyplývající z použití tohoto překladu.