Skripte za pripravo podatkov za prepis prenašajo prepise videoposnetkov z YouTuba in jih pripravijo za uporabo s primerom Semantičnega iskanja z OpenAI vdelavami in funkcijami.
Skripte za pripravo podatkov za prepis so bile preizkušene na najnovejših različicah Windows 11, macOS Ventura in Ubuntu 22.04 (in novejših).
Important
Priporočamo, da posodobite Azure CLI na najnovejšo različico, da zagotovite združljivost z OpenAI Oglejte si Dokumentacijo
- Ustvarite skupino virov
Note
Za ta navodila uporabljamo skupino virov z imenom "semantic-video-search" v regiji East US. Ime skupine virov lahko spremenite, vendar ob spremembi lokacije virov preverite tabelo razpoložljivosti modelov.
az group create --name semantic-video-search --location eastus- Ustvarite vir Azure OpenAI Service.
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- Pridobite končno točko in ključe za uporabo v tej aplikaciji
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- Namestite naslednje modele:
text-embedding-ada-002različica2ali novejša, z imenomtext-embedding-ada-002gpt-35-turborazličica0613ali novejša, z imenomgpt-35-turbo
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 ali novejši
Za zagon skript za pripravo podatkov za prepis z YouTuba so potrebne naslednje okoljske spremenljivke.
Priporočamo, da spremenljivke dodate v svoje uporabniške okoljske spremenljivke.
Windows Start > Uredi sistemske okoljske spremenljivke > Okoljske spremenljivke > Uporabniške spremenljivke za [USER] > Novo.
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
Priporočamo, da naslednje izvoze dodate v svojo datoteko ~/.bashrc ali ~/.zshrc.
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
Namestite git odjemalca, če še ni nameščen.
-
V oknu
Terminalklonirajte primer v svojo želeno mapo repozitorija.git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
Pomaknite se v mapo
data_prep.cd semanic-search-openai-embeddings-functions/src/data_prep -
Ustvarite Python virtualno okolje.
Na Windows:
python -m venv .venvNa macOS in Linux:
python3 -m venv .venv
-
Aktivirajte Python virtualno okolje.
Na Windows:
.venv\Scripts\activate
Na macOS in Linux:
source .venv/bin/activate -
Namestite potrebne knjižnice.
Na Windows:
pip install -r requirements.txtNa macOS in Linux:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shOmejitev odgovornosti:
Ta dokument je bil preveden z uporabo storitve za avtomatski prevod AI Co-op Translator. Čeprav si prizadevamo za natančnost, vas opozarjamo, da lahko avtomatski prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku velja za avtoritativni vir. Za ključne informacije priporočamo strokovni človeški prevod. Za morebitna nesporazume ali napačne interpretacije, ki izhajajo iz uporabe tega prevoda, ne odgovarjamo.