Az átirat adat-előkészítő szkriptek letöltik a YouTube videók átiratait, és előkészítik azokat a Semantic Search with OpenAI Embeddings and Functions mintaalkalmazáshoz.
Az átirat adat-előkészítő szkripteket a legújabb Windows 11, macOS Ventura és Ubuntu 22.04 (vagy újabb) verziókon teszteltük.
Important
Javasoljuk, hogy frissítsd az Azure CLI-t a legújabb verzióra, hogy biztosítsd az OpenAI-val való kompatibilitást. Lásd a Dokumentációt
- Hozz létre egy erőforráscsoportot
Note
Ezekhez az utasításokhoz az "semantic-video-search" nevű erőforráscsoportot használjuk az East US régióban. Az erőforráscsoport nevét megváltoztathatod, de ha az erőforrások helyét módosítod, ellenőrizd a modell elérhetőségi táblázatot.
az group create --name semantic-video-search --location eastus- Hozz létre egy Azure OpenAI Service erőforrást.
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- Szerezd meg az alkalmazásban használatos végpontot és kulcsokat
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- Telepítsd a következő modelleket:
text-embedding-ada-002verzió2vagy újabb,text-embedding-ada-002névengpt-35-turboverzió0613vagy újabb,gpt-35-turbonéven
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 vagy újabb
A YouTube átirat adat-előkészítő szkriptek futtatásához a következő környezeti változók szükségesek.
Ajánlott a változókat a user környezeti változók közé felvenni.
Windows Start > A rendszer környezeti változóinak szerkesztése > Környezeti változók > Felhasználói változók [USER] > Új.
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
Ajánlott a következő exportokat hozzáadni a ~/.bashrc vagy ~/.zshrc fájlhoz.
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
Telepítsd a git klienst, ha még nincs telepítve.
-
Egy
Terminálablakból klónozd a mintát a kívánt repó mappába.git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
Navigálj a
data_prepmappába.cd semanic-search-openai-embeddings-functions/src/data_prep -
Hozz létre egy Python virtuális környezetet.
Windows rendszeren:
python -m venv .venvmacOS és Linux rendszeren:
python3 -m venv .venv
-
Aktiváld a Python virtuális környezetet.
Windows rendszeren:
.venv\Scripts\activate
macOS és Linux rendszeren:
source .venv/bin/activate -
Telepítsd a szükséges könyvtárakat.
Windows rendszeren:
pip install -r requirements.txtmacOS és Linux rendszeren:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shJogi nyilatkozat:
Ez a dokumentum az AI fordító szolgáltatás, a Co-op Translator segítségével készült. Bár a pontosságra törekszünk, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az anyanyelvén tekintendő hiteles forrásnak. Fontos információk esetén szakmai, emberi fordítást javaslunk. Nem vállalunk felelősséget a fordítás használatából eredő félreértésekért vagy téves értelmezésekért.