Skip to content

Latest commit

 

History

History
168 lines (117 loc) · 5.21 KB

File metadata and controls

168 lines (117 loc) · 5.21 KB

Priprava podatkov za prepis

Skripte za pripravo podatkov za prepis prenašajo prepise videoposnetkov z YouTuba in jih pripravijo za uporabo s primerom Semantičnega iskanja z OpenAI vdelavami in funkcijami.

Skripte za pripravo podatkov za prepis so bile preizkušene na najnovejših različicah Windows 11, macOS Ventura in Ubuntu 22.04 (in novejših).

Ustvarjanje potrebnih virov Azure OpenAI Service

Important

Priporočamo, da posodobite Azure CLI na najnovejšo različico, da zagotovite združljivost z OpenAI Oglejte si Dokumentacijo

  1. Ustvarite skupino virov

Note

Za ta navodila uporabljamo skupino virov z imenom "semantic-video-search" v regiji East US. Ime skupine virov lahko spremenite, vendar ob spremembi lokacije virov preverite tabelo razpoložljivosti modelov.

az group create --name semantic-video-search --location eastus
  1. Ustvarite vir Azure OpenAI Service.
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
    --location eastus --kind OpenAI --sku s0
  1. Pridobite končno točko in ključe za uporabo v tej aplikaciji
az cognitiveservices account show --name semantic-video-openai \
   --resource-group  semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
   --resource-group semantic-video-search | jq -r .key1
  1. Namestite naslednje modele:
    • text-embedding-ada-002 različica 2 ali novejša, z imenom text-embedding-ada-002
    • gpt-35-turbo različica 0613 ali novejša, z imenom gpt-35-turbo
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name text-embedding-ada-002 \
    --model-name text-embedding-ada-002 \
    --model-version "2"  \
    --model-format OpenAI \
    --scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name gpt-35-turbo \
    --model-name gpt-35-turbo \
    --model-version "0613"  \
    --model-format OpenAI \
    --sku-capacity 100 \
    --sku-name "Standard"

Potrebna programska oprema

Okoljske spremenljivke

Za zagon skript za pripravo podatkov za prepis z YouTuba so potrebne naslednje okoljske spremenljivke.

Na Windows

Priporočamo, da spremenljivke dodate v svoje uporabniške okoljske spremenljivke. Windows Start > Uredi sistemske okoljske spremenljivke > Okoljske spremenljivke > Uporabniške spremenljivke za [USER] > Novo.

AZURE_OPENAI_API_KEY  \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>

Na Linux in macOS

Priporočamo, da naslednje izvoze dodate v svojo datoteko ~/.bashrc ali ~/.zshrc.

export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>

Namestitev potrebnih Python knjižnic

  1. Namestite git odjemalca, če še ni nameščen.

  2. V oknu Terminal klonirajte primer v svojo želeno mapo repozitorija.

    git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
  3. Pomaknite se v mapo data_prep.

    cd semanic-search-openai-embeddings-functions/src/data_prep
  4. Ustvarite Python virtualno okolje.

    Na Windows:

    python -m venv .venv

    Na macOS in Linux:

    python3 -m venv .venv
  5. Aktivirajte Python virtualno okolje.

    Na Windows:

    .venv\Scripts\activate

    Na macOS in Linux:

    source .venv/bin/activate
  6. Namestite potrebne knjižnice.

    Na Windows:

    pip install -r requirements.txt

    Na macOS in Linux:

    pip3 install -r requirements.txt

Zagon skript za pripravo podatkov za prepis z YouTuba

Na Windows

.\transcripts_prepare.ps1

Na macOS in Linux

./transcripts_prepare.sh

Omejitev odgovornosti:
Ta dokument je bil preveden z uporabo storitve za avtomatski prevod AI Co-op Translator. Čeprav si prizadevamo za natančnost, vas opozarjamo, da lahko avtomatski prevodi vsebujejo napake ali netočnosti. Izvirni dokument v njegovem izvirnem jeziku velja za avtoritativni vir. Za ključne informacije priporočamo strokovni človeški prevod. Za morebitna nesporazume ali napačne interpretacije, ki izhajajo iz uporabe tega prevoda, ne odgovarjamo.