Puheentunnistusdatan valmisteluskriptit lataavat YouTube-videoiden tekstitykset ja valmistelevat ne käytettäväksi Semantic Search with OpenAI Embeddings and Functions -esimerkin kanssa.
Puheentunnistusdatan valmisteluskriptit on testattu uusimmilla Windows 11, macOS Ventura ja Ubuntu 22.04 (ja uudemmat) julkaisuilla.
Important
Suosittelemme päivittämään Azure CLI:n uusimpaan versioon varmistaaksesi yhteensopivuuden OpenAI:n kanssa Katso dokumentaatio
- Luo resurssiryhmä
Note
Näissä ohjeissa käytämme resurssiryhmää nimeltä "semantic-video-search" Itäisessä Yhdysvalloissa. Voit muuttaa resurssiryhmän nimeä, mutta kun muutat resurssien sijaintia, tarkista mallien saatavuustaulukko.
az group create --name semantic-video-search --location eastus- Luo Azure OpenAI Service -resurssi.
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- Hanki päätepiste ja avaimet tämän sovelluksen käyttöön
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- Ota käyttöön seuraavat mallit:
text-embedding-ada-002version2or greater, namedtext-embedding-ada-002gpt-35-turboversion0613or greater, namedgpt-35-turbo
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 tai uudempi
Seuraavat ympäristömuuttujat ovat tarpeen YouTube-puheentunnistusdatan valmisteluskriptien suorittamiseen.
Suosittelemme lisäämään muuttujat käyttäjäkohtaisiin user environment variables.
Windows Start > Edit the system environment variables > Environment Variables > User variables for [USER] > New.
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
Suosittelemme lisäämään seuraavat vientikomentorivit tiedostoon ~/.bashrc or ~/.zshrc.
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
Asenna git-asiakasohjelma, jos se ei ole jo asennettuna.
-
Avaa
Terminal-ikkuna ja kloonaa esimerkki haluamaasi repo-kansioon.git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
Siirry
data_prep-kansioon.cd semanic-search-openai-embeddings-functions/src/data_prep -
Luo Python-virtuaaliympäristö.
Windowsissa:
python -m venv .venvmacOS:ssa ja Linuxissa:
python3 -m venv .venv
-
Aktivoi Python-virtuaaliympäristö.
Windowsissa:
.venv\Scripts\activate
macOS:ssa ja Linuxissa:
source .venv/bin/activate -
Asenna tarvittavat kirjastot.
Windowsissa:
pip install -r requirements.txtmacOS:ssa ja Linuxissa:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shVastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä AI-käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomaa, että automaattiset käännökset saattavat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa mahdollisista väärinkäsityksistä tai virheellisistä tulkinnoista, jotka johtuvat tämän käännöksen käytöstä.