Τα σενάρια προετοιμασίας δεδομένων μεταγραφής κατεβάζουν απομαγνητοφωνήσεις βίντεο από το YouTube και τα προετοιμάζουν για χρήση με το παράδειγμα Semantic Search με OpenAI Embeddings και Functions.
Τα σενάρια προετοιμασίας δεδομένων μεταγραφής έχουν δοκιμαστεί στις πιο πρόσφατες εκδόσεις Windows 11, macOS Ventura και Ubuntu 22.04 (και νεότερες).
Important
Σας προτείνουμε να ενημερώσετε το Azure CLI στην πιο πρόσφατη έκδοση για να διασφαλίσετε τη συμβατότητα με το OpenAI Δείτε Documentation
- Δημιουργήστε μια ομάδα πόρων
Note
Για αυτές τις οδηγίες χρησιμοποιούμε την ομάδα πόρων με όνομα "semantic-video-search" στην περιοχή East US. Μπορείτε να αλλάξετε το όνομα της ομάδας πόρων, αλλά αν αλλάξετε την τοποθεσία των πόρων, ελέγξτε τον πίνακα διαθεσιμότητας μοντέλων.
az group create --name semantic-video-search --location eastus- Δημιουργήστε έναν πόρο Azure OpenAI Service.
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- Πάρτε το endpoint και τα κλειδιά για χρήση σε αυτήν την εφαρμογή
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- Αναπτύξτε τα παρακάτω μοντέλα:
text-embedding-ada-002έκδοση2ή νεότερη, με όνομαtext-embedding-ada-002gpt-35-turboέκδοση0613ή νεότερη, με όνομαgpt-35-turbo
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 ή νεότερη
Οι παρακάτω μεταβλητές περιβάλλοντος απαιτούνται για την εκτέλεση των σεναρίων προετοιμασίας δεδομένων μεταγραφής YouTube.
Συνιστάται να προσθέσετε τις μεταβλητές στα περιβάλλοντα μεταβλητών user.
Έναρξη των Windows > Επεξεργασία μεταβλητών συστήματος > Μεταβλητές περιβάλλοντος > Μεταβλητές χρήστη για [USER] > Νέο.
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
Συνιστάται να προσθέσετε τις παρακάτω εντολές εξαγωγής στο αρχείο ~/.bashrc ή ~/.zshrc.
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
Εγκαταστήστε τον git client αν δεν είναι ήδη εγκατεστημένος.
-
Από ένα παράθυρο
Terminal, κλωνοποιήστε το παράδειγμα στον προτιμώμενο φάκελο αποθετηρίου.git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
Μεταβείτε στον φάκελο
data_prep.cd semanic-search-openai-embeddings-functions/src/data_prep -
Δημιουργήστε ένα εικονικό περιβάλλον Python.
Σε Windows:
python -m venv .venvΣε macOS και Linux:
python3 -m venv .venv
-
Ενεργοποιήστε το εικονικό περιβάλλον Python.
Σε Windows:
.venv\Scripts\activate
Σε macOS και Linux:
source .venv/bin/activate -
Εγκαταστήστε τις απαιτούμενες βιβλιοθήκες.
Σε Windows:
pip install -r requirements.txtΣε macOS και Linux:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shΑποποίηση ευθυνών:
Αυτό το έγγραφο έχει μεταφραστεί χρησιμοποιώντας την υπηρεσία αυτόματης μετάφρασης AI Co-op Translator. Παρόλο που επιδιώκουμε την ακρίβεια, παρακαλούμε να έχετε υπόψη ότι οι αυτόματες μεταφράσεις ενδέχεται να περιέχουν λάθη ή ανακρίβειες. Το πρωτότυπο έγγραφο στη γλώσσα του θεωρείται η αυθεντική πηγή. Για κρίσιμες πληροφορίες, συνιστάται επαγγελματική ανθρώπινη μετάφραση. Δεν φέρουμε ευθύνη για τυχόν παρεξηγήσεις ή λανθασμένες ερμηνείες που προκύπτουν από τη χρήση αυτής της μετάφρασης.