ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس یوٹیوب ویڈیو کے ٹرانسکرپٹس ڈاؤن لوڈ کرتے ہیں اور انہیں Semantic Search with OpenAI Embeddings and Functions کے نمونے کے ساتھ استعمال کے لیے تیار کرتے ہیں۔
ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس کو تازہ ترین ریلیزز Windows 11، macOS Ventura اور Ubuntu 22.04 (اور اس سے اوپر) پر آزمایا گیا ہے۔
Important
ہم تجویز کرتے ہیں کہ آپ Azure CLI کو تازہ ترین ورژن میں اپ ڈیٹ کریں تاکہ OpenAI کے ساتھ مطابقت یقینی بنائی جا سکے دیکھیں Documentation
- ایک resource group بنائیں
Note
ان ہدایات کے لیے ہم "semantic-video-search" نامی resource group استعمال کر رہے ہیں جو East US میں ہے۔ آپ resource group کا نام تبدیل کر سکتے ہیں، لیکن جب وسائل کی جگہ تبدیل کریں، تو model availability table چیک کریں۔
az group create --name semantic-video-search --location eastus- ایک Azure OpenAI Service resource بنائیں۔
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- اس ایپلیکیشن میں استعمال کے لیے endpoint اور keys حاصل کریں
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- درج ذیل ماڈلز کو تعینات کریں:
text-embedding-ada-002ورژن2یا اس سے زیادہ، جس کا نامtext-embedding-ada-002ہوgpt-35-turboورژن0613یا اس سے زیادہ، جس کا نامgpt-35-turboہو
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 یا اس سے زیادہ
یوٹیوب ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس چلانے کے لیے درج ذیل ماحول کے متغیرات ضروری ہیں۔
تجویز ہے کہ آپ متغیرات کو اپنے user ماحول کے متغیرات میں شامل کریں۔
Windows Start > Edit the system environment variables > Environment Variables > [USER] کے لیے User variables > New۔
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
تجویز ہے کہ درج ذیل exports کو اپنے ~/.bashrc یا ~/.zshrc فائل میں شامل کریں۔
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
اگر پہلے سے انسٹال نہیں ہے تو git client انسٹال کریں۔
-
Terminalونڈو سے، نمونہ کو اپنی پسندیدہ repo فولڈر میں clone کریں۔git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
data_prepفولڈر میں جائیں۔cd semanic-search-openai-embeddings-functions/src/data_prep -
Python کا virtual environment بنائیں۔
ونڈوز پر:
python -m venv .venvمیک او ایس اور لینکس پر:
python3 -m venv .venv
-
Python virtual environment کو فعال کریں۔
ونڈوز پر:
.venv\Scripts\activate
میک او ایس اور لینکس پر:
source .venv/bin/activate -
مطلوبہ لائبریریاں انسٹال کریں۔
ونڈوز پر:
pip install -r requirements.txtمیک او ایس اور لینکس پر:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shدستخطی نوٹ:
یہ دستاویز AI ترجمہ سروس Co-op Translator کے ذریعے ترجمہ کی گئی ہے۔ اگرچہ ہم درستگی کے لیے کوشاں ہیں، براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستیاں ہو سکتی ہیں۔ اصل دستاویز اپنی مادری زبان میں ہی معتبر ماخذ سمجھی جانی چاہیے۔ اہم معلومات کے لیے پیشہ ور انسانی ترجمہ کی سفارش کی جاتی ہے۔ اس ترجمے کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کی ذمہ داری ہم پر عائد نہیں ہوتی۔