ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس یوٹیوب ویڈیو ٹرانسکرپٹس کو ڈاؤنلوڈ کرتے ہیں اور انہیں سیمینٹک سرچ کے ساتھ اوپن اے آئی ایمبیڈنگز اور فنکشنز کے نمونے کے استعمال کے لیے تیار کرتے ہیں۔
ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس کو ونڈوز 11، میک او ایس وینٹورا اور اوبنٹو 22.04 (اور اس سے اوپر) کے تازہ ترین ریلیز پر آزمایا گیا ہے۔
Important
ہم تجویز کرتے ہیں کہ آپ Azure CLI کو تازہ ترین ورژن پر اپ ڈیٹ کریں تاکہ OpenAI کے ساتھ مطابقت کو یقینی بنایا جا سکے۔ دستاویزات دیکھیں۔
- ایک وسائل گروپ بنائیں
Note
ان ہدایات کے لیے ہم مشرقی امریکہ میں "semantic-video-search" نامی وسائل گروپ استعمال کر رہے ہیں۔ آپ وسائل گروپ کا نام تبدیل کر سکتے ہیں، لیکن جب وسائل کے لیے مقام تبدیل کر رہے ہوں، تو ماڈل کی دستیابی کی جدول چیک کریں۔
az group create --name semantic-video-search --location eastus- ایک Azure OpenAI سروس وسائل بنائیں۔
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- اس ایپلیکیشن میں استعمال کے لیے اینڈ پوائنٹ اور چابیاں حاصل کریں
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- درج ذیل ماڈلز کو ڈیپلوئے کریں:
text-embedding-ada-002version2or greater, namedtext-embedding-ada-002gpt-35-turboversion0613or greater, namedgpt-35-turbo
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 یا اس سے زیادہ
یوٹیوب ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس کو چلانے کے لیے درج ذیل ماحول کے متغیرات کی ضرورت ہے۔
متغیرات کو اپنے user environment variables.
Windows Start > Edit the system environment variables > Environment Variables > User variables for [USER] > New میں شامل کرنے کی سفارش کریں۔
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
آپ کے ~/.bashrc or ~/.zshrc فائل میں درج ذیل ایکسپورٹس شامل کرنے کی سفارش کریں۔
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
اگر یہ پہلے سے انسٹال نہیں ہے تو git client انسٹال کریں۔
-
Terminalونڈو سے، نمونہ کو اپنے پسندیدہ ریپو فولڈر میں کلون کریں۔git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
data_prepفولڈر پر جائیں۔cd semanic-search-openai-embeddings-functions/src/data_prep -
ایک Python ورچوئل ماحول بنائیں۔
ونڈوز پر:
python -m venv .venvمیک او ایس اور لینکس پر:
python3 -m venv .venv
-
Python ورچوئل ماحول کو فعال کریں۔
ونڈوز پر:
.venv\Scripts\activate
میک او ایس اور لینکس پر:
source .venv/bin/activate -
مطلوبہ لائبریریاں انسٹال کریں۔
ونڈوز پر:
pip install -r requirements.txtمیک او ایس اور لینکس پر:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shدستبرداری:
یہ دستاویز AI ترجمہ سروس Co-op Translator کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی مقامی زبان میں معتبر ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ورانہ انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمہ کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔