Skip to content

Latest commit

 

History

History
176 lines (127 loc) · 7.02 KB

File metadata and controls

176 lines (127 loc) · 7.02 KB

ٹرانسکرپشن ڈیٹا کی تیاری

ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس یوٹیوب ویڈیو ٹرانسکرپٹس کو ڈاؤنلوڈ کرتے ہیں اور انہیں سیمینٹک سرچ کے ساتھ اوپن اے آئی ایمبیڈنگز اور فنکشنز کے نمونے کے استعمال کے لیے تیار کرتے ہیں۔

ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس کو ونڈوز 11، میک او ایس وینٹورا اور اوبنٹو 22.04 (اور اس سے اوپر) کے تازہ ترین ریلیز پر آزمایا گیا ہے۔

مطلوبہ Azure OpenAI سروس وسائل بنائیں

Important

ہم تجویز کرتے ہیں کہ آپ Azure CLI کو تازہ ترین ورژن پر اپ ڈیٹ کریں تاکہ OpenAI کے ساتھ مطابقت کو یقینی بنایا جا سکے۔ دستاویزات دیکھیں۔

  1. ایک وسائل گروپ بنائیں

Note

ان ہدایات کے لیے ہم مشرقی امریکہ میں "semantic-video-search" نامی وسائل گروپ استعمال کر رہے ہیں۔ آپ وسائل گروپ کا نام تبدیل کر سکتے ہیں، لیکن جب وسائل کے لیے مقام تبدیل کر رہے ہوں، تو ماڈل کی دستیابی کی جدول چیک کریں۔

az group create --name semantic-video-search --location eastus
  1. ایک Azure OpenAI سروس وسائل بنائیں۔
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
    --location eastus --kind OpenAI --sku s0
  1. اس ایپلیکیشن میں استعمال کے لیے اینڈ پوائنٹ اور چابیاں حاصل کریں
az cognitiveservices account show --name semantic-video-openai \
   --resource-group  semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
   --resource-group semantic-video-search | jq -r .key1
  1. درج ذیل ماڈلز کو ڈیپلوئے کریں:
    • text-embedding-ada-002 version 2 or greater, named text-embedding-ada-002
    • gpt-35-turbo version 0613 or greater, named gpt-35-turbo
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name text-embedding-ada-002 \
    --model-name text-embedding-ada-002 \
    --model-version "2"  \
    --model-format OpenAI \
    --scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name gpt-35-turbo \
    --model-name gpt-35-turbo \
    --model-version "0613"  \
    --model-format OpenAI \
    --sku-capacity 100 \
    --sku-name "Standard"

مطلوبہ سافٹ ویئر

ماحول کے متغیرات

یوٹیوب ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس کو چلانے کے لیے درج ذیل ماحول کے متغیرات کی ضرورت ہے۔

ونڈوز پر

متغیرات کو اپنے user environment variables. Windows Start > Edit the system environment variables > Environment Variables > User variables for [USER] > New میں شامل کرنے کی سفارش کریں۔

AZURE_OPENAI_API_KEY  \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>

لینکس اور میک او ایس پر

آپ کے ~/.bashrc or ~/.zshrc فائل میں درج ذیل ایکسپورٹس شامل کرنے کی سفارش کریں۔

export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>

مطلوبہ Python لائبریریاں انسٹال کریں

  1. اگر یہ پہلے سے انسٹال نہیں ہے تو git client انسٹال کریں۔

  2. Terminal ونڈو سے، نمونہ کو اپنے پسندیدہ ریپو فولڈر میں کلون کریں۔

    git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
  3. data_prep فولڈر پر جائیں۔

    cd semanic-search-openai-embeddings-functions/src/data_prep
  4. ایک Python ورچوئل ماحول بنائیں۔

    ونڈوز پر:

    python -m venv .venv

    میک او ایس اور لینکس پر:

    python3 -m venv .venv
  5. Python ورچوئل ماحول کو فعال کریں۔

    ونڈوز پر:

    .venv\Scripts\activate

    میک او ایس اور لینکس پر:

    source .venv/bin/activate
  6. مطلوبہ لائبریریاں انسٹال کریں۔

    ونڈوز پر:

    pip install -r requirements.txt

    میک او ایس اور لینکس پر:

    pip3 install -r requirements.txt

یوٹیوب ٹرانسکرپشن ڈیٹا کی تیاری کے اسکرپٹس چلائیں

ونڈوز پر

.\transcripts_prepare.ps1

میک او ایس اور لینکس پر

./transcripts_prepare.sh

دستبرداری:
یہ دستاویز AI ترجمہ سروس Co-op Translator کا استعمال کرتے ہوئے ترجمہ کی گئی ہے۔ ہم درستگی کے لیے کوشش کرتے ہیں، لیکن براہ کرم آگاہ رہیں کہ خودکار ترجمے میں غلطیاں یا عدم درستگیاں ہو سکتی ہیں۔ اصل دستاویز کو اس کی مقامی زبان میں معتبر ذریعہ سمجھا جانا چاہیے۔ اہم معلومات کے لیے، پیشہ ورانہ انسانی ترجمہ کی سفارش کی جاتی ہے۔ ہم اس ترجمہ کے استعمال سے پیدا ہونے والی کسی بھی غلط فہمی یا غلط تشریح کے ذمہ دار نہیں ہیں۔