ট্রান্সক্রিপশন ডেটা প্রস্তুতি স্ক্রিপ্টগুলো YouTube ভিডিওর ট্রান্সক্রিপ্ট ডাউনলোড করে এবং সেগুলোকে Semantic Search with OpenAI Embeddings and Functions স্যাম্পলের জন্য প্রস্তুত করে।
ট্রান্সক্রিপশন ডেটা প্রস্তুতি স্ক্রিপ্টগুলো সর্বশেষ রিলিজ Windows 11, macOS Ventura এবং Ubuntu 22.04 (এবং তার উপরে) তে পরীক্ষা করা হয়েছে।
Important
OpenAI এর সাথে সামঞ্জস্য নিশ্চিত করতে আমরা আপনাকে Azure CLI সর্বশেষ সংস্করণে আপডেট করার পরামর্শ দিচ্ছি দেখুন Documentation
- একটি রিসোর্স গ্রুপ তৈরি করুন
Note
এই নির্দেশনাগুলোর জন্য আমরা East US-এ "semantic-video-search" নামের রিসোর্স গ্রুপ ব্যবহার করছি। আপনি রিসোর্স গ্রুপের নাম পরিবর্তন করতে পারেন, কিন্তু রিসোর্সের অবস্থান পরিবর্তন করলে, model availability table চেক করুন।
az group create --name semantic-video-search --location eastus- একটি Azure OpenAI Service রিসোর্স তৈরি করুন।
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
--location eastus --kind OpenAI --sku s0- এই অ্যাপ্লিকেশনে ব্যবহারের জন্য endpoint এবং keys সংগ্রহ করুন
az cognitiveservices account show --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
--resource-group semantic-video-search | jq -r .key1- নিম্নলিখিত মডেলগুলো ডিপ্লয় করুন:
text-embedding-ada-002সংস্করণ2বা তার উপরে, নামtext-embedding-ada-002gpt-35-turboসংস্করণ0613বা তার উপরে, নামgpt-35-turbo
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name text-embedding-ada-002 \
--model-name text-embedding-ada-002 \
--model-version "2" \
--model-format OpenAI \
--scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
--name semantic-video-openai \
--resource-group semantic-video-search \
--deployment-name gpt-35-turbo \
--model-name gpt-35-turbo \
--model-version "0613" \
--model-format OpenAI \
--sku-capacity 100 \
--sku-name "Standard"- Python 3.9 বা তার উপরে
YouTube ট্রান্সক্রিপশন ডেটা প্রস্তুতি স্ক্রিপ্ট চালানোর জন্য নিম্নলিখিত পরিবেশ ভেরিয়েবলগুলো প্রয়োজন।
আপনার user পরিবেশ ভেরিয়েবলে ভেরিয়েবলগুলো যোগ করার পরামর্শ দেওয়া হয়।
Windows Start > Edit the system environment variables > Environment Variables > [USER] এর জন্য User variables > New।
AZURE_OPENAI_API_KEY \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>
আপনার ~/.bashrc বা ~/.zshrc ফাইলে নিম্নলিখিত export গুলো যোগ করার পরামর্শ দেওয়া হয়।
export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>-
যদি ইতিমধ্যে ইনস্টল না থাকে, তাহলে git client ইনস্টল করুন।
-
একটি
Terminalউইন্ডো থেকে, স্যাম্পলটি আপনার পছন্দের রিপো ফোল্ডারে ক্লোন করুন।git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
-
data_prepফোল্ডারে যান।cd semanic-search-openai-embeddings-functions/src/data_prep -
একটি Python ভার্চুয়াল এনভায়রনমেন্ট তৈরি করুন।
Windows-এ:
python -m venv .venvmacOS এবং Linux-এ:
python3 -m venv .venv
-
Python ভার্চুয়াল এনভায়রনমেন্ট সক্রিয় করুন।
Windows-এ:
.venv\Scripts\activate
macOS এবং Linux-এ:
source .venv/bin/activate -
প্রয়োজনীয় লাইব্রেরি ইনস্টল করুন।
Windows-এ:
pip install -r requirements.txtmacOS এবং Linux-এ:
pip3 install -r requirements.txt
.\transcripts_prepare.ps1./transcripts_prepare.shঅস্বীকৃতি:
এই নথিটি AI অনুবাদ সেবা Co-op Translator ব্যবহার করে অনূদিত হয়েছে। আমরা যথাসাধ্য সঠিকতার চেষ্টা করি, তবে স্বয়ংক্রিয় অনুবাদে ত্রুটি বা অসঙ্গতি থাকতে পারে। মূল নথিটি তার নিজস্ব ভাষায়ই কর্তৃত্বপূর্ণ উৎস হিসেবে বিবেচিত হওয়া উচিত। গুরুত্বপূর্ণ তথ্যের জন্য পেশাদার মানব অনুবাদ গ্রহণ করার পরামর্শ দেওয়া হয়। এই অনুবাদের ব্যবহারে সৃষ্ট কোনো ভুল বোঝাবুঝি বা ভুল ব্যাখ্যার জন্য আমরা দায়ী নই।