Skip to content

Latest commit

 

History

History
180 lines (128 loc) · 8.39 KB

File metadata and controls

180 lines (128 loc) · 8.39 KB

ការរៀបចំទិន្នន័យបម្លែងសំឡេង

ស្គ្រីបរៀបចំទិន្នន័យបម្លែងសំឡេងទាញយកអត្ថបទវីដេអូ YouTube និងរៀបចំវាឱ្យប្រើជាមួយគំរូស្វែងរក Semantic ជាមួយ OpenAI Embeddings និង Functions ។

ស្គ្រីបរៀបចំទិន្នន័យបម្លែងសំឡេងត្រូវបានសាកល្បងនៅលើកំណែចុងក្រោយ Windows 11, macOS Ventura និង Ubuntu 22.04 (និងលើស).

បង្កើតធនធាន Azure OpenAI Service ដែលត្រូវការ

Important

យើងផ្តល់អនុសាសន៍ឱ្យអ្នកធ្វើបច្ចុប្បន្នភាព Azure CLI ទៅកំណែចុងក្រោយដើម្បីធានាការភាពសមរម្យជាមួយ OpenAI មើល ឯកសារណ៍

  1. បង្កើតក្រុមធនធាន

Note

សម្រាប់ការណែនាំទាំងនេះ យើងកំពុងប្រើក្រុមធនធានដែលមានឈ្មោះ "semantic-video-search" នៅ East US។ អ្នកអាចប្ដូរឈ្មោះក្រុមធនធានបាន ប៉ុន្តេលើពេលប្ដូរទីតាំងសម្រាប់ធនធាន, សូមពិនិត្ដតារាង ការចូលប្រើម៉ូដែល

az group create --name semantic-video-search --location eastus
  1. បង្កើតធនធាន Azure OpenAI Service។
az cognitiveservices account create --name semantic-video-openai --resource-group semantic-video-search \
    --location eastus --kind OpenAI --sku s0
  1. ទទួលបានចំណុចចប់ និងកូនសោសម្រាប់ប្រើប្រាស់ក្នុងកម្មវិធីនេះ
az cognitiveservices account show --name semantic-video-openai \
   --resource-group  semantic-video-search | jq -r .properties.endpoint
az cognitiveservices account keys list --name semantic-video-openai \
   --resource-group semantic-video-search | jq -r .key1
  1. ចេញផ្សាយម៉ូដែលដូចតទៅ៖
    • text-embedding-ada-002 កំណែ 2 ឬលើស, មានឈ្មោះ text-embedding-ada-002
    • gpt-35-turbo កំណែ 0613 ឬលើស, មានឈ្មោះ gpt-35-turbo
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name text-embedding-ada-002 \
    --model-name text-embedding-ada-002 \
    --model-version "2"  \
    --model-format OpenAI \
    --scale-settings-scale-type "Standard"
az cognitiveservices account deployment create \
    --name semantic-video-openai \
    --resource-group  semantic-video-search \
    --deployment-name gpt-35-turbo \
    --model-name gpt-35-turbo \
    --model-version "0613"  \
    --model-format OpenAI \
    --sku-capacity 100 \
    --sku-name "Standard"

កម្មវិធីដែលត្រូវការ

បំណែងអថេរបរិស្ថាន

អថេរបរិស្ថានខាងក្រោមត្រូវការដើម្បីបញ្ជាររបៀបស្គ្រីបរៀបចំទិន្នន័យបម្លែងសំឡេង YouTube។

នៅលើ Windows

ផ្តល់អនុសាសន៍បន្ថែមអថេរទៅអថេរបរិស្ថាន user របស់អ្នក។ Windows Start > Edit the system environment variables > Environment Variables > User variables សម្រាប់ [USER] > New

AZURE_OPENAI_API_KEY  \<your Azure OpenAI Service API key>
AZURE_OPENAI_ENDPOINT \<your Azure OpenAI Service endpoint>
AZURE_OPENAI_MODEL_DEPLOYMENT_NAME \<your Azure OpenAI Service model deployment name>
GOOGLE_DEVELOPER_API_KEY = \<your Google developer API key>

នៅលើ Linux និង macOS

ផ្តល់អនុសាសន៍បន្ថែមការនាំចេញខាងក្រោមទៅក្នុងឯកសារ ~/.bashrc~/.zshrc របស់អ្នក។

export AZURE_OPENAI_API_KEY=<your Azure OpenAI Service API key>
export AZURE_OPENAI_ENDPOINT=<your Azure OpenAI Service endpoint>
export AZURE_OPENAI_MODEL_DEPLOYMENT_NAME=<your Azure OpenAI Service model deployment name>
export GOOGLE_DEVELOPER_API_KEY=<your Google developer API key>

ដំឡើងបណ្ណាល័យ Python ដែលត្រូវការ

  1. ដំឡើង git client ប្រសិនបើមិនទាន់ត្រូវបានដំឡើង។

  2. ពីចំហៀង Terminal, បកចម្លងគំរូទៅកាន់ថត repo ដែលអ្នកចូលចិត្ត។

    git clone https://github.com/gloveboxes/semanic-search-openai-embeddings-functions.git
  3. ធ្វើដំណើរទៅថត data_prep

    cd semanic-search-openai-embeddings-functions/src/data_prep
  4. បង្កើតបរិបទ Python virtual ។

    នៅលើ Windows:

    python -m venv .venv

    នៅលើយ macOS និង Linux:

    python3 -m venv .venv
  5. បើកបរិបទ Python virtual ។

    នៅលើ Windows:

    .venv\Scripts\activate

    នៅលើយ macOS និង Linux:

    source .venv/bin/activate
  6. ដំឡើងបណ្ណាល័យដែលត្រូវការ។

    នៅលើ Windows:

    pip install -r requirements.txt

    នៅលើយ macOS និង Linux:

    pip3 install -r requirements.txt

រត់ស្គ្រីបរៀបចំទិន្នន័យបម្លែងសំឡេង YouTube

នៅលើ Windows

.\transcripts_prepare.ps1

នៅលើយ macOS និង Linux

./transcripts_prepare.sh

ការបដិសេធ
ឯកសារនេះត្រូវបានបកប្រែដោយប្រើសេវាកម្មបកប្រែ AI Co-op Translator។ ក្នុងខណៈដែលយើងខិតខំរកភាពត្រឹមត្រូវ សូមជ្រាបថាការបកប្រែដោយស្វ័យប្រវត្តិនេះអាចមានកំហុស ឬការបាត់បង់ភាពត្រឹមត្រូវខ្លះ។ ឯកសារដើមក្នុងភាសាម្ខាងគឺជាអ្នកផ្តល់ព័ត៌មានដែលមានអាជ្ញាធរមានសុពលភាព។ សម្រាប់ព័ត៌មានសំខាន់ៗ ការបកប្រែដោយអ្នកជំនាញមនុស្សគឺជាជម្រើសដែលបានណែនាំ។ យើងមិនទទួលខុសត្រូវចំពោះការយល់ច្រឡំ ឬការបញ្ចេញមតិមិនត្រឹមត្រូវដែលកើតមានអំពីការប្រើប្រាស់ការបកប្រែនេះឡើយ។