Skip to content

Latest commit

 

History

History
77 lines (46 loc) · 2.79 KB

File metadata and controls

77 lines (46 loc) · 2.79 KB

Transkripsjonsdatapreparering

Skript for transkripsjonsdatapreparering laster ned transkripsjoner av YouTube-videoer og klargjør dem for bruk med eksempelsøket "Semantic Search with OpenAI Embeddings and Functions".

Skript for transkripsjonsdatapreparering er testet på de nyeste versjonene av Windows 11, macOS Ventura og Ubuntu 22.04 (og nyere).

Opprett nødvendige Azure OpenAI Service-ressurser

  1. Opprett en ressursgruppe

  2. Opprett en Azure OpenAI Service-ressurs.

  3. Hent endepunktet og nøklene for bruk i denne applikasjonen

  4. Implementer følgende modeller:

    • text-embedding-ada-002 version 2 or greater, named text-embedding-ada-002
    • gpt-35-turbo version 0613 or greater, named gpt-35-turbo

Nødvendig programvare

Miljøvariabler

Følgende miljøvariabler er nødvendige for å kjøre skript for transkripsjonsdatapreparering fra YouTube.

På Windows

Anbefaler å legge til variablene til user environment variables. Windows Start > Edit the system environment variables > Environment Variables > User variables for [USER] > New.

På Linux og macOS

Anbefaler å legge til følgende eksporteringer til ~/.bashrc or ~/.zshrc-filen.

Installer de nødvendige Python-bibliotekene

  1. Installer git-klienten hvis den ikke allerede er installert.

  2. Fra et Terminal-vindu, klon eksemplet til din foretrukne repo-mappe.

  3. Naviger til data_prep-mappen.

  4. Opprett et Python virtuelt miljø.

    På Windows:

    På macOS og Linux:

  5. Aktiver Python virtuelt miljø.

    På Windows:

    På macOS og Linux:

  6. Installer de nødvendige bibliotekene.

    På Windows:

    På macOS og Linux:

Kjør skript for transkripsjonsdatapreparering fra YouTube

På Windows

På macOS og Linux

Ansvarsfraskrivelse: Dette dokumentet har blitt oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator. Selv om vi tilstreber nøyaktighet, vennligst vær oppmerksom på at automatiserte oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på dets opprinnelige språk bør betraktes som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår fra bruken av denne oversettelsen.