Skript for transkripsjonsdatapreparering laster ned transkripsjoner av YouTube-videoer og klargjør dem for bruk med eksempelsøket "Semantic Search with OpenAI Embeddings and Functions".
Skript for transkripsjonsdatapreparering er testet på de nyeste versjonene av Windows 11, macOS Ventura og Ubuntu 22.04 (og nyere).
-
Opprett en ressursgruppe
-
Opprett en Azure OpenAI Service-ressurs.
-
Hent endepunktet og nøklene for bruk i denne applikasjonen
-
Implementer følgende modeller:
text-embedding-ada-002version2or greater, namedtext-embedding-ada-002gpt-35-turboversion0613or greater, namedgpt-35-turbo
- Python 3.9 eller nyere
Følgende miljøvariabler er nødvendige for å kjøre skript for transkripsjonsdatapreparering fra YouTube.
Anbefaler å legge til variablene til user environment variables.
Windows Start > Edit the system environment variables > Environment Variables > User variables for [USER] > New.
Anbefaler å legge til følgende eksporteringer til ~/.bashrc or ~/.zshrc-filen.
-
Installer git-klienten hvis den ikke allerede er installert.
-
Fra et
Terminal-vindu, klon eksemplet til din foretrukne repo-mappe. -
Naviger til
data_prep-mappen. -
Opprett et Python virtuelt miljø.
På Windows:
På macOS og Linux:
-
Aktiver Python virtuelt miljø.
På Windows:
På macOS og Linux:
-
Installer de nødvendige bibliotekene.
På Windows:
På macOS og Linux:
Ansvarsfraskrivelse: Dette dokumentet har blitt oversatt ved hjelp av AI-oversettelsestjenesten Co-op Translator. Selv om vi tilstreber nøyaktighet, vennligst vær oppmerksom på at automatiserte oversettelser kan inneholde feil eller unøyaktigheter. Det originale dokumentet på dets opprinnelige språk bør betraktes som den autoritative kilden. For kritisk informasjon anbefales profesjonell menneskelig oversettelse. Vi er ikke ansvarlige for eventuelle misforståelser eller feiltolkninger som oppstår fra bruken av denne oversettelsen.