Create dataset loader for Open subtitles


  NusaCatalogue: https://indonlp.github.io/nusa-catalogue/card.html?open_subtitles
  
  |     Dataset        | open_subtitles  |
  |-------------|---|
  | Description | OpenSubtitles is a large parallel corpora from Movie and TV Subtitles. The corpora contains parallel sentences between English and Indonesian. The dataset contains 9827 documents, 56.8K sentences, 9.7M English tokens and 60.9M Indonesian tokens.  |
  | License     | GNU General Public License v3.0  |
  

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Create dataset loader for Open subtitles #342

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Dataset	open_subtitles
Description	OpenSubtitles is a large parallel corpora from Movie and TV Subtitles. The corpora contains parallel sentences between English and Indonesian. The dataset contains 9827 documents, 56.8K sentences, 9.7M English tokens and 60.9M Indonesian tokens.
License	GNU General Public License v3.0

Create dataset loader for Open subtitles #342

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions