This repository was archived by the owner on Jul 21, 2021. It is now read-only.

Description
Momentan sind da finde ich zu wenige Sprachen drin. Wir sollten die ,wie bereits bei #41 bei DOCS und DATA geschehen, verbessern.
Muesste man hier anpassen: https://github.com/linkvt/repo-classifier/blob/master/classification/feature_extraction/dev.py#L36
Die Frage ist: Gehen wir auf Dateiendungen oder auf Sprachen?
Ueber die API abrufbare Sprachen
- einfach zu holen
- Sprachen koennen aus der languages.yaml gezogen werden
Dateiendungen
- API zeigt nicht alle Sprachen an, bspw Markdown ist leer - aber verfuegbar: https://github.com/trending/markdown
- Skripte in DOCS/DATA Repos haben 100% Anteil an Sprachen, es geht unter, dass Markdown oder so verwendet wird - TeX und XML koennen erkannt werden
- Dateiendungen koennen eigentlich auch aus der languages.yaml geholt werden