Language switcher

kaixxx · kaixxx · commit c89e736b3593 · 2026-02-09T17:55:43.000+01:00
diff --git a/config/_default/hugo.toml b/config/_default/hugo.toml
@@ -2,10 +2,11 @@ baseURL = "https://noscribe.de/"
 
 theme = "hugo-book"
 
-defaultContentLanguage = "de"
-defaultContentLanguageInSubdir = false
+defaultContentLanguage = "en"
+defaultContentLanguageInSubdir = true
+disableDefaultLanguageRedirect = true
 
-languageCode = "de-DE"
+languageCode = "en-US"
 
 title = "noScribe"
 
@@ -35,7 +36,7 @@ enableRobotsTXT = false
   BookSection = "docs"
   BookToC = false
   BookFavicon = "img/noScribeLogo.png"
-  DefaultLang = "de"
+  DefaultLang = "en"
   OgImage = "img/graphic_sw.png"
   siteDescription = "Offizielle Website der Open-Source-Transkriptionssoftware noScribe – lokal, datenschutzfreundlich, ohne Cloud."
   authorName = "Dr. Kai Dröge"
@@ -48,13 +49,13 @@ enableRobotsTXT = false
   [languages.de]
     languageName = "Deutsch"
     languageCode = "de-DE"
-    weight = 1
+    weight = 2
     title = "noScribe"
     contentDir = "content/de"
   [languages.en]
     languageName = "English"
     languageCode = "en-US"
-    weight = 2
+    weight = 1
     title = "noScribe"
     contentDir = "content/en"
 
diff --git a/content/de/_index.md b/content/de/_index.md
@@ -35,7 +35,7 @@ NoScribe kann fast jedes Audio- oder Videoformat verarbeiten. Als Ausgabe wird s
 
 **Verarbeitung**
 
-Da die Transkription komplett lokal auf dem eigenen Computer erfolgt, muss man etwas Zeit einplanen: Eine Stunde Interview braucht ca. 1-3 Stunden Transkriptionszeit, auf älteren Rechnern teils noch länger. Man kann aber mehrere Aufträge in eine Warteschlange stellen, die dann bspw. über Nacht abgearbeitet werden. Eine NVIDIA-Grafikkarte (CUDA) kann die Transkription stark beschleunigen. Da der [Download](/docs/download-installation/) auch die KI-Modelle enthält, ist die Installationsdatei recht groß (ca. 3 GB).
+Da die Transkription komplett lokal auf dem eigenen Computer erfolgt, muss man etwas Zeit einplanen: Eine Stunde Interview braucht ca. 1-3 Stunden Transkriptionszeit, auf älteren Rechnern teils noch länger. Man kann aber mehrere Aufträge in eine Warteschlange stellen, die dann bspw. über Nacht abgearbeitet werden. Eine NVIDIA-Grafikkarte (CUDA) kann die Transkription stark beschleunigen. Da der [Download]({{< relref "docs/download-installation.md" >}}) auch die KI-Modelle enthält, ist die Installationsdatei recht groß (ca. 3 GB).
 
 **Spezialfunktionen**
 
@@ -48,7 +48,7 @@ Das KI-Modell hinter noScribe kann auch Dialekte wie bspw. Schweizerdeutsch rech
 
 {{% hint info %}} 
 **Mehr Info:**
-- Die noScribe [Bedienungsanleitung](/docs/usage/).
+- Die noScribe [Bedienungsanleitung]({{< relref "docs/usage.md" >}}).
 - Ein [Erfahrungbericht von Rebecca Schmidt](https://sozmethode.hypotheses.org/2315) (Universität Paderborn)
 - ["Datenaufbereitung durch Transkription"](https://www.pedocs.de/volltexte/2025/33856/pdf/Droege_2025_Datenaufbereitung_durch_Transkription.pdf), ein Fachartikel von mir zum Thema 
 {{% /hint %}}
diff --git a/content/de/docs/usage.md b/content/de/docs/usage.md
@@ -67,5 +67,5 @@ KI-gestützte Spracherkennung hat in den letzten Jahren enorme Fortschritte gema
 - Wie andere KI-Sprachmodelle kann auch das hier verwendete Modell Whisper manchmal "halluzinieren", also Worte oder Satzteile hinzufügen, die zwar inhaltlich passend erscheinen, tatsächlich aber nicht gesagt wurden - siehe diese [Studie der Cornell University](https://facctconference.org/static/papers24/facct24-111.pdf) zum Thema.
 - Selten können sich fortwährend wiederholende Textschleifen entstehen, ähnlich einer defekten Schallplatte. In diesem Fall kürzere Abschnitte mit leichter Überlappung transkribieren und manuell aneinanderfügen.
 - Eine Mischung mehrerer Sprachen in derselben Aufnahme kann dazu führen, dass das KI-Modell übersetzt statt wortgetreu zu transkribieren. 
-- Bei langen Audios kann die Interpunktion/Kapitalisierung verloren gehen. Auch hier kann eine Aufteilung des Transkripts möglicherweise helfen, oder man verwendet das Transkriptionsmodell "faster-whisper-large-v2", das weniger anfällig für dieses Problem ist. Es muss allerdings zunächst [installiert werden](/docs/advanced-options/#andere-transkriptionsmodelle-nutzen).
+- Bei langen Audios kann die Interpunktion/Kapitalisierung verloren gehen. Auch hier kann eine Aufteilung des Transkripts möglicherweise helfen, oder man verwendet das Transkriptionsmodell "faster-whisper-large-v2", das weniger anfällig für dieses Problem ist. Es muss allerdings zunächst [installiert werden]({{< relref "docs/advanced-options.md" >}}#andere-transkriptionsmodelle-nutzen).
 - Die Qualität des Ergebnisses hängt stark von der Sprache ab. Westliche Sprachen werden generell sehr gut unterstützt, auch kleinere wie bspw. Niederländisch. Gut ist auch die Unterstützung für Koreanisch, Chinesisch (Mandarin), oder Indonesisch. Dagegen werden andere, ebenfalls große Sprachen wie bspw. Persisch, Panjabi oder Tamil nur sehr fehlerhaft transkribiert. Dies ist ein klarer Fall von KI-Bias, in dem sich die ökonomischen Interessen von OpenAI spiegeln, die das Whisper-Modell trainiert haben. Hier findet man eine Übersicht zu [typischen Fehlerraten in verschiedenen Sprachen](https://github.com/openai/whisper?tab=readme-ov-file#available-models-and-languages). Siehe auch [dieses Paper](https://doi.org/10.1145/3576915.3624380) für einen Vergleich verschiedener Transkriptionsmodelle und deren Fehlerraten.
diff --git a/content/en/_index.md b/content/en/_index.md
@@ -34,7 +34,7 @@ noScribe can process almost any audio or video format. By default it creates an
 
 **Processing**
 
-Because transcription happens entirely locally on your own computer, it needs some time: One hour of interview takes about 1-3 hours of transcription time, on older machines even longer. But you can queue multiple jobs, for example overnight. An NVIDIA graphics card (CUDA) can significantly speed up transcription. Since the [download](/en/docs/download-installation/) also includes the AI models, the installer is quite large (about 3 GB).
+Because transcription happens entirely locally on your own computer, it needs some time: One hour of interview takes about 1-3 hours of transcription time, on older machines even longer. But you can queue multiple jobs, for example overnight. An NVIDIA graphics card (CUDA) can significantly speed up transcription. Since the [download]({{< relref "docs/download-installation.md" >}}) also includes the AI models, the installer is quite large (about 3 GB).
 
 **Special features**
 
@@ -46,7 +46,7 @@ The AI model behind noScribe supports many languages and can handle dialects qui
 
 {{% hint info %}}
 **More info:**
-- The noScribe [usage guide](/en/docs/usage/) and [FAQ](/en/docs/faq/).
+- The noScribe [usage guide]({{< relref "docs/usage.md" >}}) and [FAQ]({{< relref "docs/faq.md" >}}).
 - [Review and tutorial video (external)](https://www.youtube.com/watch?v=d0iwEVdW3qg)
 {{% /hint %}}
 
diff --git a/content/en/docs/usage.md b/content/en/docs/usage.md
@@ -67,5 +67,5 @@ AI-assisted speech recognition has made huge advances in recent years. Still, th
 - Like other AI language models, the Whisper model used here can sometimes "hallucinate" and add words or phrases that sound plausible but were not actually said - see this [Cornell University study](https://facctconference.org/static/papers24/facct24-111.pdf) on the topic.
 - Rarely, endlessly repeating text loops can occur, similar to a defective record. In this case, transcribe shorter sections with slight overlap and stitch them together manually.
 - A mix of multiple languages in the same recording can cause the AI model to translate instead of transcribing verbatim.
-- With long audio files, punctuation/capitalization can be lost. In that case, splitting the transcript may help, or you can use the transcription model "faster-whisper-large-v2", which is less prone to this problem. However, it must first be [installed](/en/docs/advanced-options/#use-special-transcription-models).
+- With long audio files, punctuation/capitalization can be lost. In that case, splitting the transcript may help, or you can use the transcription model "faster-whisper-large-v2", which is less prone to this problem. However, it must first be [installed]({{< relref "docs/advanced-options.md" >}}#use-special-transcription-models).
 - The quality of the result depends heavily on the language. Western languages are generally very well supported, including smaller ones like Dutch. Support is also good for Korean, Chinese (Mandarin), or Indonesian. By contrast, other large languages such as Persian, Punjabi, or Tamil are transcribed much less accurately. This is a clear case of AI bias, reflecting the economic interests of OpenAI, which trained the Whisper model. Here is an overview of [typical error rates in different languages](https://github.com/openai/whisper?tab=readme-ov-file#available-models-and-languages). See also [this paper](https://doi.org/10.1145/3576915.3624380) for a comparison of different transcription models and their error rates.
diff --git a/layouts/_partials/docs/html-head.html b/layouts/_partials/docs/html-head.html
@@ -39,14 +39,8 @@
   <link rel="alternate" hreflang="{{ default .Site.LanguageCode .Language.Lang }}" href="{{ .Permalink }}" title="{{ partial "docs/title" . }}">
 {{- end -}}
 
-{{- $defaultLang := .Site.Params.DefaultLang | default .Site.Language.Lang -}}
-{{- $xDefault := . -}}
-{{- range $translations -}}
-  {{- if eq .Language.Lang $defaultLang -}}
-    {{- $xDefault = . -}}
-  {{- end -}}
-{{- end -}}
-<link rel="alternate" hreflang="x-default" href="{{ $xDefault.Permalink }}">
+{{- $xDefault := "/" | absURL -}}
+<link rel="alternate" hreflang="x-default" href="{{ $xDefault }}">
 
 {{- $styles := resources.Get "book.scss" | resources.ExecuteAsTemplate "book.scss" . | css.Sass | resources.Minify | resources.Fingerprint }}
 <link rel="stylesheet" href="{{ partial "docs/links/resource-precache" $styles }}" {{ template "integrity" $styles }}>
diff --git a/static/index.html b/static/index.html
@@ -0,0 +1,124 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="robots" content="noindex,follow">
+    <title>noScribe — Language</title>
+    <link rel="icon" href="/favicon.svg" type="image/svg+xml">
+    <link rel="icon" href="/favicon.png" type="image/png">
+    <style>
+      :root {
+        color-scheme: light;
+      }
+      body {
+        margin: 0;
+        min-height: 100vh;
+        display: grid;
+        place-items: center;
+        font-family: "Source Serif 4", "Georgia", "Times New Roman", serif;
+        background: radial-gradient(120% 120% at 10% 10%, #f5f1ea 0%, #efe7db 45%, #e8ded0 100%);
+        color: #1d1d1d;
+      }
+      main {
+        max-width: 36rem;
+        padding: 2.5rem 2rem 2rem;
+        margin: 2rem;
+        background: rgba(255, 255, 255, 0.85);
+        border: 1px solid #d9cfc1;
+        border-radius: 18px;
+        box-shadow: 0 10px 30px rgba(29, 29, 29, 0.08);
+        text-align: center;
+      }
+      h1 {
+        font-size: 2rem;
+        margin: 0 0 0.5rem;
+        letter-spacing: 0.02em;
+      }
+      p {
+        margin: 0.5rem 0 0;
+        font-size: 1.05rem;
+        line-height: 1.5;
+      }
+      .choices {
+        display: grid;
+        gap: 0.75rem;
+        margin: 1.5rem 0 0.75rem;
+      }
+      .lang {
+        display: block;
+        padding: 0.85rem 1rem;
+        border: 1px solid #b9ab98;
+        border-radius: 12px;
+        text-decoration: none;
+        color: inherit;
+        font-weight: 600;
+        background: #fff7eb;
+        transition: transform 160ms ease, box-shadow 160ms ease;
+      }
+      .lang:hover,
+      .lang:focus-visible {
+        transform: translateY(-2px);
+        box-shadow: 0 6px 16px rgba(29, 29, 29, 0.12);
+      }
+      .meta {
+        font-size: 0.9rem;
+        color: #4b4b4b;
+      }
+    </style>
+  </head>
+  <body>
+    <main>
+      <h1>noScribe</h1>
+      <p>Select your language</p>
+      <div class="choices">
+        <a class="lang" href="/en/">English</a>
+        <a class="lang" href="/de/">Deutsch</a>
+      </div>
+      <p class="meta">
+        Your browser language is used for an automatic redirect on this page only.
+        You can change language on every page later.
+      </p>
+      <noscript>
+        <p class="meta">JavaScript is disabled; please choose a language above.</p>
+      </noscript>
+    </main>
+
+    <script>
+      (function () {
+        if (window.location.pathname !== "/") return;
+
+        // Add new languages by extending this map.
+        var languagePaths = {
+          en: "/en/",
+          de: "/de/"
+        };
+        var fallback = "/en/";
+
+        var preferred = (navigator.languages && navigator.languages.length)
+          ? navigator.languages
+          : [navigator.language || ""];
+
+        var target = null;
+        for (var i = 0; i < preferred.length; i++) {
+          var lang = String(preferred[i] || "").toLowerCase();
+          if (!lang) continue;
+          if (languagePaths[lang]) {
+            target = languagePaths[lang];
+            break;
+          }
+          var base = lang.split("-")[0];
+          if (languagePaths[base]) {
+            target = languagePaths[base];
+            break;
+          }
+        }
+
+        if (!target) target = fallback;
+        if (target && target !== window.location.pathname) {
+          window.location.replace(target);
+        }
+      })();
+    </script>
+  </body>
+</html>