مقدمة المشروع (جرب النسخة عبر الإنترنت الآن!)
Klic Studio هو حل شامل لتوطين وتعزيز الصوت والفيديو تم تطويره بواسطة Krillin AI. هذه الأداة البسيطة والقوية تجمع بين ترجمة الفيديو والصوت، وتكرار الصوت، واستنساخ الصوت، وتدعم إخراج بتنسيقات أفقية ورأسية، مما يضمن عرضها بشكل مثالي على جميع المنصات الرئيسية (Bilibili، Xiaohongshu، Douyin، WeChat Video، Kuaishou، YouTube، TikTok، إلخ). من خلال سير العمل من البداية إلى النهاية، يمكنك تحويل المواد الأصلية إلى محتوى متعدد المنصات جاهز للاستخدام بنقرات قليلة فقط.
🎯 تشغيل بنقرة واحدة: لا حاجة لتكوين بيئة معقدة، تثبيت تلقائي للاعتماديات، ابدأ الاستخدام على الفور، إصدار سطح مكتب جديد، استخدام أكثر سهولة!
📥 الحصول على الفيديو: يدعم تنزيل yt-dlp أو تحميل الملفات المحلية
📜 التعرف الدقيق: التعرف على الصوت بدقة عالية بناءً على Whisper
🧠 التقسيم الذكي: استخدام LLM لتقسيم وتنسيق الترجمة
🔄 استبدال المصطلحات: استبدال المصطلحات المتخصصة بنقرة واحدة
🌍 ترجمة احترافية: ترجمة LLM مع الحفاظ على المعنى الطبيعي
🎙️ استنساخ الصوت: تقديم أصوات مختارة من CosyVoice أو استنساخ صوت مخصص
🎬 دمج الفيديو: معالجة تلقائية للفيديوهات الأفقية والرأسية وتنسيق الترجمة
💻 عبر المنصات: يدعم Windows وLinux وmacOS، يوفر إصدار سطح مكتب وإصدار خادم
الصورة أدناه توضح تأثير ملف الترجمة الناتج بعد استيراد فيديو محلي مدته 46 دقيقة وتنفيذه بنقرة واحدة، دون أي تعديلات يدوية. لا توجد أي فقدان أو تداخل، والفواصل طبيعية، وجودة الترجمة عالية جدًا.
subtitle_translation.mp4 |
tts.mp4 |
agi.mp4 |
جميع النماذج المحلية في الجدول أدناه تدعم التثبيت التلقائي للملفات القابلة للتنفيذ + ملفات النموذج، كل ما عليك هو الاختيار، والباقي ستقوم Klic بإعداده لك.
مصدر الخدمة | المنصات المدعومة | خيارات النموذج | محلي/سحابي | ملاحظات |
---|---|---|---|---|
OpenAI Whisper | جميع المنصات | - | سحابي | سريع وفعال |
FasterWhisper | Windows/Linux | tiny /medium /large-v2 (موصى به medium+) |
محلي | أسرع، بدون تكاليف سحابية |
WhisperKit | macOS (لرقائق M فقط) | large-v2 |
محلي | تحسين أصلي لرقائق Apple |
WhisperCpp | جميع المنصات | large-v2 |
محلي | يدعم جميع المنصات |
Alibaba Cloud ASR | جميع المنصات | - | سحابي | لتجنب مشاكل الشبكة في البر الرئيسي للصين |
✅ متوافق مع جميع خدمات نماذج اللغة الكبيرة السحابية/المحلية التي تتوافق مع معايير OpenAI API، بما في ذلك على سبيل المثال لا الحصر:
- OpenAI
- Gemini
- DeepSeek
- Tongyi Qianwen
- نماذج مفتوحة المصدر المثبتة محليًا
- خدمات API الأخرى المتوافقة مع تنسيق OpenAI
- خدمة صوتية من Alibaba Cloud
- OpenAI TTS
اللغات المدخلة المدعومة: الصينية، الإنجليزية، اليابانية، الألمانية، التركية، الكورية، الروسية، الماليزية (تستمر في الزيادة)
اللغات المدعومة للترجمة: الإنجليزية، الصينية، الروسية، الإسبانية، الفرنسية، وغيرها من 101 لغة
أولاً، قم بتنزيل الإصدار الذي يتناسب مع نظام جهازك، ثم اختر بين إصدار سطح المكتب أو غير سطح المكتب وفقًا للدليل أدناه، ثم ضع الملفات في مجلد فارغ، قم بتنزيل البرنامج إلى مجلد فارغ، لأنه بعد التشغيل سيتم إنشاء بعض الدلائل، وضعها في مجلد فارغ سيسهل إدارتها.
【إذا كان إصدار سطح المكتب، أي ملف الإصدار الذي يحمل كلمة desktop انظر هنا】
إصدار سطح المكتب هو إصدار جديد، تم إصداره لحل مشكلة صعوبة تحرير ملفات التكوين بشكل صحيح من قبل المستخدمين الجدد، وهناك بعض الأخطاء، يتم تحديثه باستمرار
- انقر نقرًا مزدوجًا على الملف لبدء الاستخدام (يحتاج إصدار سطح المكتب أيضًا إلى تكوين، يتم تكوينه داخل البرنامج)
【إذا كان إصدار غير سطح المكتب، أي ملف الإصدار الذي لا يحمل كلمة desktop انظر هنا】
إصدار غير سطح المكتب هو الإصدار الأول، التكوين أكثر تعقيدًا، ولكنه مستقر، كما أنه مناسب للنشر على الخادم، لأنه سيقدم واجهة مستخدم عبر الويب
- في المجلد، أنشئ مجلدًا باسم
config
، ثم في مجلدconfig
أنشئ ملفًا باسمconfig.toml
، انسخ محتوى ملفconfig-example.toml
الموجود في دليلconfig
واملأه فيconfig.toml
، واملأ معلومات التكوين الخاصة بك وفقًا للتعليقات. - انقر نقرًا مزدوجًا، أو نفذ الملف القابل للتنفيذ في الطرفية، لبدء الخدمة
- افتح المتصفح، أدخل
http://127.0.0.1:8888
، وابدأ الاستخدام (استبدل 8888 بالمنفذ الذي قمت بملئه في ملف التكوين)
【إذا كان إصدار سطح المكتب، أي ملف الإصدار الذي يحمل كلمة desktop انظر هنا】
حاليًا، بسبب مشاكل في التوقيع، لا يمكن حزم إصدار سطح المكتب ليعمل بنقرة مزدوجة مباشرة أو تثبيت dmg، تحتاج إلى الوثوق بالتطبيق يدويًا، الطريقة كالتالي:
- افتح الملف القابل للتنفيذ في الطرفية (افترض أن اسم الملف هو KlicStudio_1.0.0_desktop_macOS_arm64) في الدليل
- نفذ الأوامر التالية بالتتابع:
sudo xattr -cr ./KlicStudio_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KlicStudio_1.0.0_desktop_macOS_arm64
./KlicStudio_1.0.0_desktop_macOS_arm64
【إذا كان إصدار غير سطح المكتب، أي ملف الإصدار الذي لا يحمل كلمة desktop انظر هنا】
لم يتم توقيع هذا البرنامج، لذلك عند تشغيله على macOS، بعد إكمال تكوين الملفات في "الخطوات الأساسية"، تحتاج أيضًا إلى الوثوق بالتطبيق يدويًا، الطريقة كالتالي:
- افتح الملف القابل للتنفيذ في الطرفية (افترض أن اسم الملف هو KlicStudio_1.0.0_macOS_arm64) في الدليل
- نفذ الأوامر التالية بالتتابع:
لبدء الخدمة
sudo xattr -rd com.apple.quarantine ./KlicStudio_1.0.0_macOS_arm64 sudo chmod +x ./KlicStudio_1.0.0_macOS_arm64 ./KlicStudio_1.0.0_macOS_arm64
يدعم هذا المشروع نشر Docker، يرجى الرجوع إلى إرشادات نشر Docker
إذا واجهت مشكلة في تنزيل الفيديو
يرجى الرجوع إلى إرشادات تكوين الكوكيز لتكوين معلومات الكوكيز الخاصة بك.
أسرع وأسهل طريقة للتكوين:
- املأ
transcribe.provider.name
بـopenai
، بحيث تحتاج فقط إلى ملء كتلةtranscribe.openai
وكتلة تكوين النموذج الكبيرllm
لتتمكن من ترجمة الترجمة. (يمكن ملءapp.proxy
وmodel
وopenai.base_url
حسب الحاجة)
طريقة تكوين استخدام نموذج التعرف على الصوت المحلي (توازن بين التكلفة والسرعة والجودة)
- املأ
transcribe.provider.name
بـfasterwhisper
، واملأtranscribe.fasterwhisper.model
بـlarge-v2
، ثم املأllm
بتكوين النموذج الكبير، وستقوم النماذج المحلية بالتثبيت والتنزيل تلقائيًا. (مثلapp.proxy
وopenai.base_url
كما هو موضح أعلاه)
تحويل النص إلى صوت (TTS) هو اختياري، منطق التكوين مشابه لما سبق، املأ tts.provider.name
، ثم املأ الكتل المقابلة تحت tts
، يمكن ملء رموز الصوت في واجهة المستخدم وفقًا لوثائق المزود المختار (توجد عناوين الوثائق في قسم الأسئلة الشائعة أدناه). قد يتكرر ملء ak وsk من Alibaba Cloud، وذلك لضمان وضوح هيكل التكوين.
ملاحظة: عند استخدام استنساخ الصوت، يدعم tts
فقط اختيار aliyun
.
للحصول على AccessKey وBucket وAppKey من Alibaba Cloud، يرجى قراءة:إرشادات تكوين Alibaba Cloud
يرجى فهم أن المهمة = التعرف على الصوت + ترجمة النموذج الكبير + خدمة الصوت (TTS وما إلى ذلك، اختيارية)، وهذا سيساعدك في فهم ملف التكوين بشكل أفضل.
يرجى الانتقال إلى الأسئلة الشائعة
- لا تقم بتقديم ملفات غير مفيدة، مثل .vscode و.idea، يرجى استخدام .gitignore للتصفية
- لا تقم بتقديم config.toml، بل استخدم config-example.toml للتقديم
- انضم إلى مجموعة QQ الخاصة بنا، للإجابة على الأسئلة: 754069680
- تابع حسابات وسائل التواصل الاجتماعي الخاصة بنا، Bilibili، حيث نشارك محتوى عالي الجودة في مجال التكنولوجيا الذكية يوميًا