أداة ترجمة الفيديو والصوت باستخدام الذكاء الاصطناعي

English｜简体中文｜日本語｜한국어｜Tiếng Việt｜Français｜Deutsch｜Español｜Português｜Русский｜اللغة العربية

مقدمة المشروع (جرب النسخة عبر الإنترنت الآن!)

Klic Studio هو حل شامل لتوطين وتعزيز الصوت والفيديو تم تطويره بواسطة Krillin AI. هذه الأداة البسيطة والقوية تجمع بين ترجمة الفيديو والصوت، وتكرار الصوت، واستنساخ الصوت، وتدعم إخراج بتنسيقات أفقية ورأسية، مما يضمن عرضها بشكل مثالي على جميع المنصات الرئيسية (Bilibili، Xiaohongshu، Douyin، WeChat Video، Kuaishou، YouTube، TikTok، إلخ). من خلال سير العمل من البداية إلى النهاية، يمكنك تحويل المواد الأصلية إلى محتوى متعدد المنصات جاهز للاستخدام بنقرات قليلة فقط.

الميزات والوظائف الرئيسية:

🎯 تشغيل بنقرة واحدة: لا حاجة لتكوين بيئة معقدة، تثبيت تلقائي للاعتماديات، ابدأ الاستخدام على الفور، إصدار سطح مكتب جديد، استخدام أكثر سهولة!

📥 الحصول على الفيديو: يدعم تنزيل yt-dlp أو تحميل الملفات المحلية

📜 التعرف الدقيق: التعرف على الصوت بدقة عالية بناءً على Whisper

🧠 التقسيم الذكي: استخدام LLM لتقسيم وتنسيق الترجمة

🔄 استبدال المصطلحات: استبدال المصطلحات المتخصصة بنقرة واحدة

🌍 ترجمة احترافية: ترجمة LLM مع الحفاظ على المعنى الطبيعي

🎙️ استنساخ الصوت: تقديم أصوات مختارة من CosyVoice أو استنساخ صوت مخصص

🎬 دمج الفيديو: معالجة تلقائية للفيديوهات الأفقية والرأسية وتنسيق الترجمة

💻 عبر المنصات: يدعم Windows وLinux وmacOS، يوفر إصدار سطح مكتب وإصدار خادم

عرض النتائج

الصورة أدناه توضح تأثير ملف الترجمة الناتج بعد استيراد فيديو محلي مدته 46 دقيقة وتنفيذه بنقرة واحدة، دون أي تعديلات يدوية. لا توجد أي فقدان أو تداخل، والفواصل طبيعية، وجودة الترجمة عالية جدًا.

ترجمة الترجمة

subtitle_translation.mp4

الصوت

tts.mp4

عمودي

agi.mp4

🔍 دعم خدمات التعرف على الصوت

جميع النماذج المحلية في الجدول أدناه تدعم التثبيت التلقائي للملفات القابلة للتنفيذ + ملفات النموذج، كل ما عليك هو الاختيار، والباقي ستقوم Klic بإعداده لك.

مصدر الخدمة	المنصات المدعومة	خيارات النموذج	محلي/سحابي	ملاحظات
OpenAI Whisper	جميع المنصات	-	سحابي	سريع وفعال
FasterWhisper	Windows/Linux	`tiny`/`medium`/`large-v2` (موصى به medium+)	محلي	أسرع، بدون تكاليف سحابية
WhisperKit	macOS (لرقائق M فقط)	`large-v2`	محلي	تحسين أصلي لرقائق Apple
WhisperCpp	جميع المنصات	`large-v2`	محلي	يدعم جميع المنصات
Alibaba Cloud ASR	جميع المنصات	-	سحابي	لتجنب مشاكل الشبكة في البر الرئيسي للصين

🚀 دعم نماذج اللغة الكبيرة

✅ متوافق مع جميع خدمات نماذج اللغة الكبيرة السحابية/المحلية التي تتوافق مع معايير OpenAI API، بما في ذلك على سبيل المثال لا الحصر:

OpenAI
Gemini
DeepSeek
Tongyi Qianwen
نماذج مفتوحة المصدر المثبتة محليًا
خدمات API الأخرى المتوافقة مع تنسيق OpenAI

🎤 دعم تحويل النص إلى صوت (TTS)

خدمة صوتية من Alibaba Cloud
OpenAI TTS

دعم اللغات

اللغات المدخلة المدعومة: الصينية، الإنجليزية، اليابانية، الألمانية، التركية، الكورية، الروسية، الماليزية (تستمر في الزيادة)

اللغات المدعومة للترجمة: الإنجليزية، الصينية، الروسية، الإسبانية، الفرنسية، وغيرها من 101 لغة

معاينة الواجهة

🚀 البدء السريع

الخطوات الأساسية

أولاً، قم بتنزيل الإصدار الذي يتناسب مع نظام جهازك، ثم اختر بين إصدار سطح المكتب أو غير سطح المكتب وفقًا للدليل أدناه، ثم ضع الملفات في مجلد فارغ، قم بتنزيل البرنامج إلى مجلد فارغ، لأنه بعد التشغيل سيتم إنشاء بعض الدلائل، وضعها في مجلد فارغ سيسهل إدارتها.

【إذا كان إصدار سطح المكتب، أي ملف الإصدار الذي يحمل كلمة desktop انظر هنا】
إصدار سطح المكتب هو إصدار جديد، تم إصداره لحل مشكلة صعوبة تحرير ملفات التكوين بشكل صحيح من قبل المستخدمين الجدد، وهناك بعض الأخطاء، يتم تحديثه باستمرار

انقر نقرًا مزدوجًا على الملف لبدء الاستخدام (يحتاج إصدار سطح المكتب أيضًا إلى تكوين، يتم تكوينه داخل البرنامج)

【إذا كان إصدار غير سطح المكتب، أي ملف الإصدار الذي لا يحمل كلمة desktop انظر هنا】
إصدار غير سطح المكتب هو الإصدار الأول، التكوين أكثر تعقيدًا، ولكنه مستقر، كما أنه مناسب للنشر على الخادم، لأنه سيقدم واجهة مستخدم عبر الويب

في المجلد، أنشئ مجلدًا باسم config، ثم في مجلد config أنشئ ملفًا باسم config.toml، انسخ محتوى ملف config-example.toml الموجود في دليل config واملأه في config.toml، واملأ معلومات التكوين الخاصة بك وفقًا للتعليقات.
انقر نقرًا مزدوجًا، أو نفذ الملف القابل للتنفيذ في الطرفية، لبدء الخدمة
افتح المتصفح، أدخل http://127.0.0.1:8888، وابدأ الاستخدام (استبدل 8888 بالمنفذ الذي قمت بملئه في ملف التكوين)

إلى: مستخدمي macOS

【إذا كان إصدار سطح المكتب، أي ملف الإصدار الذي يحمل كلمة desktop انظر هنا】
حاليًا، بسبب مشاكل في التوقيع، لا يمكن حزم إصدار سطح المكتب ليعمل بنقرة مزدوجة مباشرة أو تثبيت dmg، تحتاج إلى الوثوق بالتطبيق يدويًا، الطريقة كالتالي:

افتح الملف القابل للتنفيذ في الطرفية (افترض أن اسم الملف هو KlicStudio_1.0.0_desktop_macOS_arm64) في الدليل
نفذ الأوامر التالية بالتتابع:

sudo xattr -cr ./KlicStudio_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KlicStudio_1.0.0_desktop_macOS_arm64 
./KlicStudio_1.0.0_desktop_macOS_arm64

【إذا كان إصدار غير سطح المكتب، أي ملف الإصدار الذي لا يحمل كلمة desktop انظر هنا】
لم يتم توقيع هذا البرنامج، لذلك عند تشغيله على macOS، بعد إكمال تكوين الملفات في "الخطوات الأساسية"، تحتاج أيضًا إلى الوثوق بالتطبيق يدويًا، الطريقة كالتالي:

افتح الملف القابل للتنفيذ في الطرفية (افترض أن اسم الملف هو KlicStudio_1.0.0_macOS_arm64) في الدليل

نفذ الأوامر التالية بالتتابع:

 sudo xattr -rd com.apple.quarantine ./KlicStudio_1.0.0_macOS_arm64
 sudo chmod +x ./KlicStudio_1.0.0_macOS_arm64
 ./KlicStudio_1.0.0_macOS_arm64

لبدء الخدمة

نشر Docker

يدعم هذا المشروع نشر Docker، يرجى الرجوع إلى إرشادات نشر Docker

إرشادات تكوين الكوكيز (غير إلزامية)

إذا واجهت مشكلة في تنزيل الفيديو

يرجى الرجوع إلى إرشادات تكوين الكوكيز لتكوين معلومات الكوكيز الخاصة بك.

مساعدة التكوين (يجب قراءتها)

أسرع وأسهل طريقة للتكوين:

املأ transcribe.provider.name بـ openai، بحيث تحتاج فقط إلى ملء كتلة transcribe.openai وكتلة تكوين النموذج الكبير llm لتتمكن من ترجمة الترجمة. (يمكن ملء app.proxy وmodel وopenai.base_url حسب الحاجة)

طريقة تكوين استخدام نموذج التعرف على الصوت المحلي (توازن بين التكلفة والسرعة والجودة)

املأ transcribe.provider.name بـ fasterwhisper، واملأ transcribe.fasterwhisper.model بـ large-v2، ثم املأ llm بتكوين النموذج الكبير، وستقوم النماذج المحلية بالتثبيت والتنزيل تلقائيًا. (مثل app.proxy وopenai.base_url كما هو موضح أعلاه)

تحويل النص إلى صوت (TTS) هو اختياري، منطق التكوين مشابه لما سبق، املأ tts.provider.name، ثم املأ الكتل المقابلة تحت tts، يمكن ملء رموز الصوت في واجهة المستخدم وفقًا لوثائق المزود المختار (توجد عناوين الوثائق في قسم الأسئلة الشائعة أدناه). قد يتكرر ملء ak وsk من Alibaba Cloud، وذلك لضمان وضوح هيكل التكوين.
ملاحظة: عند استخدام استنساخ الصوت، يدعم tts فقط اختيار aliyun.

للحصول على AccessKey وBucket وAppKey من Alibaba Cloud، يرجى قراءة：إرشادات تكوين Alibaba Cloud

يرجى فهم أن المهمة = التعرف على الصوت + ترجمة النموذج الكبير + خدمة الصوت (TTS وما إلى ذلك، اختيارية)، وهذا سيساعدك في فهم ملف التكوين بشكل أفضل.

الأسئلة الشائعة

يرجى الانتقال إلى الأسئلة الشائعة

معايير المساهمة

لا تقم بتقديم ملفات غير مفيدة، مثل .vscode و.idea، يرجى استخدام .gitignore للتصفية
لا تقم بتقديم config.toml، بل استخدم config-example.toml للتقديم

اتصل بنا

انضم إلى مجموعة QQ الخاصة بنا، للإجابة على الأسئلة: 754069680
تابع حسابات وسائل التواصل الاجتماعي الخاصة بنا، Bilibili، حيث نشارك محتوى عالي الجودة في مجال التكنولوجيا الذكية يوميًا

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Files

README.md

README.md

أداة ترجمة الفيديو والصوت باستخدام الذكاء الاصطناعي

مقدمة المشروع (جرب النسخة عبر الإنترنت الآن!)

الميزات والوظائف الرئيسية:

عرض النتائج

ترجمة الترجمة

الصوت

عمودي

🔍 دعم خدمات التعرف على الصوت

🚀 دعم نماذج اللغة الكبيرة

🎤 دعم تحويل النص إلى صوت (TTS)

دعم اللغات

معاينة الواجهة

🚀 البدء السريع

الخطوات الأساسية

إلى: مستخدمي macOS

نشر Docker

إرشادات تكوين الكوكيز (غير إلزامية)

مساعدة التكوين (يجب قراءتها)

الأسئلة الشائعة

معايير المساهمة

اتصل بنا

تاريخ النجوم

Collapse file tree

Files

README.md

Latest commit

History

README.md

File metadata and controls

أداة ترجمة الفيديو والصوت باستخدام الذكاء الاصطناعي

مقدمة المشروع (جرب النسخة عبر الإنترنت الآن!)

الميزات والوظائف الرئيسية:

عرض النتائج

ترجمة الترجمة

الصوت

عمودي

🔍 دعم خدمات التعرف على الصوت

🚀 دعم نماذج اللغة الكبيرة

🎤 دعم تحويل النص إلى صوت (TTS)

دعم اللغات

معاينة الواجهة

🚀 البدء السريع

الخطوات الأساسية

إلى: مستخدمي macOS

نشر Docker

إرشادات تكوين الكوكيز (غير إلزامية)

مساعدة التكوين (يجب قراءتها)

الأسئلة الشائعة

معايير المساهمة

اتصل بنا

تاريخ النجوم