โปรแกรมแปลงไฟล์ PDF เป็น Word Document พร้อม GUI ที่ใช้งานง่าย รองรับทั้งไฟล์ PDF ปกติและไฟล์ PDF ที่เป็นภาพ (OCR)
- 🔄 แปลงไฟล์ PDF เป็น Word - รองรับทั้งข้อความและรูปภาพ
- 🔍 OCR Support - แปลงไฟล์ PDF ที่เป็นภาพด้วย Tesseract OCR
- 🌐 รองรับหลายภาษา - ภาษาไทย, อังกฤษ และภาษาอื่นๆ
- 🎨 UI ทันสมัย - Dark Theme ที่สวยงามและใช้งานง่าย
- ⚡ ประสิทธิภาพสูง - ประมวลผลได้เร็วและแม่นยำ
- 🔧 ใช้งานง่าย - เพียงคลิกเลือกไฟล์และแปลง
หน้าจอหลักของโปรแกรม PDF to Word Converter
- Python 3.8+
- Windows 10/11
- Tesseract OCR (สำหรับการแปลงไฟล์ภาพ)
- Poppler (สำหรับการแปลง PDF เป็นภาพ)
-
Clone Repository
git clone https://github.com/gamekittituh/pdf-to-word-converter.git cd pdf-to-word-converter -
ติดตั้ง Python Dependencies
pip install -r requirements.txt
-
ติดตั้ง Tesseract OCR
- ดาวน์โหลดจาก: https://github.com/UB-Mannheim/tesseract/wiki
- ติดตั้งและเพิ่มไปยัง PATH
- เพิ่มภาษาไทย:
tessdata/tha.traineddata
-
ติดตั้ง Poppler
# สำหรับ Windows winget install poppler # หรือดาวน์โหลดจาก # https://github.com/oschwartz10612/poppler-windows
python main.py- เลือกไฟล์ PDF - คลิกปุ่ม "📄 เลือกไฟล์ PDF"
- เลือกตำแหน่งบันทึก - คลิกปุ่ม "🔄 แปลงเป็น Word"
- รอการแปลง - โปรแกรมจะแปลงไฟล์อัตโนมัติ
- เสร็จสิ้น - ไฟล์ Word จะถูกบันทึกในตำแหน่งที่เลือก
pdf-to-word-converter/
├── main.py # ไฟล์หลักของโปรแกรม
├── requirements.txt # รายการ Python packages
├── README.md # เอกสารคู่มือ
├── LICENSE # ไฟล์ MIT License
├── screenshot.png # ภาพตัวอย่างของโปรแกรม
├── .gitignore # ไฟล์ที่ไม่ต้องติดตาม
└── .vscode/
└── tasks.json # VS Code tasks
pdf2docx==0.5.8 # แปลง PDF เป็น Word
pdf2image==1.17.0 # แปลง PDF เป็นภาพ
pytesseract==0.3.13 # OCR Engine
python-docx==1.2.0 # จัดการไฟล์ Word
Pillow==11.3.0 # ประมวลผลภาพ- Dark Theme - ธีมสีเข้มที่สบายตา
- Responsive Design - ปรับขนาดได้ตามหน้าต่าง
- Modern Icons - ใช้ Emoji และไอคอนสวยงาม
- Hover Effects - ปุ่มมีเอฟเฟกต์เมื่อเอาเมาส์ไปชี้
- Progress Animation - แสดงสถานะการแปลงแบบเรียลไทม์
- เพิ่มการรองรับไฟล์หลายไฟล์พร้อมกัน
- เพิ่มการเลือกภาษาสำหรับ OCR
- เพิ่มการแปลงแบบ Batch Processing
- เพิ่มการตั้งค่าคุณภาพการแปลง
- เพิ่มการส่งออกเป็นรูปแบบอื่น (TXT, HTML)
-
"Unable to get page count"
- สาเหตุ: Poppler ไม่ได้ติดตั้งหรือไม่อยู่ใน PATH
- แก้ไข: ติดตั้ง Poppler และรีสตาร์ท terminal
-
"Tesseract not found"
- สาเหตุ: Tesseract ไม่ได้ติดตั้งหรือไม่อยู่ใน PATH
- แก้ไข: ติดตั้ง Tesseract และเพิ่มไปยัง PATH
-
การแปลงภาษาไทยไม่ถูกต้อง
- สาเหตุ: ไม่มีไฟล์ภาษาไทยสำหรับ Tesseract
- แก้ไข: ดาวน์โหลด
tha.traineddataใส่ใน tessdata
เรายินดีรับการมีส่วนร่วมจากนักพัฒนาทุกคน!
- Fork repository นี้
- สร้าง feature branch (
git checkout -b feature/amazing-feature) - Commit การเปลี่ยนแปลง (
git commit -m 'Add amazing feature') - Push ไปยัง branch (
git push origin feature/amazing-feature) - สร้าง Pull Request
โปรเจคนี้ใช้ license MIT - ดูรายละเอียดในไฟล์ LICENSE
- [GameKittituh] - Initial work - GitHub Profile
- pdf2docx - สำหรับการแปลง PDF เป็น Word
- Tesseract OCR - สำหรับการอ่านข้อความจากภาพ
- pdf2image - สำหรับการแปลง PDF เป็นภาพ
⭐ ถ้าโปรเจคนี้มีประโยชน์ อย่าลืมให้ Star ด้วยนะครับ!
