ποΈ μκ°μ₯μ μΈ λ³΄ν μμ¨μ± ν₯μμ μν AI 보쑰 μμ€ν (AI Walking Assistant) μ΄ νλ‘μ νΈλ μκ°μ₯μ μΈμ μμ νκ³ λ 립μ μΈ λ³΄νμ λκΈ° μν΄ κ°λ°λ μ€μκ° μν κ°μ§ λ° μμ± μλ΄ μμ€ν μ λλ€. μΉ΄λ©λΌ μμμ ν΅ν΄ μ λ°©μ κ°μ²΄λ₯Ό νμ§νκ³ , 거리λ₯Ό μΈ‘μ νλ©°, μν©μ λΆμνμ¬ μ¬μ©μμκ² μμ±(TTS)μΌλ‘ μλ΄ν©λλ€. π μ£Όμ κΈ°λ₯ (Key Features)
- μ€μκ° κ°μ²΄ νμ§ (Object Detection): β¦ YOLOv5λ₯Ό μ¬μ©νμ¬ μ¬λ, μ°¨λ(μλμ°¨, λ²μ€, νΈλ), μμ κ±°, μ νΈλ± λ±μ μ€μκ°μΌλ‘ μΈμν©λλ€.
- 거리 μΆμ (Depth Estimation): β¦ MiDaS λͺ¨λΈμ ν΅ν΄ λ¨μΌ μΉ΄λ©λΌ(Webcam)λ§μΌλ‘ κ°μ²΄μμ μλμ 거리λ₯Ό μΈ‘μ νμ¬ "λ§€μ° κ°κΉμ/μ£Όμ/μμ " λ¨κ³λ₯Ό νλ³ν©λλ€.
- λμ μ΄λ λ°©ν₯ λΆμ (Movement Analysis): β¦ μ΄μ νλ μκ³Όμ μ’ν λ³ν(Ξx)λ₯Ό λΆμνμ¬ μ°¨λμ΄λ μ¬λμ΄ λ€κ°μ€λμ§, λ©μ΄μ§λμ§, μ’μ°λ‘ μ΄λνλμ§λ₯Ό νλ¨ν©λλ€.
- μ νΈλ± μμ μΈμ (Traffic Light Recognition): β¦ YOLOκ° νμ§ν μ νΈλ± μμμ RGB νκ· κ°μ λΆμνλ μκ³ λ¦¬μ¦(Rule-based)μ μ μ©νμ¬ λΉ¨κ°λΆ/μ΄λ‘λΆμ μ νν ꡬλΆν©λλ€.
- μμ± μλ΄ λ° μ μ΄ (TTS & STT): β¦ gTTSλ₯Ό ν΅ν΄ "μ λ°©μ μ°¨λμ΄ μ κ·Ό μ€μ λλ€"μ κ°μ κ²½κ³ λ©μμ§λ₯Ό μΆλ ₯ν©λλ€. β¦ μ¬μ©μμ μμ± λͺ λ Ή("μ’ λ£ν΄", "μν© μλ €μ€")μΌλ‘ μμ€ν μ μ μ΄ν μ μμ΅λλ€. π οΈ κΈ°μ μ€ν (Tech Stack) β’ Language: Python 3.8+ β’ Computer Vision: OpenCV, PyTorch β’ AI Models: β¦ YOLOv5 (Object Detection) β¦ MiDaS (Monocular Depth Estimation) β’ Audio Interface: β¦ gTTS (Text-to-Speech) β¦ SpeechRecognition (Speech-to-Text) β¦ Pyaudio, Playsound