Skip to content

Feature/crawl skincare#17

Merged
jjunier merged 7 commits into
mainfrom
feature/crawl-skincare
Aug 3, 2025
Merged

Feature/crawl skincare#17
jjunier merged 7 commits into
mainfrom
feature/crawl-skincare

Conversation

@sulsikan

Copy link
Copy Markdown
Contributor

📌 PR 개요

해당 PR이 포함하는 주요 변경 사항 또는 목적을 간략히 설명해주세요.

  • 일부 제품 reviewdetail 파싱 누락 부분 수정

✅ PR 체크리스트

코드 품질과 협업 효율을 위해 병합 전에 다음의 질문을 기반으로 점검해주세요.

  • 코드가 잘 실행돼요 (에러 없어요)
  • 내 변경사항이 다른 파트에 영향을 주지 않아요 (가능하면!)
  • 팀에서 정한 코드 스타일과 커밋 컨벤션을 잘 따랐어요
  • 관련 이슈나 설명이 필요한 내용은 아래에 적었어요

✏️ 주요 변경 사항

핵심 변경들을 자유롭게 적어주세요.

  • 일부 제품 reviewdetail 파싱 누락 부분 수정
    • 리뷰 요약 제품이 있는 상품임에도 불구하고 Airflow DAG 데이터 수집 실행 로그에서 수집 누락된 제품을 발견
    • HTML 코드를 확인한 결과 dl 태그의 class 네임이 다르다는 것을 발견
    • 다른 제품들은 poll_type2 type3 클래스를 사용하고 있어 for dl in poll_div.select("dl.poll_type2.type3"): 코드로 리뷰를 수집했지만, 샴푸 제품들은 대부분 poll_type2만 사용하고 있어 해당 코드로 수집이 되지 않음. 해당 부분 코드 수정.

🧪 📷 스크린샷 or 테스트 결과 (선택)

이해에 도움될 스크린샷을 첨부해주세요.

image

📎 관련 이슈

관련된 이슈 번호를 적어주세요. (예: #12, JIRA-23 등)

💬 리뷰어에게 하고 싶은 말 (선택)

설명이 필요한 부분, 고민했던 점, 리뷰 요청 포인트 등 자유롭게 적어주세요.

@sulsikan sulsikan requested a review from jjunier as a code owner July 26, 2025 14:05
@jjunier jjunier added the enhancement New feature or request label Aug 3, 2025

@jjunier jjunier left a comment

Copy link
Copy Markdown
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

스크린샷 2025-07-23 235345

다음과 같이 일부 제품의 리뷰 상세 사항데이터 수집에서 발생한 파싱 누락 이슈에 대한 적절한 대처인 것 같습니다. 수고하셨습니다.

@jjunier jjunier merged commit 48fc8a1 into main Aug 3, 2025
2 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

enhancement New feature or request

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants