Skip to content

enrichment: 제품 name matching 정확도 및 한글/영문 혼합 처리 #4

@thxforall

Description

@thxforall

문제

Product Name Matching 오탐 가능성

  • _enrich_products_from_solutions()에서 2-pass 매칭:
    • Pass 1: 정확 매칭 → substring 매칭
    • Pass 2: 미매칭 제품에 남은 솔루션 순서대로 할당
  • 한글/영문 혼합 제품명에서 substring match 오탐 가능 (예: "립" → "립스틱", "립밤", "립글로스" 모두 매칭)
  • Pass 2의 순서 기반 할당은 관련성 보장 없음

관련 파일

  • src/editorial_ai/services/editorial_service.py (_enrich_products_from_solutions)

제안

  • fuzzy matching 또는 임베딩 기반 유사도 매칭 검토
  • Pass 2 fallback에 카테고리 기반 필터링 추가
  • 매칭 결과 로깅 강화 (이미 일부 추가됨, 추가 개선 가능)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions