forked from docling-project/docling
-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Description
프로젝트
공통
대상 페이지
전처리기 생성 페이지
상세 설명
Title
Description
모델 경로들을 facade 코드 하드코딩 대신 설정값(config)으로 분리 필요.
요구사항
- 설정값은 min i/o 상의 yaml 형태로 저장하고 facade 에서는 특정 config 를 읽어들이는 형태
- 특정 모델 path 는 다운로드 된 기본 값을 가짐
예)
-
HybridChunker.tokenizer- 기존:
"sentence-transformers/all-MiniLM-L6-v2" - 변경: 설정값 기반 경로 사용 (예:
DOC_PARSER_TOKENIZER_PATH), 기본값은/models/doc_parser_models/sentence-transformers-all-MiniLM-L6-v2
- 기존:
-
DocumentProcessor.pipe_line_options.artifacts_path- 기존:
Path("/models/")하드코딩 - 변경: 설정값 기반 경로 사용 (예:
DOC_PARSER_ARTIFACTS_PATH), 기본값은/models/
- 기존:
-
설정 미지정 시, 현재 동작과 동일한 기본값으로 backward compatibility 유지
체크리스트
- 도커 이미지 기준 기본 설정만으로 새로운 버전의 클러스터에서 정상 동작 확인
- 외부 네트워크 차단 환경에서 HF 다운로드 없이 로컬 모델 경로만으로 처리되는지 검증
Metadata
Metadata
Assignees
Labels
No labels