WIKIDOCS ANALYSIS BOARD

위키독스 분석 보드 — 2026-06-24

아침에 흩어져 오던 책별 분석 알림을 하나로 묶었습니다. 적용할 것과 개선할 것만 먼저 확인합니다.

1분석 책
1바로 적용
2개선 적용
5보류/스킵

수집 상태

batch 4.4시간 전 정상

[[위키독스]]

book_id 20 · 챕터 80

위키독스 플랫폼 자체의 사용 설명서 — 계정 생성, 마크다운 편집, 광고 수익, 전자책 출판, GitHub 연동까지 저자를 위한 운영 매뉴얼이다.

이 책은 위키독스 플랫폼 사용 설명서다. 형님 시스템은 이미 이 플랫폼을 수집 대상으로 자동화했기 때문에, 플랫폼 사용법 자체에서 얻을 건 적다. adopt 1개(조건부 렌더링 태그), improve 2개(GitHub clone 경로·TOC 계층 저장), skip 5개 — 핵심 가치는 '위키독스 플랫폼의 내부 동작 방식을 이해함으로써 크롤러 개선 포인트를 찾은 것'이다.

ADOPT 1IMPROVE 2SKIP 5
  1. IMPROVE GitHub 연동 기반 책 수집 (웹훅 push → 자동 동기화 → repo clone)
    `templates/agents/wikidocs_crawler.py`에 `_is_github_linked(book_id)` 판별 함수 추가 → GitHub 연동 책이면 `git clone`으로 수집하는 fallback 경로 구현. `wikidocs_state.json`에 `source` 필드 추가(crawl vs clone). batch 실행 시 GitHub 책은 5초 내 완료, 기존 4~5분 대비 60배 단축.
  2. ADOPT PDF_EXCLUDE / PDF_INCLUDE 조건부 렌더링 태그
    `templates/agents/`에 `conditional_render.py` 신규 생성. 마크다운 내 `<!--PDF_EXCLUDE-->...<!--/PDF_EXCLUDE-->` 태그를 파싱하여 `target=web`이면 include, `target=pdf`면 strip하는 간단한 전처리기. `blog-writer-naver` 발행 전에 `target=web`으로 전처리, 향후 전자책 생성 시 `target=pdf`로 전처리.
  3. IMPROVE TOC.md 기반 계층형 목차 자동 파싱 (들여쓰기 depth → 부모-자식 관계)
    `wikidocs_crawler.py` 저장 단계에서 책 메타데이터로 `_toc.md` 파일을 함께 생성하도록 수정. 챕터의 부모-자식 관계를 들여쓰기로 표현. 옵시디언 vault 내 `위키독스 원문/<book_id>_<제목>/` 폴더에 `_TOC.md`로 저장. analyzer가 이 TOC를 참조해 챕터 중요도 평가.