WIKIDOCS ANALYSIS BOARD

위키독스 분석 보드 — 2026-06-26

아침에 흩어져 오던 책별 분석 알림을 하나로 묶었습니다. 적용할 것과 개선할 것만 먼저 확인합니다.

2분석 책
3바로 적용
7개선 적용
5보류/스킵

수집 상태

batch 4.2시간 전 정상

Must Learning with R (개정판)

book_id 4315 · 챕터 154

데이터 분석의 본질은 통계학의 연장선이며, 도메인 이해와 전처리가 분석의 80~90%를 차지한다 — R 입문서이지만 언어를 떠난 데이터 사고방식 입문서다.

이 책은 2018~2020년 작성된 R 입문서로, 형님의 Python 기반 130+ 에이전트 시스템에 직접 적용할 코드는 하나도 없다. 그러나 Ch1의 '데이터 분석 = 통계학의 연장선, 도메인 이해가 먼저다'라는 철학과 Ch5의 '분포 확인 후 결측치 처리' 방법론은 형님의 명시적 약점(데이터 분석·통계 인프라 부족, 정량 평가 체계 약함)을 정확히 찌른다. adopt 0개, improve 5개, skip 3개 — R 코드는 버리고 사고방식만 Python 생태계로 번역 수입하는 게 정답이다.

ADOPT 0IMPROVE 5SKIP 3
  1. IMPROVE 데이터 분석 프로세스 원칙 (도메인 이해 → 전처리 → 모델링)
    ~/.hermes/skills/data-analysis-protocol/ 신규 스킬 생성. 책의 '데이터 분석 프로세스 5단계'를 Python 생태계로 번역: ①도메인 컨텍스트 로딩 ②변수 타입 진단(str/describe) ③분포 확인(hist/boxplot) ④전처리 파이프라인 ⑤모델링. 이 스킬을 realestate-analyzer·running-daily·thesis-analysis가 공통 import하도록 개선.
  2. IMPROVE 사전확률·사후확률·가능도 개념과 조건부 확률 추론
    obsidian vault에 '베이즈 추론 멘탈모델' 노트 신규 생성 → keywords 등록 → advisory-board나 super-brain 호출 시 이 멘탈모델을 참조하도록 SKILL.md 패치. 단기 실행 가능하며, 실제 정량 모델은 별도 데이터 파이프라인이 필요하다.
  3. IMPROVE 결측치 처리 방법론 (분포 기반·중위수 vs 평균)
    HARNESS_DOMAIN_REGISTRY.md에 '데이터 전처리 공통 원칙' 섹션 추가: ①분포 확인(히스토그램+박스플롯) ②결측치 비율이 5% 미만이면 제거, 초과면 중위수 대체 ③이상치는 IQR 1.5배 기준. agent_registry.py에 'preprocessing' 키워드로 검색 가능하게 등록.
  4. IMPROVE 이상치 탐지 (IQR 박스플롯 기반)
    위 '데이터 전처리 공통 원칙' 스킬에 이상치 결정 트리 추가: ①IQR×1.5 초과 → 이상치 라벨링 ②데이터 오류(예: 러닝 페이스 1:00/km) → 제거 ③실제 극단값(예: 초고가 부동산 거래) → 별도 세그먼트 분석 ④분석 목적이 평균 기반이면 log변환.
  5. IMPROVE 통계학 기초와 데이터 사고력 훈련 (수학적 사고)
    self-improvement-scout SKILL.md에 '데이터 사고력 훈련' 섹션 추가: 매주 running-daily FIT 데이터를 ①기술통계(평균·분산) ②시계열(트렌드) ③분포 비교(박스플롯) 세 관점에서 해석하는 루틴. 형님 약점인 '정량 평가 체계' 보완과 직결된다.

[[하네스 엔지니어링]] — HARNESS ENGINEERING AGENTIC [[AI]] CODING

book_id 19712 · 챕터 216

AI 에이전트 간의 물리적 컨텍스트 격리와 환경 레벨 강제를 통해 '자기 평가 편향'을 구조적으로 차단하는 Claude Code 플러그인을 직접 만들어보는 457,793자 규모의 실습형 런북이다.

adopt 후보 3개(GAN 3역할 격리·TDD L1/L2/L3 스펙트럼·Feature Contract 4Phase 협상), improve 2개(Hook 파일 차단·Wiki Planner-only 읽기), skip 2개(git worktree·DDD Strategic) — 핵심 가치는 'AI 에이전트 간 물리적 격리와 검증 스펙트럼의 구체적 구현 패턴을 형님 시스템에 포팅할 수 있는 설계도'다. 이 책은 형님 시스템의 '약점'으로 자평한 코드 테스트 인프라와 동시 작업 충돌 관리 문제를 정확히 찌르고 있다. 다만 qr-lab CLI라는 데모 프로젝트에 지나치게 묶여 있어, 형님의 11개 도메인(블로그·임장·러닝·사주 등)에 바로 적용하려면 상당한 번역 작업이 필요하다.

ADOPT 3IMPROVE 2SKIP 2
  1. ADOPT GAN 3역할 물리적 컨텍스트 격리 (Planner / Generator / Evaluator)
    ~/.hermes/profiles/default/skills/에 gan-code-review라는 새 Skill 생성. SKILL.md에 planner/generator/evaluator 3개 Subagent 정의 추가. hooks/scripts/에 write-guard.sh 포팅 — BLOCK_R1(Planner가 validation.md 쓰기 차단), BLOCK_R3(Generator가 plan.md 읽기 차단) 패턴을 harness_integration.py의 PostToolUse hook에 통합.
  2. ADOPT TDD L1·L2·L3 검증 스펙트럼 + pytest 기반 구체 구현
    tests/ 디렉토리 구조 신설: tests/unit/ (pytest 단위 테스트), tests/integration/ (실제 agent 호출 stdout 캡처 비교). pipeline_observer.py에 L2 검증 로직 추가 — agent 실행 후 stdout을 기대 출력 파일과 diff. ~/.hermes/profiles/default/skills/debug-critic/SKILL.md에 'L1/L2/L3 채점 단계' 추가.
  3. IMPROVE Hook의 per-file·per-subagent write 차단 (7라벨 체계)
    ~/.hermes/profiles/default/hooks/scripts/에 write-guard.sh 신설. 기존 PostToolUse hook의 settings.json에 PreToolUse 블록 추가 — Write/Edit 도구 호출 시 호출 주체(subagent명)와 대상 파일 경로를 검사. BLOCK_OWNER 라벨만 우선 구현: agent_registry.py에 agent별 소유 파일 목록 필드 추가.
  4. IMPROVE LLM Wiki Planner-only 읽기 + 5+2 슬롯 구조
    옵시디언 vault에 '읽기 전용 에이전트' 개념 도입: SPoE 키워드 사전에 agent_scope 필드 추가. 특정 agent는 특정 노트만 읽도록 제한하는 agent_scope.py 작성. 모든 agent에 모든 노트를 열어두는 현재 정책을 유지하되, Planner 역할 agent(예: blog-writer-naver)에는 wiki 전용 읽기 슬롯을 분리.
  5. ADOPT Feature Contract 4Phase 협상 (Evaluator-Generator)
    debug-critic Skill을 확장해 contract-phase 모드 추가. SKILL.md에 4Phase 시퀀스 정의: Phase1(validation 초안)·Phase2(이의 제기)·Phase3(수용/거부)·Phase4(audit 기록). 블로그 작성 워크플로우(blog-writer-naver)에 시범 적용 — 평가자가 '합격 기준'을 먼저 쓰고, 작성자가 이의 제기.