위키독스 분석 보드 — 2026-06-26
아침에 흩어져 오던 책별 분석 알림을 하나로 묶었습니다. 적용할 것과 개선할 것만 먼저 확인합니다.
수집 상태
Must Learning with R (개정판)
book_id 4315 · 챕터 154데이터 분석의 본질은 통계학의 연장선이며, 도메인 이해와 전처리가 분석의 80~90%를 차지한다 — R 입문서이지만 언어를 떠난 데이터 사고방식 입문서다.
이 책은 2018~2020년 작성된 R 입문서로, 형님의 Python 기반 130+ 에이전트 시스템에 직접 적용할 코드는 하나도 없다. 그러나 Ch1의 '데이터 분석 = 통계학의 연장선, 도메인 이해가 먼저다'라는 철학과 Ch5의 '분포 확인 후 결측치 처리' 방법론은 형님의 명시적 약점(데이터 분석·통계 인프라 부족, 정량 평가 체계 약함)을 정확히 찌른다. adopt 0개, improve 5개, skip 3개 — R 코드는 버리고 사고방식만 Python 생태계로 번역 수입하는 게 정답이다.
- IMPROVE 데이터 분석 프로세스 원칙 (도메인 이해 → 전처리 → 모델링)
~/.hermes/skills/data-analysis-protocol/ 신규 스킬 생성. 책의 '데이터 분석 프로세스 5단계'를 Python 생태계로 번역: ①도메인 컨텍스트 로딩 ②변수 타입 진단(str/describe) ③분포 확인(hist/boxplot) ④전처리 파이프라인 ⑤모델링. 이 스킬을 realestate-analyzer·running-daily·thesis-analysis가 공통 import하도록 개선. - IMPROVE 사전확률·사후확률·가능도 개념과 조건부 확률 추론
obsidian vault에 '베이즈 추론 멘탈모델' 노트 신규 생성 → keywords 등록 → advisory-board나 super-brain 호출 시 이 멘탈모델을 참조하도록 SKILL.md 패치. 단기 실행 가능하며, 실제 정량 모델은 별도 데이터 파이프라인이 필요하다. - IMPROVE 결측치 처리 방법론 (분포 기반·중위수 vs 평균)
HARNESS_DOMAIN_REGISTRY.md에 '데이터 전처리 공통 원칙' 섹션 추가: ①분포 확인(히스토그램+박스플롯) ②결측치 비율이 5% 미만이면 제거, 초과면 중위수 대체 ③이상치는 IQR 1.5배 기준. agent_registry.py에 'preprocessing' 키워드로 검색 가능하게 등록. - IMPROVE 이상치 탐지 (IQR 박스플롯 기반)
위 '데이터 전처리 공통 원칙' 스킬에 이상치 결정 트리 추가: ①IQR×1.5 초과 → 이상치 라벨링 ②데이터 오류(예: 러닝 페이스 1:00/km) → 제거 ③실제 극단값(예: 초고가 부동산 거래) → 별도 세그먼트 분석 ④분석 목적이 평균 기반이면 log변환. - IMPROVE 통계학 기초와 데이터 사고력 훈련 (수학적 사고)
self-improvement-scout SKILL.md에 '데이터 사고력 훈련' 섹션 추가: 매주 running-daily FIT 데이터를 ①기술통계(평균·분산) ②시계열(트렌드) ③분포 비교(박스플롯) 세 관점에서 해석하는 루틴. 형님 약점인 '정량 평가 체계' 보완과 직결된다.
[[하네스 엔지니어링]] — HARNESS ENGINEERING AGENTIC [[AI]] CODING
book_id 19712 · 챕터 216AI 에이전트 간의 물리적 컨텍스트 격리와 환경 레벨 강제를 통해 '자기 평가 편향'을 구조적으로 차단하는 Claude Code 플러그인을 직접 만들어보는 457,793자 규모의 실습형 런북이다.
adopt 후보 3개(GAN 3역할 격리·TDD L1/L2/L3 스펙트럼·Feature Contract 4Phase 협상), improve 2개(Hook 파일 차단·Wiki Planner-only 읽기), skip 2개(git worktree·DDD Strategic) — 핵심 가치는 'AI 에이전트 간 물리적 격리와 검증 스펙트럼의 구체적 구현 패턴을 형님 시스템에 포팅할 수 있는 설계도'다. 이 책은 형님 시스템의 '약점'으로 자평한 코드 테스트 인프라와 동시 작업 충돌 관리 문제를 정확히 찌르고 있다. 다만 qr-lab CLI라는 데모 프로젝트에 지나치게 묶여 있어, 형님의 11개 도메인(블로그·임장·러닝·사주 등)에 바로 적용하려면 상당한 번역 작업이 필요하다.
- ADOPT GAN 3역할 물리적 컨텍스트 격리 (Planner / Generator / Evaluator)
~/.hermes/profiles/default/skills/에 gan-code-review라는 새 Skill 생성. SKILL.md에 planner/generator/evaluator 3개 Subagent 정의 추가. hooks/scripts/에 write-guard.sh 포팅 — BLOCK_R1(Planner가 validation.md 쓰기 차단), BLOCK_R3(Generator가 plan.md 읽기 차단) 패턴을 harness_integration.py의 PostToolUse hook에 통합. - ADOPT TDD L1·L2·L3 검증 스펙트럼 + pytest 기반 구체 구현
tests/ 디렉토리 구조 신설: tests/unit/ (pytest 단위 테스트), tests/integration/ (실제 agent 호출 stdout 캡처 비교). pipeline_observer.py에 L2 검증 로직 추가 — agent 실행 후 stdout을 기대 출력 파일과 diff. ~/.hermes/profiles/default/skills/debug-critic/SKILL.md에 'L1/L2/L3 채점 단계' 추가. - IMPROVE Hook의 per-file·per-subagent write 차단 (7라벨 체계)
~/.hermes/profiles/default/hooks/scripts/에 write-guard.sh 신설. 기존 PostToolUse hook의 settings.json에 PreToolUse 블록 추가 — Write/Edit 도구 호출 시 호출 주체(subagent명)와 대상 파일 경로를 검사. BLOCK_OWNER 라벨만 우선 구현: agent_registry.py에 agent별 소유 파일 목록 필드 추가. - IMPROVE LLM Wiki Planner-only 읽기 + 5+2 슬롯 구조
옵시디언 vault에 '읽기 전용 에이전트' 개념 도입: SPoE 키워드 사전에 agent_scope 필드 추가. 특정 agent는 특정 노트만 읽도록 제한하는 agent_scope.py 작성. 모든 agent에 모든 노트를 열어두는 현재 정책을 유지하되, Planner 역할 agent(예: blog-writer-naver)에는 wiki 전용 읽기 슬롯을 분리. - ADOPT Feature Contract 4Phase 협상 (Evaluator-Generator)
debug-critic Skill을 확장해 contract-phase 모드 추가. SKILL.md에 4Phase 시퀀스 정의: Phase1(validation 초안)·Phase2(이의 제기)·Phase3(수용/거부)·Phase4(audit 기록). 블로그 작성 워크플로우(blog-writer-naver)에 시범 적용 — 평가자가 '합격 기준'을 먼저 쓰고, 작성자가 이의 제기.