모델은 추론하고 코드를 제안할 수 있지만, 저장소를 읽고 명령을 실행하며 실패를 다시 관찰하지 못하면 실제 업무가 아닙니다. Agent Harness는 모델을 도구, 상태, 권한, 테스트와 연결해 답변을 검증 가능한 작업 흐름으로 바꾸는 실행 계층입니다.
Harness가 더하는 것
원시 모델은 텍스트를 예측합니다. Harness는 파일 시스템, 터미널, 브라우저, API, 승인 규칙을 좁은 어댑터로 열고, 각 행동의 로그와 결과를 다음 판단에 되돌립니다. 그래서 팀은 “좋은 답변”이 아니라 재현 가능한 변경, 테스트 결과, 남은 리스크를 받습니다.
Tools
파일 · 셸 · 브라우저
State
Diff · 로그 · 메모리
Gates
테스트 · 정책 · 승인
Harness가 없을 때 생기는 병목
- 관찰 부족. 패키지 버전, 잠금 파일, 실행 중인 서버, 사용자 수정 사항을 보지 못해 그럴듯하지만 틀린 패치를 냅니다.
- 권한 경계 부족. 쓰기, 설치, 네트워크 호출, 배포는 위험도가 다르므로 읽기와 같은 방식으로 열 수 없습니다.
- 복구 루프 부족. 실패한 테스트와 충돌 로그가 다음 단계로 들어가지 않으면 에이전트는 같은 실수를 반복합니다.
구성요소 결정 매트릭스
실무 실행 루프
- 목표, 범위, 완료 기준을 작업 계약으로 고정합니다.
- 관련 코드, 터미널 출력, 문서, Git 상태를 먼저 읽습니다.
- 가장 작은 유효 변경을 고르고 필요한 도구만 엽니다.
- 패치와 명령 결과를 체크포인트로 남깁니다.
- 집중 테스트 후 공용 계약이 바뀐 경우 더 넓게 검증합니다.
- 최종 Diff, 실패, 미검증 영역을 사람에게 보고합니다.
인용 가능한 기준: 실행 로그, 명령 종료 코드, 승인 경계가 없으면 데모입니다. iOS 빌드, Safari 자동화, Xcode 아카이브가 들어오면 실제 macOS 상태가 필요합니다. Agent Harness는 추론을 모델에 맡기고, 반복 가능한 실행은 안정적인 워커에 맡길 때 가장 강합니다.
왜 원격 Mac mini M4인가
글로벌 서비스를 만드는 팀은 로컬 노트북보다 고정된 Apple Silicon 워커가 유리합니다. Xcode, Homebrew, Node, CocoaPods, Safari 설정을 한 노드에 묶으면 에이전트 실행 결과가 흔들리지 않고, 해외 사용자 대상 회귀 테스트도 지역별로 나누기 쉽습니다.
- 성능: M4 또는 M4 Pro 베어메탈에서 가상화 손실 없이 빌드합니다.
- 확장: 에이전트, CI, 리뷰 레인을 월 단위로 분리합니다.
- 통제: SSH/VNC 접근, 로그, 비용을 운영 지표로 관리합니다.
핵심은 단순합니다. 모델은 판단 엔진이고 Harness는 실행 시스템입니다. 실제 일은 권한, 기록, 테스트, 안정적인 Mac 워커가 함께 있을 때 완성됩니다.
Agent Harness · Mac 실행 워커
당신의 에이전트에 안정적인 Mac mini M4를 연결하세요
Xcode 빌드, Safari 테스트, CI 검증, Agent Harness 실행 루프를 전용 Mac에서 운영하세요. 월 단위로 시작하고 필요할 때 지역과 사양을 확장할 수 있습니다.