🔬 PhD 레벨 리서치를 몇 초 만에 처리해 주는 오픈소스 AI 에이전트 'Feynman'. 주제만 입력하면 논문·레포·문서·웹에서 증거를 모으고, 시뮬레이션 피어 리뷰를 돌리고, 페이퍼 스타일 초안을 쓰고, 모든 인용을 검증해서 죽은 링크까지 걸러주는 4개 에이전트 시스템이다. 대학원생이나 연구자에게 유용할 듯? (링크)
🔮Daniel Kokotajlo가 2021년 ChatGPT가 등장하기도 전에 쓴 'What 2026 Looks Like' 예측이 소름 돋게 들어맞고 있다고 함. 에이전트, AI 어시스턴트 등의 기술 발전을 심지어 연도까지 거의 정확하게 맞추었다고... 그가 예측한 다음 시나리오가 궁금하다면 인터뷰 전문을 읽어보자 (링크)
🧩 우리나라의 대표 알고리즘 문제 풀이 사이트 백준이 16년 만에 서비스를 종료한다는 안타까운 소식... 아무래도 AI로 인한 영향이 있지 않을까? 다행히도 완전히 사라지기보다는, 문제만이라도 다시 볼 수 있는 형태로 돌아올 수 있도록 고민 중이시라고 한다. (링크)
🍎 제미나이의 macOS 전용 데스크톱 앱이 출시되었다. 특히 화면의 맥락을 읽고 답변해 주는 '화면 공유' 기능이 유용할 듯? (링크)
🦴 Caveman이라는 Claude Code 스킬이 화제이다. AI한테 원시인처럼 단순하게 말하게 시켜서 토큰 사용량을 65% 줄인다는 것 ㅋㅋ 토큰 때문에 고통받고 있다면 한 번쯤 시도해 보심이..? (링크)

🔼 AI 개발 패러다임의 변화 (출처)

#하네스 엔지니어링

바이브 코딩에 이어 요즘 AI 업계에 유행하는 용어가 있어요. 바로 하네스 엔지니어링(Harness Engineering)인데요. 오늘은 하네스 엔지니어링이 무엇이고, 사람들이 이를 어떻게 활용하고 있는지 사례와 함께 알아보겠습니다.

🤷 하네스가 뭐임?
하네스는 원래 말🐎을 부리는 데에 쓰는 기구를 뜻합니다. 말이 제멋대로 뛰어다니지 않게 고삐를 쥐듯, AI가 내가 원하는 방향으로 일하도록 구조적으로 제어한다는 맥락에서 이러한 이름이 붙었어요.

하네스 엔지니어링은 AI 에이전트의 두 가지 고질적인 약점을 해결하기 위한 접근이에요.

🫠 컨텍스트 붕괴: 작업이 길어질수록 일관성이 무너져요. 컨텍스트가 한계에 다다르면 완성도와 상관없이 서둘러 마무리하려 하죠.
🪞 자기 평가 실패: 자기가 만든 결과물을 과대평가하는 경향이 있어요. 특히 주관적인 영역인 디자인에서 이 단점이 크게 부각돼요.

🔼 "일본의 벚꽃 축제 웹사이트를 만들어줘" 프롬프트를 입력했을 때 (출처)

많은 기업이 하네스 엔지니어링을 도입해 실제 효과를 검증하고 있어요.

Anthropic: 단일 에이전트와 멀티 에이전트 하네스에 같은 프롬프트를 입력해 비교하는 실험을 했어요. 단일 에이전트가 만든 앱은 핵심 기능이 구현되지 않았던 반면, 하네스는 (비용이 20배 이상 들었지만) 처음부터 끝까지 동작하는 앱을 만들어냈다고 해요.
LangChain: 같은 모델(GPT-5.2-Codex)에 하네스만 교체해 Terminal Bench 2.0 순위를 30위권 밖에서 5위까지 끌어올렸어요.
OpenAI: 엔지니어들이 100만 줄 코드베이스를 완성하는 동안 대부분의 시간을 하네스 설계에 쏟았다고 해요.

🔧 주목할 만한 프로젝트들
바이브 코딩의 정의가 모호하듯, 하네스도 특정 기술을 가리키기보다는 AI의 작업 환경 자체를 설계한다는 관점으로 널리 쓰이고 있어요. 이 관점에서 유명 개발자와 기업들이 자신들만의 워크플로우를 활발히 공유하고 있는데요. 그중 주목할 만한 네 가지를 골라봤어요.

(1) gstack: YC CEO Garry Tan이 공개한 에이전트 스킬 팩으로, AI를 역할별 전문가 팀으로 나누어 운영하는 구조예요. 23개 스킬이 계획→리뷰→테스트→배포 순서로 동작해요.
(2) Ouroboros: "AI가 제대로 작동하지 않는 이유는 요청이 명확하지 않기 때문"이라는 관점에서 접근해요. 에이전트에게 바로 코드를 짜라고 하는 대신, 소크라테스식 질문을 거듭해 요청의 모호함을 먼저 제거하는 방식으로 작동합니다.

🔼 GitHub Stars 8만 1천 개를 돌파한 Hermes Agent

(3) Hermes Agent: Nous Research가 만든 자가 성장형 에이전트예요. 복잡한 작업을 마칠 때마다 그 과정을 재사용 가능한 스킬 문서로 자동 추출해요. 추출된 스킬은 다음 작업에서 다시 개선되고, 채널이 달라도 기억과 스킬이 이어져요. 쓸수록 에이전트 스스로 진화하도록 설계되었어요.
(4) LLM Wiki: Andrej Karpathy가 공개한 지식 관리 패턴이에요. 질문할 때마다 문서를 처음부터 검색하는 기존 RAG 방식과 달리, 원본 문서를 마크다운 위키에 정리해 두고, 이를 참고하게 하여 점차 지식을 축적해 나가는 방식을 사용해요. AI를 구조적으로 다룬다는 하네스 개념을 코딩이 아닌 지식 관리에 적용한 사례죠.

🧐 중요한 건 결국...
하네스는 갑자기 등장한 새로운 개념이 아니에요. 프롬프트를 잘 쓰는 단계에서 컨텍스트를 잘 구성하는 단계로, 그리고 에이전트의 작업 환경 자체를 설계하는 단계로 진화해 온 흐름의 연장선이에요.

Anthropic이 강조했듯, 하네스는 가장 단순한 구조부터 시작해야 해요. 남이 만든 하네스를 통째로 가져오기보다, 내 워크플로우를 먼저 파악하고, 필요한 것들만 하나씩 붙여 사용하는 것을 추천드려요. 언제나 그렇듯, 필요가 우선이고 도구는 그다음이에요. 그리고 무엇보다... 여러분의 토큰은 소중하니까요! 😭

👉 하네스를 사용하고 계신가요? 후기와 의견이 궁금해요! (클릭)

해당 뉴스레터 전체를 읽고싶다면?

📌 뉴스레터 전문 읽기

뉴스레터 구독은?

📌 뉴스레터 구독하기

글쓰기

노마드코더 이벤트[EVENT] AI 부터 1인 개발까지, 1:1 맞춤 설계 받기!

# interview