로컬 에이전트 구축과 학교 시스템 리디자인
🪄 로컬 에이전트 구축과 학교 시스템 리디자인
안녕하세요, 신라입니다.
지난 수행평가 파이프라인 발표에 이어, 오늘 저는 아주 가슴 벅찬 두 가지 실제적 현장 진화 지점을 들고 동료 선생님들을 찾아왔습니다. 이틀 전 정보실에 도착한 고성능 워크스테이션 서버인 ‘DGX Spark’ 초기 세팅을 메타적으로 정교하게 마친 이야기, 그리고 이를 기반으로 실제 학교 방송 스피커 장비와 에이전트 구글 챗봇 인터페이스를 연결해 성공한 하드웨어 물리 제어 실증 사례를 나누고자 합니다.
📑 목차
- DGX Spark 초기 세팅: 클로드를 통한 메타 설치 여정
- 방송 하드웨어 물리 연동: 에이전트 명령으로 퍼지는 스피커 방송
- 코드 인텔리전스: 텍스트 출력물에서 자율 행동 프로토콜로의 진화
- 경로의 리디자인: 꼬일 대로 꼬인 한글과 엑셀 데이터 통일
1. DGX Spark 초기 세팅: 클로드를 통한 메타 설치 여정
오늘 발표의 메인 타이틀은 **‘2026.06.06. 고교삼국: 1. DGX Spark 활용방안 탐색, 2. 플로우 개발&공유 프로젝트’**입니다. 저희 동아리와 교사 연구회가 함께 다질 올 하반기 로드맵의 초석이기도 합니다.
첫 번째 큰 축은 이틀 전 정보실에 안착한 엔비디아(Nvidia)의 고성능 소형 AI 연산 서버인 ‘DGX Spark’ 워크스테이션의 유용한 활용방안을 모색하는 작업이었습니다. 막강한 로컬 GPU 파워를 학교 안으로 안전하게 끌어오는 모험의 시작입니다.
서버 부팅 직후 만난 첫 모니터 화면입니다. Nvidia 공식 build 가이드에 따라 시스템 초기 환경 세팅을 진행하려 했으나, 리눅스 서버 상에서 한글 폰트가 부재하고 한글 입력기가 설정되지 않은 문제, 그리고 필수적인 도커(Docker) GPU 가속 라이브러리가 미충족되는 등 터미널 초기 설치 장벽이 예상보다 높았습니다.
이 설치 장벽을 돌파하고자, 저는 로컬에 코딩 강점이 높은 클로드(Claude) API 모듈을 올렸습니다. 도커 에러 코드 로그를 던지며 “자동으로 환경 변수를 정비해 설치하는 bash 스크립트를 짜서 실행해줘”라고 역위임하고, 가벼운 설정 질문은 제미나이(Gemini) 윈도우 창으로 병행하여 던져가며 완벽하게 초기 세팅을 마무리했습니다.
세팅이 끝난 후 이 고가의 컴퓨팅 파워를 교내에 활용하기 위한 2가지 노선을 수립했습니다. GPU 가속 자원을 계정별로 분할하여 인공지능 탐구반과 수학 동아리 학생들에게 가속 권한을 공유해 주는 방식, 그리고 로컬 LLM을 기반으로 에이전트를 폐쇄 환경에서 완전히 사설 구동하여 민감한 학교 데이터를 완벽하게 보호하는 보안 방식입니다.
2. 방송 하드웨어 물리 연동: 에이전트 명령으로 퍼지는 스피커 방송
서버 세팅 직후, 저는 방송부 학생에게 도움을 청해 아주 흥미로운 하드웨어 제어 테스트를 계획했습니다. 학교 방송실에 있는 메인 컴퓨터와 구글 챗 메신저 상에 연동되어 상주하는 ‘헤르메스 에이전트’의 백엔드 API 포트 채널을 유선 케이블과 네트워크 규칙으로 안전하게 묶어주는 세팅 작업이었습니다.
안정화 세팅이 끝난 첫날, 방송부 학생과 함께 교실 현장 실증 테스트를 단행했습니다. 제가 338호 교실에서 수업을 진행하는 동안, 방송부 학생도 338호 교실에 함께 와서 테스트 과정을 지켜보았습니다. 방송부 학생이 교실 안에서 구글 챗의 헤르메스 에이전트 창에 다음과 같이 테스트 지시를 입력했습니다.
“338호실에 ‘에이전트 테스트입니다’ 라고 한국어 여성 소리 12로 차임벨 있게 출력해줘”
지시가 입력되자 불과 4초 만에 저희가 함께 서 있던 338호실 천장 스피커에서 고운 차임 음과 함께 해당 TTS 음성 방송이 완벽하게 송출되었습니다! 교실 스피커로 실제 목소리가 문제없이 흘러나오는 것을 양쪽 모두 현장에서 직접 귀로 확인하며 테스트 성공의 기쁨을 나누었습니다.
이 물리 연동의 실제 결과 화면입니다. 구글 챗 메신저 창에 에이전트를 연동해 두고 명령어를 던지면, 338호실 스피커 채널에 여성 목소리와 차임벨 송출 작업이 성공적으로 완료되었다는 피드백 로그가 챗봇으로 즉각 실시간 리턴되는 정형화된 구조를 볼 수 있습니다.
이것이 완전히 자리를 잡는다면 학교 방송부 업무의 인수인계나 일상 행정이 획기적으로 변합니다. “모의고사 세팅으로 방송 채널을 돌려줘”, “매일 혹은 매주 바뀌는 학급 급식 순서를 점심시간에 자동으로 방송해줘” 등의 텍스트 한 문장만 스케줄러(Cron)에 올려두면 교사의 물리적 개입 없이 완벽한 방송실 원격 제어가 가능해집니다.
두 번째 핵심 아젠다는 **‘플로우 개발 & 공유 프로젝트’**의 출범입니다. 학교 안에서 교사가 수행하는 파편화된 개별 단위 업무들을 하나의 거대한 단일 자동화 통로로 엮어내는 기획입니다.
3. 코드 인텔리전스: 텍스트 출력물에서 자율 행동 프로토콜로의 진화
이러한 오케스트레이션이 가능해진 것은 소프트웨어의 본질이 근본적으로 도약했기 때문입니다. 최근 소개된 ‘코드 인텔리전스 시대의 논문’에 따르면, 코드는 이제 사람이 짜주는 수동적인 결과물이 아닌 지능을 가진 자율 행동 프로토콜로 진화하고 있습니다.
소프트웨어의 거대한 진화 이정표입니다. 펀치 카드로 원시 코드를 한 줄씩 적던 1960년대 수동 코딩의 시대에서 컴파일러와 통합개발환경의 보조를 받던 시대를 지나, 이제는 다중 에이전트가 코드와 터미널 환경을 스스로 제어하고 주도하여 문제를 자율 해결하는 2025년 이후의 ‘AI 자율화 시대’에 본격 진입했습니다.
즉, 코드는 더 이상 화면에 텍스트를 출력하는 정적 결과물(Code as Output)에 머물지 않습니다. 모델이 직접 리포지토리를 탐색하고, 런타임 에러를 분석하며, 가상 샌드박스 내부를 주도적으로 조작하여 결과에 피드백을 주는 일련의 행동 인터페이스(Code as Protocol)로 그 격이 완전히 달라졌습니다.
범용 에이전트가 갖춘 3대 축은 도구를 호출하는 상호작용 프로토콜(MCP), 코드 구조로 복잡한 논리를 풀어나가는 논리 인지 능력(Thinking in Code), 운영체제(OS) 자체를 핸들링하는 환경 제어 인터페이스(Computer-Use)입니다. 이들이 조화롭게 작동할 때 하드웨어와 에이전트의 완전 결합이 이루어집니다.
이것이 에이전틱 OS가 그리는 미래 생태계의 청사진입니다. 인간은 디렉터(Director)로서 모호한 비즈니스 목표만 결정하고, 기획/자율개발/테스트 에이전트 군단들이 백그라운드 무한 루프 속에서 코딩과 에러 버그 픽스를 자율 수행하여 완전한 서비스를 즉각 조립해 냅니다.
4. 경로의 리디자인: 꼬일 대로 꼬인 한글과 엑셀 데이터 통일
이러한 눈부신 도약의 문턱 앞에서, 저는 **‘과연 우리 고등학교 교실과 행정 현장은 무엇을 해야 하는가?’**라며 근원적인 질문을 제기하게 되었습니다. 최신 자동화 기술보다 우리 학교 행정의 비효율적인 체계를 먼저 진단해야 함을 직시했습니다.
학교가 마주한 가장 큰 문제 상황은 너무 빠른 기술의 변화 속도로 빚어지는 교사 간, 학교 간 ‘AI 격차(AI Divide)’ 현상입니다. 1주만 눈을 감았다 뜨면 낡은 사람이 되어 버릴 정도로 담론의 속도가 아득히 빨라 교사 개개인의 노력만으로는 따라잡기 불가능한 한계가 있습니다.
동시에 업무 생산성을 높이기 위해 AI를 도입했더니, 오히려 챙겨야 할 툴과 조율해야 할 프롬프트가 과도하게 많아져서 교사의 뇌가 타버리는 신종 디지털 증후군인 **‘AI 과부하(Brain Fry)‘**가 교직 사회 전반에 발생하고 있습니다. 이는 생산성 도구가 주객전도된 대표적 부작용입니다.
더 뼈아픈 지점은 우리가 한 땀 한 땀 애써 배운 AI 도구 조작 지식의 90%가 6개월 안에 인터페이스 변경이나 기술 소멸로 무용지물이 된다는 사실입니다. 올 초에 밤새워 기획했던 스프레드시트 노드 파이프라인 자동화 지식이 이제는 그냥 AI 챗봇에 한 줄 던지면 해결되는 수준으로 바뀐 것이 대표적입니다.
이 한계 상황을 타개하기 위해 협력과 집단지성, 그리고 업무 양식의 원천적인 공유가 절실해집니다. 개별 교사의 고군분투를 멈추고 시스템적 차원의 대응이 필요한 단계에 이르렀습니다.
그러나 교사 연수를 통해 AI 알고리즘의 작동 원리나 도구들의 잡다한 버튼 클릭 조작법을 가르치는 것은 공허한 리소스 낭비입니다. 기술의 스펙과 도구의 외관은 다음 학기면 다시 완전히 바뀔 것이기 때문입니다.
우리가 공유해야 할 유일한 가치는 교무 현장에서 해야 할 일, 이뤄야 할 골(Goal), 그리고 이를 한 통로로 최적화하여 묶어낸 견고한 ‘워크플로우(Workflow)’ 자체의 공유입니다. 도구 사용법이 아닌 일의 구조를 가르치고 배포해야 격차를 메울 수 있습니다.
동아리 포트폴리오 관리를 위해 개별 HWP 파일 작성, 인쇄물 수합, 다층적 버전 관리를 전면 폐지한 실제 문서 화면입니다. 모든 행정 파일 셋을 클라우드로 이관하여 수합 낭비와 포맷 충돌을 원천 배제했습니다.
가장 본질적인 개혁은 단순 기기 보급을 뜻하는 디지털 전환이 아닙니다. 꼬일 대로 꼬인 한글 양식과 엑셀 데이터의 불호환성을 깨부수고, 에이전트가 자유롭게 순찰하며 업무를 자동 처리할 수 있게끔 **‘디지털 기반 데이터 경로 재설계(Redesign)‘**를 관철하는 것입니다.
이 유기적인 경로가 다져졌을 때 비로소 개별 작업 단위의 30클릭 이상의 수작업 낭비를 단 하나의 원클릭 ‘통합 플로우 파이프라인’으로 압축하는 도약이 가능해집니다. 에이전트가 막힘없이 다닐 수 있도록 탄탄한 고속도로(경로)를 닦는 과정입니다.
수행평가 설계에서 템플릿 배포, 채점, 피드백, 세특 기록물 생성에 이르는 연쇄 작업 단위를 하나의 플로우로 묶어 교사의 인지적 에너지를 회수하는 것이 핵심 가치입니다. 파편화된 개별 도구를 매번 튜닝하는 낭비를 종식합니다.
나아가 2월 신학기 준비에서 1월 성적 마감으로 엮이는 교실의 시간축에 따라 업무 플로우(수행평가, 수업 준비, 창체 등)를 체계적으로 재배치할 때, 학교 현장은 비로소 행정적 노이즈를 털어내고 학생과의 만남에 온전히 몰입하는 미래 교실로 도약하게 될 것입니다. 12월 릴리즈될 대시보드 시안에 많은 피드백 부탁드립니다. 감사합니다.
💬 질의응답 (Q&A)
Q: 학교 TV 전원을 에이전트로 원격 제어하는 것이 실제로 가능한가요?
A: 현재 단계에서는 꺼진 TV 전원을 켜는 것은 불가능하지만, 켜진 TV를 제어하거나 끄는 것까지는 생각하고 있습니다. 완전히 꺼진 TV 전원을 원격으로 켜려면 라즈베리파이나 아두이노 같은 IoT 장비를 세팅하여 제어해야 할 것입니다. 백제 선생님 말씀대로 TV가 무선망으로 연결되어 있으면 고정 IP 주소를 파악하기 어려워 전통적인 기술로는 켜는 것이 어렵기 때문에, 향후 보조 IoT 장비를 도입하여 확장하는 방안을 고려하고 있습니다.
Q: 방송실 컴퓨터 장비를 에이전트와 연동할 때 장비 호환성이나 보안 문제는 없나요?
A: 학교마다 장비 편차가 큽니다. 다행히 백제 선생님 학교도 최근 컴퓨터 제어 방식으로 장비가 바뀌어 C# 기반으로 설계된 시스템 내부를 분석해 에이전트에 물리는 것이 가능해 보입니다. 저희 학교의 경우 장비 자체에 TTS(Text-to-Speech) 기능이 탑재되어 있어서, 대시보드에 멘트를 치면 자동으로 방송이 나가는 API 형태를 취하고 있습니다. 컴퓨터 소리를 그대로 송출하는 방식이 아니므로 중간에 엉뚱한 오디오가 나가는 방송 사고 위험이나 보안 우려를 차단할 수 있습니다. 다만 비인가자의 접근을 통제하기 위해 헤르메스 에이전트 접근 권한은 담당 교사 등 최소한의 인원에게만 열어두는 보안 규칙을 규정하고 있습니다.
🔗 연관 글
- 고구려 선생님의 블로그 글: AI 채점의 블랙박스와 설명가능한 AI(XAI-ED)
- 백제 선생님의 블로그 글: AI 시대, 효율보다 ‘의미’를 남기는 질문의 힘
- 신라 선생님의 이전 글: Ask Gemini와 평가 플로우의 진화
필진: 신라
교육, 노동, 사회 시스템 전반에 걸친 구조적 변화와 시스템 리터러시에 관심이 많으며, AI가 바꾸는 사회 구조에 대한 통찰을 제공합니다.