데이터로 읽는 학교, 분석으로 돕는 교사
📊 데이터로 읽는 학교, 분석으로 돕는 교사
안녕하세요, ‘고교 삼국시대’ 세미나의 고구려입니다.
오늘은 학교 현장에서 생성되는 방대한 데이터를 어떻게 관리하고,
이를 통해 교육적 통찰을 얻을 수 있을지에 대한 저의 실험 과정을 공유하겠습니다.
데이터는 거짓말을 하지 않지만, 그 데이터를 의미 있게 만드는 것은 결국 우리의 질문입니다.
📑 목차
- 데이터 수집 인프라 구축: 워크스페이스 분석의 시작
- 클라우드 연동과 파이프라인: 180일의 한계 극복
- 데이터 정제와 마트화: AI가 이해하기 쉬운 구조 만들기
- 결과 활용 및 자동화 모색: 현장 교사 연수와 한계점
1. 데이터 수집 인프라 구축: 워크스페이스 분석의 시작
구글 클라우드와 제미나이(Gemini), 그리고 BigQuery를 활용하여
학교의 다양한 데이터를 끌어오고 분석하는 작업을 시작했습니다.
자동화가 우리에게 어떤 이점을 줄 수 있을지 기대 반, 두려움 반으로 접근했습니다.
우선 우리가 매일 사용하는 클래스룸의 데이터를 체계적으로 관리할 필요가 있었습니다.
현재 클래스룸에 있는 과제와 문서들을 분석하기 위해 데이터 수집을 시작했고,
오픈 코드를 통해 약 96% 정도 수집이 완료된 상태입니다.
수집된 데이터의 양이 생각보다 방대하여, 이를 어떻게 효율적으로 처리할지가 관건이었습니다.
특히 중요한 포인트는 구글 워크스페이스 클라우드에 로그가 180일까지만 저장된다는 점입니다.
누적된 데이터를 장기적으로 분석하려면 반드시
BigQuery 연동 기능을 미리 활성화해 두어야 합니다.
그렇지 않으면 소중한 학교 활동의 기록들이 사라져버릴 수 있기 때문입니다.
실제로 추출한 클래스룸 데이터 원본은 헤더가 엄청나게 많고 복잡하여
그대로 사용하기엔 무리가 있습니다.
따라서 필요한 핵심 정보만을 정제하는 파이프라인 구축이 필수적입니다.
데이터를 다듬는 과정이 분석의 절반 이상을 차지한다고 해도 과언이 아닙니다.
2. 데이터 정제와 마트화: AI가 이해하기 쉬운 구조 만들기
단순히 문서의 텍스트만 가져오는 것이 아닙니다.
학생들의 문서 수정 횟수나 복사 붙여넣기 횟수 같은 정량적인 데이터까지 모두 추출하도록 AI에게 요청했습니다.
이러한 수치들은 학생의 학습 몰입도를 파악하는 아주 중요한 지표가 됩니다.
처리할 데이터의 양이 워낙 방대하다 보니,
AI 에이전트가 스스로 판단하여 PowerShell 기반의 병렬 처리 코드를 생성하고 실행하도록 했습니다.
덕분에 작업 시간이 획기적으로 단축되었고,
수동으로 할 때는 며칠이 걸릴 작업을 단 몇 분 만에 끝낼 수 있었습니다.
여기서 핵심 개념은 바로 **‘데이터 마트(Data Mart)‘**입니다.
원천 데이터를 AI가 즉각적으로 이해하고 꺼내 쓸 수 있도록 중간 테이블 형태로 정비하는 과정입니다.
잘 정리된 데이터 마트는 AI가 더 정확한 판단을 내릴 수 있는 훌륭한 ‘지식 창고’가 됩니다.
로컬 PC에 저장된 CSV 파일은 엑셀에서 한글 인코딩 문제가 발생할 수 있지만,
메모장이나 파이썬 환경의 텍스트 에디터에서는 데이터가 완벽하게 보존됩니다.
교사들이 데이터를 다룰 때 흔히 겪는 기술적 장애물들을
AI를 통해 하나씩 해결해 나가는 과정이 매우 흥미로웠습니다.
3. 결과 활용 및 상세 분석
데이터 안에는 클래스룸 ID와 문서 ID가 모두 매핑되어 있어,
App Script 호출 시 별도의 검색 없이 즉시 활용이 가능합니다.
이러한 구조적 정리는 향후 업무 자동화의 기반이 됩니다.
특히 73원이라는 매우 저렴한 비용으로
대규모 데이터 분석을 수행할 수 있다는 점은 현장 적용 가능성을 시사합니다.
큰 비용 부담 없이도 학교급의 데이터를 클라우드에서 분석할 수 있는 시대가 되었습니다.
학생의 수행평가 참여도를 분석할 때, 교사의 피드백 이후 학생의 수정 과정을 추적하는
‘피드백 루프(Feedback Loop)’ 분석은 과정 중심 평가의 핵심적인 데이터가 됩니다.
학생이 선생님의 조언을 얼마나 수용하고 발전했는지를 숫자로 증명할 수 있습니다.
또한, 구글 드라이브 API를 통해 문서 작성 소요 시간이나 접속 이력을 추적함으로써,
학생들의 실제 학습 패턴을 더욱 정교하게 파악할 수 있습니다.
누가 언제 열심히 참여했는지가 데이터로 명확히 드러납니다.
이러한 분석 결과들은 단순한 통계를 넘어,
교사가 학생 한 명 한 명을 더 깊이 이해하고 적절한 지도를 할 수 있는 든든한 근거가 됩니다.
4. 자동화 모색과 현장의 과제
보안 이슈가 걱정된다면 로컬 AI 서버 환경을 구축하여
데이터를 안전하게 관리하는 대안을 고려해볼 수 있습니다.
학교 내부망 안에서만 작동하는 AI라면 데이터 유출 걱정 없이 활용할 수 있습니다.
정리된 데이터를 기반으로 생활기록부 초안을 자동 생성하는 워크플로우를 준비하고 있으며,
이를 직관적으로 확인할 수 있는 대시보드 솔루션 또한 구상 중입니다.
선생님들의 업무 시간을 획기적으로 줄여줄 것으로 기대합니다.
최근 교내 연수를 통해 이러한 기술을 소개했는데,
많은 선생님들께서 데이터 분석의 필요성에는 공감하셨지만
검은색 터미널 창(CLI)에 대한 심리적 두려움이 크다는 사실을 확인했습니다.
기술은 훌륭하지만, 그것을 사용하는 사람의 마음이 편해야 합니다.
선생님들께는 코드가 아니라 결과와 편리함이 먼저 닿아야 한다는 것을 깨달았습니다.
결국 현장의 확산을 위해서는
안티그래비티와 같이 직관적이고 쉬운 GUI 에이전트가 필수적임을 다시금 느꼈습니다.
교사가 기술의 노예가 아닌, 기술을 부리는 주인이 되는 학교를 꿈꿉니다. 감사합니다.
💬 질의응답 (Q&A)
Q: 토큰 비용이 걱정되는데 학교 계정으로 하는 건가요?
A: 호출 최대량(쿼터) 제한은 있지만 비용 청구는 거의 안 됩니다. 실제로 제가 테스트했을 때 73원 정도의 매우 저렴한 비용이 발생했습니다. 학교급 데이터를 분석하기에 충분히 감당 가능한 수준입니다.
Q: CSV 파일 한글 깨짐 문제는 어떻게 해결하나요?
A: 엑셀의 인코딩 방식 문제일 뿐, 데이터 자체는 안전합니다. 엑셀 대신 메모장이나 전문 텍스트 에디터(VS Code 등)에서 열면 UTF-8 인코딩이 정상 작동하여 한글이 깨지지 않고 잘 보입니다.
🔗 연관 글
- 백제 선생님의 블로그 글: AI 상식의 시대, 무엇을 가르칠 것인가
- 신라 선생님의 블로그 글: AI 디지털 교육의 콘셉트
필진: 고구려
교육학적 관점에서 학생들을 위한 최적의 교육 방식 자체에 관심이 많으며, 이를 현대의 기술과 어떻게 유기적으로 연결할지 고민합니다.