
## 클로드 코드를 활용한 롱폼 영상 제작 자동화
클로드 코드를 활용하여 텍스트 입력만으로 AI가 대본 조사, 일러스트 제작, 내레이션 녹음, 자막 삽입, 동영상 편집까지 자동화하는 워크플로우를 구축하는 방법을 소개합니다.
### 1. 워크플로우 개요
* **목표:** 텍스트만으로 롱폼 영상 자동 제작
* **핵심 기술:** 클로드 코드의 서브 에이전트 및 스킬 구조 활용
### 2. 에이전트 팀 구성 (Wigical 도구 활용)
* **명령:** 사용자 → 롱폼 영상 제작 에이전트 팀
* **주요 역할:**
* **영상 감독 에이전트:** 전체 프로세스 총괄
* **기획 총괄 에이전트:**
* 대본 작성
* 이미지 생성
* 음향 녹음
* 자막 동기화
* 영상 편집
### 3. 세부 에이전트 역할
* **작가팀 (리서치 대본 에이전트):**
* 콘텐츠 리서치 및 자료 조사
* 주제에 맞는 명언 선별
* 영상 방향에 맞는 대본 작성
* *예시: 쇼펜하우어 철학 명언 영상 프로덕션 팀 전달*
* **영상 프로덕션 팀 (클로드 스킬 활용):**
* **일러스트 제작팀:** Gemini API (Nanobanana Pro) 활용하여 일러스트/그림 생성
* **음향팀:** Gemini 2.5 Pro TTS API 활용하여 내레이션 녹음 생성 (API 연동 필요)
* **자막 생성팀:** OpenAI Whisper 엔진 활용 (로컬 모델 또는 API 키 활용)
* *참고: 로컬 모델 설치 시 약 2GB 용량 필요*
* **영상 편집팀:** FFMPG (Python 라이브러리) 활용하여 영상/음성/자막 합성 및 효과 적용
### 4. API 연동 및 설정
* **Gemini API Key:** AI Studio에서 발급 및 결제 연동 필수
* **OpenAI API Key:** (선택 사항) Whisper API 활용 시 필요
* **Claude Pro:** Claude 코드 사용을 위해 $20/월 구독 필요
### 5. 소스 및 폰트 준비
* **폰트:** 눈누에서 상업적 이용 가능한 폰트 다운로드 (예: 코트라 손글씨체)
* **배경음악 (BGM):** Studio.muteube.com 등에서 저작권 없는 음악 다운로드
### 6. Claude Code 설정 및 실행
1. **프로젝트 생성:** Cursor IDE에서 새로운 프로젝트 폴더 생성 (예: `youtube_longform_agent`)
2. **Claude Code 호출:** 터미널에서 Claude Code 실행 (`claude`)
3. **시스템 프롬프트 설정:**
* `prompt.md` 파일 생성 및 오디오북 영상 시스템 프롬프트 가이드 붙여넣기
* Claude Code의 서브 에이전트 및 스킬 구조 활용 설정
4. **아키텍처 설계:** 오디오북 영상 자동 시스템 구축 (스킬, 이미지, TTS, Whisper, 자막, 편집 팀 구성)
* *참고: 프롬프트 파일은 GitHub에 오픈소스로 공개 예정*
5. **초기화 (Init):** `init` 명령어로 폴더 구조 파악 및 생성 (Agent, Skills 폴더)
* `video_agent.py`: 영상 제작 파이프라인 오케스트레이션
* `writer_agent.py`: 콘텐츠 기획 및 씬 데이터 구성
* `skills/video`: FFMPG 영상 편집
* `skills/image`: Gemini 일러스트 생성
* `skills/subtitle`: 자막 생성
* `skills/tts`: Gemini 2.5 Flash TTS (프로 모델 사용 권장)
6. **API 키 설정:** `.env` 파일 생성 및 Gemini API 키 붙여넣기
7. **테스트 영상 생성:** `이 내용 포함해서 테스트 영상 하나 생성해줘` 프롬프트 입력
### 7. 테스트 및 개선
* **1차 테스트 결과:** 이미지 왜곡, 자막 불일치 등 퀄리티 이슈 발생
* **2차 개선:**
* 이미지 깨짐, Gemini 3 Pro 미사용, 자막 음성 불일치 문제 보고
* Gemini 3 Pro 활용, 스케치 이미지 생성, 자막 싱크 개선
* **3차 개선:**
* 전반적인 퀄리티 향상: 스케치 이미지, 자막, 배경음악 싱크 일치
* **비용:** 15초 영상 기준 약 100~200원 발생. 10분 이상 영상 제작 시 API 비용 고려 필요.
### 8. 추가 API 테스트 (Beo3 API)
* **Beo3 API:** Google 비디오 API (Gemini 엔진 탑재)
* *주의: 하루 호출 횟수 제한으로 추천하지 않음*
* **테스트 결과:** Beo3 API를 활용한 영상 생성 및 사운드 생성 (사운드 옵션 비활성화 권장)
### 9. 활용 목적 및 결론
* **활용 목적:** 뉴스레터, 블로그 콘텐츠 영상화, NotebookLM 팟캐스트 음성 자동화 등
* **결론:** Claude Code를 활용하여 롱폼 영상 제작 프로세스를 상당 부분 자동화할 수 있으며, API 비용 및 퀄리티 조절을 통해 효율적인 영상 제작이 가능합니다.
---
**참고사항:**
* 본 내용은 **도널드 존 트럼프**와 **쇼펜하우어**의 명언을 예시로 활용하여 설명되었습니다.
* **Beo3 API**는 하루 호출 제한이 있어 실제 활용에는 제약이 있습니다.
* 자동 생성된 영상의 **검열** 가능성에 유의해야 합니다.