Frame at 0.00s
## 클로드 코드를 활용한 롱폼 영상 제작 자동화 클로드 코드를 활용하여 텍스트 입력만으로 AI가 대본 조사, 일러스트 제작, 내레이션 녹음, 자막 삽입, 동영상 편집까지 자동화하는 워크플로우를 구축하는 방법을 소개합니다. ### 1. 워크플로우 개요 * **목표:** 텍스트만으로 롱폼 영상 자동 제작 * **핵심 기술:** 클로드 코드의 서브 에이전트 및 스킬 구조 활용 ### 2. 에이전트 팀 구성 (Wigical 도구 활용) * **명령:** 사용자 → 롱폼 영상 제작 에이전트 팀 * **주요 역할:** * **영상 감독 에이전트:** 전체 프로세스 총괄 * **기획 총괄 에이전트:** * 대본 작성 * 이미지 생성 * 음향 녹음 * 자막 동기화 * 영상 편집 ### 3. 세부 에이전트 역할 * **작가팀 (리서치 대본 에이전트):** * 콘텐츠 리서치 및 자료 조사 * 주제에 맞는 명언 선별 * 영상 방향에 맞는 대본 작성 * *예시: 쇼펜하우어 철학 명언 영상 프로덕션 팀 전달* * **영상 프로덕션 팀 (클로드 스킬 활용):** * **일러스트 제작팀:** Gemini API (Nanobanana Pro) 활용하여 일러스트/그림 생성 * **음향팀:** Gemini 2.5 Pro TTS API 활용하여 내레이션 녹음 생성 (API 연동 필요) * **자막 생성팀:** OpenAI Whisper 엔진 활용 (로컬 모델 또는 API 키 활용) * *참고: 로컬 모델 설치 시 약 2GB 용량 필요* * **영상 편집팀:** FFMPG (Python 라이브러리) 활용하여 영상/음성/자막 합성 및 효과 적용 ### 4. API 연동 및 설정 * **Gemini API Key:** AI Studio에서 발급 및 결제 연동 필수 * **OpenAI API Key:** (선택 사항) Whisper API 활용 시 필요 * **Claude Pro:** Claude 코드 사용을 위해 $20/월 구독 필요 ### 5. 소스 및 폰트 준비 * **폰트:** 눈누에서 상업적 이용 가능한 폰트 다운로드 (예: 코트라 손글씨체) * **배경음악 (BGM):** Studio.muteube.com 등에서 저작권 없는 음악 다운로드 ### 6. Claude Code 설정 및 실행 1. **프로젝트 생성:** Cursor IDE에서 새로운 프로젝트 폴더 생성 (예: `youtube_longform_agent`) 2. **Claude Code 호출:** 터미널에서 Claude Code 실행 (`claude`) 3. **시스템 프롬프트 설정:** * `prompt.md` 파일 생성 및 오디오북 영상 시스템 프롬프트 가이드 붙여넣기 * Claude Code의 서브 에이전트 및 스킬 구조 활용 설정 4. **아키텍처 설계:** 오디오북 영상 자동 시스템 구축 (스킬, 이미지, TTS, Whisper, 자막, 편집 팀 구성) * *참고: 프롬프트 파일은 GitHub에 오픈소스로 공개 예정* 5. **초기화 (Init):** `init` 명령어로 폴더 구조 파악 및 생성 (Agent, Skills 폴더) * `video_agent.py`: 영상 제작 파이프라인 오케스트레이션 * `writer_agent.py`: 콘텐츠 기획 및 씬 데이터 구성 * `skills/video`: FFMPG 영상 편집 * `skills/image`: Gemini 일러스트 생성 * `skills/subtitle`: 자막 생성 * `skills/tts`: Gemini 2.5 Flash TTS (프로 모델 사용 권장) 6. **API 키 설정:** `.env` 파일 생성 및 Gemini API 키 붙여넣기 7. **테스트 영상 생성:** `이 내용 포함해서 테스트 영상 하나 생성해줘` 프롬프트 입력 ### 7. 테스트 및 개선 * **1차 테스트 결과:** 이미지 왜곡, 자막 불일치 등 퀄리티 이슈 발생 * **2차 개선:** * 이미지 깨짐, Gemini 3 Pro 미사용, 자막 음성 불일치 문제 보고 * Gemini 3 Pro 활용, 스케치 이미지 생성, 자막 싱크 개선 * **3차 개선:** * 전반적인 퀄리티 향상: 스케치 이미지, 자막, 배경음악 싱크 일치 * **비용:** 15초 영상 기준 약 100~200원 발생. 10분 이상 영상 제작 시 API 비용 고려 필요. ### 8. 추가 API 테스트 (Beo3 API) * **Beo3 API:** Google 비디오 API (Gemini 엔진 탑재) * *주의: 하루 호출 횟수 제한으로 추천하지 않음* * **테스트 결과:** Beo3 API를 활용한 영상 생성 및 사운드 생성 (사운드 옵션 비활성화 권장) ### 9. 활용 목적 및 결론 * **활용 목적:** 뉴스레터, 블로그 콘텐츠 영상화, NotebookLM 팟캐스트 음성 자동화 등 * **결론:** Claude Code를 활용하여 롱폼 영상 제작 프로세스를 상당 부분 자동화할 수 있으며, API 비용 및 퀄리티 조절을 통해 효율적인 영상 제작이 가능합니다. --- **참고사항:** * 본 내용은 **도널드 존 트럼프**와 **쇼펜하우어**의 명언을 예시로 활용하여 설명되었습니다. * **Beo3 API**는 하루 호출 제한이 있어 실제 활용에는 제약이 있습니다. * 자동 생성된 영상의 **검열** 가능성에 유의해야 합니다.