유튜브 영상 콘텐츠를 기반으로 Speech-to-Text 변환 후, LLM 에이전트 기반 전문가 토론 시스템을 통해 실행 가능한 프로젝트 아이디어를 자동으로 도출하는 시스템입니다.
2024.09~11 | 3명
기술 스택
PyTorch,Docker,GitStreamlit,Whisper,OpenCV,yt-dlp
담당 역할
- 팀장 / 토론 시스템 구축 / 컨텐츠 텍스트 추출(Whisper) 부분 구축
프로젝트 흐름
- UI에서 검색어를 통한 유튜브 컨텐츠 검색 후 영상 선택
- 선택된 영상에서 오디오 추출 및 Whisper를 활용한 Speech-to-Text 변환
- 변환된 텍스트를 기반으로 AI 전문가(시장분석가, 프로덕트 매니저, 테크리드, 사업전략가) 토론 시스템 실행
- 3라운드에 걸친 토론 후 결론 정리 및 아이디어 도출
시스템 구성도

실행 화면

토론 결과 예시
