Loading...
Loading...
Produktionsredo system för automatiserad YouTube-kanalövervakning och videotranskribering. Använder OpenAI Whisper och WhisperX för tal-till-text med talaridentifiering, med Python-backend, FastAPI REST API och Next.js-dashboard.
Innehållsskapare, forskare och företag behöver övervaka YouTube-kanaler och extrahera korrekta transkriberingar från videor i stor skala. Manuell transkribering är tidskrävande, dyrt och saknar möjlighet till talaridentifiering.
Vi byggde YTVideoTranscriber som en omfattande automatiserad pipeline som övervakar YouTube-kanaler via RSS-flöden, laddar ner ljud med yt-dlp och transkriberar innehåll med OpenAI Whisper och WhisperX för talaridentifiering. Systemet inkluderar en fullständig dashboard för hantering och sökning.
YTVideoTranscriber följer en trelagersarkitektur med tydlig separation mellan CLI/orkestreringslagret, REST API och webbdashboard. Kärnpipelinen hanterar videoupptäckt, ljudextraktion och AI-driven transkribering med talaridentifiering.
Central koordinator som hanterar hela transkriberingspipen från upptäckt till output
Python, Click CLI, Tillståndsmaskin för videobearbetning
Upptäcker nya videor från prenumererade kanaler med RSS-flöden och yt-dlp
RSS-parsning, yt-dlp-integration, Duplicatdetektering
AI-motor som använder Whisper för STT och WhisperX för alignment och talaridentifiering
OpenAI Whisper, WhisperX, GPU-acceleration, Flera modellstorlekar
Fullständigt API med 25+ endpoints för kanalhantering, transkriberingssstyrning och sökning
FastAPI, SQLAlchemy ORM, SQLite/PostgreSQL, Bakgrundsuppgifter
Kärninnovationen är en sofistikerad flerstegspipeline som kombinerar videoupptäckt, ljudextraktion, taligenkänning och talaridentifiering till ett sömlöst automatiserat arbetsflöde.
Stöd för alla Whisper-modellstorlekar (tiny, base, small, medium, large) - avväg precision mot hastighet efter behov
Exakta tidsstämplar på ordnivå genom forced alignment, möjliggör precisa undertexter
PyAnnote-driven talaridentifiering märker varje segment med SPEAKER_00, SPEAKER_01, etc.
Videor går genom tillstånd: PENDING → DOWNLOADING → TRANSCRIBING → COMPLETED med full felåterhämtning
Sök över alla transkriberingar för att hitta specifikt innehåll, talare eller ämnen direkt
YTVideoTranscriber är ett produktionsredo system med omfattande verktyg för automatiserad YouTube-transkribering i stor skala.