La forma más rápida de obtener la transcripción de un video de YouTube en 2026 es un botón que el propio YouTube incluye pero nunca anuncia — Mostrar transcripción, escondido a dos clics debajo de cada video en escritorio. La mayoría de los espectadores no sabe que existe, y por eso toda la primera página de los resultados de búsqueda da por hecho que necesitas pagar una extensión o pegar una URL en un sitio de scraping cualquiera. Casi nunca lo necesitas. Esta guía cubre cuatro métodos, los más rápidos primero: el panel nativo de transcripción de YouTube, las extensiones de navegador para trabajo por lotes, los sitios web que aceptan URL para exportaciones rápidas y Whisper para los casos en los que los subtítulos del propio YouTube faltan o son malos. Esta pieza vive dentro de la guía completa de transcripción de video — el pilar cubre cualquier fuente de video; este artículo es la parte concreta del visor de YouTube.
Método 1 — el botón nativo “Mostrar transcripción” de YouTube
La mayoría de los espectadores nunca lo nota. El botón Mostrar transcripción está en YouTube de escritorio desde 2021, y siempre ha hecho exactamente lo que cualquier scraper de terceros promete — renderizar la pista de subtítulos completa como texto copiable con marcas de tiempo, gratis, sin cuenta y sin instalar nada. En Chrome, Safari, Firefox o Edge de escritorio, todo el flujo son cuatro pasos y se hace en menos de diez segundos.
-
Abre el video en YouTube en escritorio
La función solo está en escritorio. En móvil, abre la URL en un navegador y solicita el sitio de escritorio.
-
Haz clic en el menú de tres puntos debajo del video
También etiquetado como 'Más acciones'. Está a la derecha de los botones Compartir y Guardar.
-
Selecciona 'Mostrar transcripción'
Se abre un panel en el lado derecho. Cada línea de subtítulo aparece con su marca de tiempo.
-
Copia, exporta o quita las marcas de tiempo
Selecciona todo para copiar. Pulsa el menú de tres puntos en el panel de transcripción para ocultar las marcas de tiempo y dejar prosa limpia.
El panel funciona en cualquier video donde existan subtítulos — ya sean los subidos por el creador o la pista autogenerada por YouTube. Eso cubre la inmensa mayoría de la plataforma. No funciona en videos con los subtítulos explícitamente desactivados por el autor, en contenido con restricción de edad que no puedes abrir sin iniciar sesión, ni en directos antes de que se procesen como subtítulos bajo demanda.
En móvil, el botón no existe en la app nativa de YouTube a fecha de 2026. La solución alternativa es abrir la URL del video en Safari o Chrome y pedir el sitio de escritorio desde el menú del navegador — entonces el menú de tres puntos queda disponible y Mostrar transcripción funciona igual.
Una nota legal, breve porque esto es una guía de transcripción y no de derecho. Usar una transcripción para notas personales, investigación, citas o periodismo encaja por lo general en el uso justo en la mayoría de jurisdicciones. Republicar la transcripción completa del video de otra persona como si fuera contenido propio no es uso justo — cita la fuente, enlaza el original y entrecomilla solo lo necesario.
Método 2 — extensiones de navegador para trabajo por lotes
Si sacas transcripciones de muchos videos de manera habitual — investigación para un podcast, análisis de competencia, revisión bibliográfica — el botón nativo se traduce en muchos clics. Cuatro extensiones de navegador dominan el panorama de 2026.
- Tactiq — la más pulida. Captura transcripciones de YouTube, Zoom y Google Meet, añade resúmenes con IA y elementos de acción, exporta a DOCX, TXT o un resumen pegado.
- YouTube Summary with ChatGPT — extensión gratuita de Chrome que inyecta una barra lateral con la transcripción junto al video y un botón “Summarize with ChatGPT” de un solo clic.
- Glasp — basada en resaltados. Marcas pasajes mientras miras; la extensión exporta un documento limpio listo para investigación.
- Eightify — orientada a resúmenes con IA. Más lenta para exportar texto crudo, más fuerte si quieres puntos clave en lugar del guion completo.
Las cuatro tienen niveles gratuitos que cubren scraping básico de un solo video. Los planes de pago añaden exportación por lotes, videos más largos y resúmenes con IA más profundos — vale la pena a partir de unos 10 videos por semana. Si tú mismo publicas videos en YouTube y prefieres la mirada del lado del creador, el flujo de transcripción de YouTube desde el lado del creador cubre los SaaS de paste-URL, las exportaciones desde YouTube Studio y la matriz multi-método para canales propios.
Método 3 — sitios web paste-URL (pegar URL)
Un puñado de sitios web monopropósito aceptan una URL de YouTube y devuelven una transcripción en texto plano — youtubetranscript.com, downsub.com, la versión web de Tactiq, notegpt.io/youtube-transcript-generator. El flujo son tres campos y un copia-pega:
- Pega la URL del video.
- Haz clic en el botón de exportar.
- Copia el texto resultante o descárgalo como TXT o SRT.
Lo útil que conviene saber sobre esta categoría: por debajo, todos ellos consumen la misma pista de subtítulos que muestra el botón Mostrar transcripción. No usan un modelo aparte; están scrapeando los propios subtítulos de YouTube y volviéndolos a renderizar en una maquetación más limpia, normalmente con un botón de descarga en lugar de copia-pega. La precisión es idéntica a la del Método 1 porque la fuente es idéntica.
La ventaja que añaden estos sitios es un pequeño retoque de UX — sin la búsqueda del menú de tres puntos, tipografía más limpia, descarga SRT para subtítulos — más un modo por lotes ligero en los planes de pago. La contrapartida es que estás subiendo la URL a un tercero cuyo modelo de negocio es scraping financiado con publicidad. Para temas de investigación sensibles, el Método 1 mantiene todo dentro de Google.
Método 4 — Whisper cuando los subtítulos de YouTube faltan o son malos
Los tres métodos anteriores dependen de que la pista de subtítulos del propio YouTube esté presente y sea utilizable. Para videos con los subtítulos desactivados, para audio con acentos marcados donde los subtítulos automáticos destrozan una palabra de cada dos, o para podcasts donde la atribución del hablante importa, Whisper transcribe el audio directamente y supera a los subtítulos automáticos en la plataforma de YouTube en aproximadamente cinco a ocho puntos de precisión — para la franja completa, consulta los benchmarks realistas de precisión en el pilar.
El patrón, comprimido:
- Usa
yt-dlppara extraer la pista solo de audio desde la URL pública del video (yt-dlp -x --audio-format mp3 <URL>). - Pasa el MP3 resultante por OpenAI Whisper, ya sea el paquete oficial de Python ejecutándose localmente o una llamada a la API de Whisper.
- Recibes una transcripción en la franja del 94-97% de precisión, con diarización de hablantes como añadido opcional vía
whisper-diarizationo Pyannote.
Coste: gratis si ejecutas Whisper localmente en tu portátil — un video de 20 minutos se transcribe en unos tres minutos en Apple Silicon o en una GPU Nvidia. Coste API: aproximadamente 0,006 $ por minuto vía OpenAI. Es excesivo para un solo episodio de Tim Ferriss, vale la pena para un lote de investigación de 30 videos donde los subtítulos nativos de YouTube no son fiables.
Los modelos de la familia Whisper también son los que dan vida a la mayoría de los SaaS de transcripción dedicados del mercado — si prefieres saltarte la configuración por CLI, el mismo pipeline va envuelto dentro de herramientas como TurboScribe o Happy Scribe. El flujo de transcripción de YouTube desde el lado del creador recorre la opción SaaS paste-URL al completo.
¿Qué método encaja con cada caso de uso?
| Feature | Mejor método | Por qué | Coste de tiempo |
|---|---|---|---|
| Nota personal rápida sobre un video | Método 1 (botón nativo) | Gratis, diez segundos, cero instalación | 10-30 seg |
| Cita de blog o entrecomillado directo | Método 1 + revisión de homófonos | Misma fuente que cualquier scraper, con corrección manual para precisión | 2-5 min |
| Lote de investigación de más de 10 videos | Método 2 (extensión) o Método 4 (CLI) | Extensión por velocidad, CLI por bulk scripting | 2-5 min de setup, después automatizado |
| Subtítulos desactivados o acento muy marcado | Método 4 (Whisper) | Funciona donde la pista de subtítulos de YouTube no llega; 5-8 puntos más de precisión | 3-5 min / video de 20 min |
Preguntas frecuentes
¿Por qué no encuentro el botón Mostrar transcripción en YouTube móvil? YouTube ofrece el panel de transcripción solo en la web de escritorio. En móvil, abre la URL del video en Safari o Chrome y solicita el sitio de escritorio desde el menú del navegador — el menú de tres puntos pasa a estar disponible y aparece “Mostrar transcripción”. Las apps móviles nativas siguen sin exponer la función a fecha de 2026.
¿Puedo conseguir la transcripción de un video de YouTube con los subtítulos desactivados? No con el Método 1 ni el Método 2 — ambos dependen de la pista de subtítulos del propio YouTube. El Método 4 (Whisper vía yt-dlp) transcribe el audio directamente y funciona independientemente de la disponibilidad de subtítulos, siempre que el video sea público. Para videos detrás de muro de pago o privados, ningún método gratuito funciona sin acceso autorizado.
¿Es legal copiar la transcripción de un video de YouTube? Para notas personales, investigación, citas o periodismo, en general aplica el uso justo en la mayoría de jurisdicciones — una transcripción es derivada del discurso original, no una copia íntegra de la producción de video del creador. Republicar una transcripción completa a escala como contenido propio sí es infracción de copyright. Cita la fuente y enlaza el original siempre que entrecomilles.
¿Cómo de precisos son los subtítulos automáticos de YouTube? Aproximadamente entre el 82-90% en inglés limpio, bajando al 70-80% en audio con acento o con varios hablantes. La calidad de los subtítulos también varía por canal — los creadores que suben sus propios subtítulos empujan la precisión por encima del 98%. Para la franja completa de precisión entre métodos de transcripción, consulta los benchmarks realistas de precisión en la guía pilar.
¿Cuál es la forma más rápida de conseguir transcripciones de más de 20 videos de YouTube a la vez? Una extensión de navegador como Tactiq o YouTube Summary with ChatGPT se encarga del scraping por lotes de los subtítulos existentes. Para mayor precisión en un lote, un script en CLI con yt-dlp + Whisper procesa 20 videos durante la noche en un portátil de consumo. Los SaaS de plan gratuito limitan los lotes a 1-5 videos antes de exigir un plan de pago. Consulta los planes de ReelQuote para flujos por lotes incluidos.
Adónde ir desde aquí
Para la mayoría de los espectadores, el Método 1 es la respuesta — es gratis, rápido y la fuente que cualquier scraper de pago está usando por debajo igualmente. Recurre al Método 2 cuando el volumen crezca, al Método 3 cuando quieras una UI de descarga más limpia, y al Método 4 cuando los propios subtítulos de YouTube no den la talla. Si estás al otro lado de la cámara — publicando videos en YouTube y queriendo que las transcripciones se conviertan en gráficas de citas o publicaciones sociales — el flujo de gráficas de citas gestiona transcripción y diseño aguas abajo en una sola pasada, y el método 1: subtítulos nativos de plataforma en la guía completa de transcripción de video encaja este flujo de YouTube dentro de la matriz fuente-a-método completa.