El iPhone puede transcribir un video en tres toques en 2026, siempre que sepas qué función nativa usar. iOS 18 añadió una capa de transcripción a Voice Memos y mantuvo Live Captions en la reproducción a nivel de sistema, lo que cubre la mayoría de necesidades casuales sin descargar nada. Esta guía cubre tres rutas: la ruta nativa en 3 toques, apps de terceros para casos que la nativa no resuelve, y el pipeline de IA si tu objetivo son gráficos de citas en lugar de texto plano. Esta es la porción específica de iPhone de la guía completa de transcripción de video — el pillar cubre la matriz fuente-a-método más amplia si tu flujo combina teléfono con escritorio o fuentes web. La transcripción suele ser la etapa uno — nuestra guía del generador de citas con IA cubre el resto del pipeline.
Método 1 — el flujo nativo de iOS 18 en 3 toques
La ruta más rápida usa Live Captions, una función de accesibilidad que Apple llevó a nivel de sistema en iOS 16 y mejoró en iOS 18. Lee cualquier audio que se reproduzca en el teléfono, video incluido, y muestra una superposición de subtítulos rodante que puedes copiar.
-
Activa Live Captions una vez
Ajustes → Accesibilidad → Live Captions → activa la opción. El modelo de lenguaje en el dispositivo se descarga y funciona sin conexión.
-
Reproduce el video
Ábrelo en Fotos, Safari o cualquier app. Live Captions muestra una caja de subtítulos arrastrable encima de lo que se esté reproduciendo.
-
Toca la caja de subtítulos y pulsa Guardar
En iOS 18 la ventana de subtítulos tiene una acción de guardar que copia la transcripción en curso a Notas.
La precisión ronda el 85-90 % con inglés claro y baja con acentos marcados o ruido. Para clips cortos es suficiente. Voice Memos es la alternativa para audio que ya está en el dispositivo: impórtalo y el panel de transcripción de iOS 18 genera una transcripción buscable mientras la grabación se reproduce.
Cuándo usarlo: videos cortos, un solo hablante en inglés, uso sin conexión. Evítalo para: contenido largo, audio en otros idiomas, varios hablantes, o cualquier cosa que vayas a publicar sin revisión.
Método 2 — apps de iPhone de terceros (cuando el nativo no basta)
El nativo choca contra un muro rápido. Para cualquier cosa que pase de cinco minutos, con varios hablantes o en otro idioma, vale la pena instalar una app. Las tres que importan en 2026:
- Otter.ai — la más fuerte para reuniones y entrevistas, plan gratis de unos 300 minutos al mes, etiquetas de hablante incluidas.
- Rev Voice Recorder — mejor con inglés acentuado, revisión humana opcional, exporta SRT y DOCX.
- Descript Mobile — más lento, pero la mejor opción si vas a editar la transcripción junto al video más adelante.
La precisión se sitúa en el rango del 94-98 % con audio limpio, unos puntos menos con acentos marcados.
-
Comparte el video a la app
Desde Archivos o Fotos, la mayoría de apps aceptan MP4 o M4A directamente.
-
Configura idioma y número de hablantes
Las apps vienen por defecto en inglés. Marca varios hablantes y cambia el idioma si hace falta.
-
Lanza el trabajo
Un video de 10 minutos se transcribe en 30-90 segundos en servicios en la nube.
-
Limpia y exporta
Corrige homófonos y nombres de marca, luego exporta texto plano, SRT, DOCX o JSON.
Si estás sopesando una app de transcripción dedicada frente a una herramienta más amplia, el análisis comparativo de TurboScribe cubre el equilibrio entre transcripción pura y pipelines de reutilización.
Método 3 — pipeline de IA para creadores de contenido
La transcripción rara vez es el destino. Si tu objetivo final son gráficos de citas, clips cortos o texto listo para redes, la ruta de app autónoma añade un paso de diseño que la mayoría de creadores deja a medias. Las herramientas integrales gestionan transcripción, extracción de citas y renderizado gráfico en una sola pasada desde tu iPhone.
El mismo marco aparece en distintas fuentes de video — el artículo hermano sobre cómo transcribir videos de Facebook a texto recorre la división nativo / terceros / IA y la lógica se traslada a las subidas desde iPhone.
Cuándo usarlo: creadores, coaches y podcasters que tratan el video como fuente para output de Instagram o LinkedIn.
¿Qué método deberías usar realmente?
| Escenario | Método recomendado |
|---|---|
| Clip corto, un solo hablante en inglés | Método 1 (Live Captions) |
| Entrevista larga, varios hablantes | Método 2 (Otter o Rev) |
| Audio no inglés o con acento marcado | Método 2 (Rev, o Whisper vía API) |
| El objetivo final son gráficos de citas / redes | Método 3 (pipeline de IA) |
| Nota de voz ya en el dispositivo | Método 1 (transcripción de Voice Memos) |
Errores comunes en transcripción desde iPhone
Confiar en Live Captions con contenido largo. La precisión se desvía pasada la marca de los 5 minutos a medida que el modelo en el dispositivo pierde contexto. Sirve para consulta rápida, arriesgado para cualquier cosa que vayas a publicar.
Subestimar el consumo de batería. Live Captions exige al Neural Engine — una sesión de 30 minutos baja un 15-20 % en un iPhone 14 o anterior. Mantén el teléfono enchufado para trabajos largos.
Ignorar los topes de los planes gratis. Otter limita las grabaciones gratis a unos 40 minutos; Rev limita las exportaciones del plan gratis. Divide los videos largos o cuenta con encontrarte un muro de pago a media tarea.
No volver a conceder permisos tras actualizaciones de iOS. iOS 18 reseteó varios estados de permisos. Si una app falla en silencio, revisa Ajustes → Privacidad y Seguridad → Micrófono antes de reinstalar.
Preguntas frecuentes
¿Puede el iPhone transcribir videos sin internet? Sí. Live Captions (Ajustes → Accesibilidad → Live Captions) funciona en el dispositivo desde iOS 16 en adelante, y la transcripción de Voice Memos de iOS 18 también funciona sin conexión una vez descargado el modelo de lenguaje. Espera un 85-90 % de precisión con inglés claro. Las apps en la nube como Otter y Rev necesitan conexión, así que la fiabilidad sin conexión es la principal ventaja de la ruta nativa.
¿iOS 18 incluye una función nativa de transcripción de video? iOS 18 no tiene un botón dedicado de transcripción de video, pero superpone dos funciones que cubren el caso de uso: Live Captions a nivel de sistema que lee cualquier audio en reproducción, video incluido, y la transcripción de Voice Memos para audio importado. Juntas reemplazan la mayoría de apps autónomas para contenido corto en inglés — no para audio con acento marcado o varios hablantes.
¿Qué app gratis de iPhone es más precisa para transcribir video? Otter.ai es la opción gratis más fuerte en 2026 para reuniones y entrevistas en inglés limpio, con una precisión del 95-97 % y etiquetas de hablante. Rev Voice Recorder le saca ventaja con inglés acentuado pero limita las exportaciones gratis con más dureza. Para audio multilingüe, una app basada en Whisper supera a ambas pero suele requerir un plan de pago en iOS.
¿Qué duración debe tener un video para que la transcripción del iPhone funcione bien? Live Captions funciona de forma fiable hasta unos 5 minutos antes de que la precisión en el dispositivo se desvíe. Voice Memos gestiona unos 30 minutos limpios en iPhones recientes. Otter y apps similares transcriben grabaciones de varias horas, aunque los planes gratis limitan las grabaciones individuales a 30-40 minutos. Para videos de más de una hora, divídelos.
¿Puedo transcribir videos en iPad con los mismos métodos? Sí. Live Captions, la transcripción de Voice Memos y todas las apps de terceros mencionadas aquí tienen versiones idénticas en iPad. iPadOS 18 replica iOS 18 en funciones de transcripción. La ventaja del iPad es la pantalla más grande para limpiar la transcripción en línea y la multitarea en paralelo frente al video fuente.
Adónde ir desde aquí
El iPhone gestiona la transcripción casual lo bastante bien como para que las apps autónomas resulten excesivas para contenido corto. Para trabajos más largos o críticos, el Método 2 sigue ganando. El flujo del iPhone es una fila en la matriz de decisión fuente-a-método — si también trabajas con YouTube, Zoom o grabaciones de pantalla, el pillar cubre la elección de método para cada uno. Si la transcripción es un peldaño hacia el contenido social, nuestra guía completa del generador de citas con IA cubre el pipeline aguas abajo — y una herramienta de transcripción dedicada como TurboScribe vale la pena solo si el texto en bruto es el entregable final.