iPhone trascrive un video in tre tap nel 2026, a patto che tu sappia quale funzione integrata usare. iOS 18 ha aggiunto un layer di trascrizione a Voice Memos e ha mantenuto i Live Captions a livello di sistema durante la riproduzione: insieme coprono la maggior parte delle esigenze quotidiane senza scaricare nulla. Questa guida copre tre percorsi: il metodo nativo iOS 18 in 3 tap, le app di terze parti per i casi che il nativo non gestisce, e la pipeline AI se l’obiettivo è generare grafiche con citazioni invece che testo grezzo. È la fetta iPhone-specifica della guida completa alla trascrizione video — il pillar copre la matrice fonte-metodo più ampia se il tuo workflow combina telefono con desktop o sorgenti web. La trascrizione è spesso lo step 1 — la nostra guida al generatore di citazioni AI copre il resto della pipeline.
Metodo 1 — il workflow nativo iOS 18 in 3 tap
Il percorso più rapido sfrutta i Live Captions, una funzione di accessibilità che Apple ha reso disponibile a livello di sistema in iOS 16 e ha potenziato in iOS 18. Legge qualsiasi audio che passa dal telefono, video inclusi, e mostra una caption a scorrimento sopra al contenuto, che puoi copiare.
-
Attiva i Live Captions una volta
Impostazioni → Accessibilità → Live Captions → attiva. Il modello linguistico on-device si scarica e gira offline.
-
Avvia il video
Aprilo in Foto, Safari o qualsiasi app. I Live Captions mostrano un riquadro con la caption trascinabile sopra a quello che stai riproducendo.
-
Tocca il riquadro caption e premi Salva
In iOS 18 la finestra caption ha un'azione di salvataggio che copia la trascrizione corrente in Note.
L’accuratezza si attesta intorno all’85-90% su inglese pulito e cala con accenti marcati o rumore di fondo. Per clip brevi è sufficiente. Voice Memos è l’alternativa per audio già sul dispositivo: importalo e il pannello di trascrizione di iOS 18 genera una trascrizione ricercabile mentre la registrazione viene riprodotta.
Quando usarlo: video brevi, singolo speaker in inglese, uso offline. Da evitare per: contenuti lunghi, audio non in inglese, multi-speaker o qualsiasi cosa che pubblicherai senza rilettura.
Metodo 2 — app iPhone di terze parti (quando il nativo non basta)
Il nativo va in stallo in fretta. Per qualsiasi cosa oltre i cinque minuti, multi-speaker o non in inglese, vale la pena installare un’app. Le tre che contano nel 2026:
- Otter.ai — la più forte per riunioni e interviste, free tier intorno ai 300 minuti al mese, etichette speaker integrate.
- Rev Voice Recorder — meglio sull’inglese con accento, revisione umana opzionale, esporta SRT e DOCX.
- Descript Mobile — più lenta, ma è la scelta migliore se vuoi editare la trascrizione insieme al video più avanti.
L’accuratezza si colloca tra il 94% e il 98% su audio pulito, qualche punto in meno su accenti marcati.
-
Condividi il video nell'app
Da File o Foto, la maggior parte delle app accetta direttamente MP4 o M4A.
-
Imposta lingua e numero di speaker
Le app sono di default in inglese. Segnala il multi-speaker e cambia lingua se serve.
-
Avvia il job
Un video di 10 minuti viene trascritto in 30-90 secondi sui servizi cloud.
-
Pulisci ed esporta
Correggi omofoni e nomi di brand, poi esporta in testo, SRT, DOCX o JSON.
Se stai valutando un’app di trascrizione dedicata contro un tool più ampio, il confronto TurboScribe copre il tradeoff tra trascrizione pura e pipeline di riutilizzo.
Metodo 3 — pipeline AI per content creator
La trascrizione raramente è la destinazione finale. Se l’obiettivo finale sono grafiche con citazioni, clip brevi o testo pronto per i social, il percorso con app standalone aggiunge uno step di design che la maggior parte dei creator finisce a metà. I tool end-to-end gestiscono trascrizione, estrazione delle citazioni e rendering grafico in un’unica passata, direttamente da iPhone.
Lo stesso framework si ripresenta su fonti video diverse — l’articolo gemello su come trascrivere video Facebook in testo ripercorre lo split nativo / terze parti / AI e la logica si applica identica agli upload da iPhone.
Quando usarlo: creator, coach e podcaster che trattano il video come fonte per output Instagram o LinkedIn.
Quale metodo dovresti usare davvero?
| Scenario | Metodo consigliato |
|---|---|
| Clip breve, singolo speaker in inglese | Metodo 1 (Live Captions) |
| Intervista lunga, multi-speaker | Metodo 2 (Otter o Rev) |
| Audio non in inglese o con accento | Metodo 2 (Rev, oppure Whisper via API) |
| L’obiettivo finale sono grafiche / social | Metodo 3 (pipeline AI) |
| Memo vocale già sul dispositivo | Metodo 1 (trascrizione Voice Memos) |
Errori comuni nella trascrizione su iPhone
Fidarsi dei Live Captions su contenuti lunghi. L’accuratezza scivola dopo i 5 minuti perché il modello on-device perde contesto. Va bene per consultazione veloce, rischioso per qualsiasi cosa che pubblicherai.
Sottovalutare il consumo di batteria. I Live Captions sollecitano molto il Neural Engine — una sessione di 30 minuti consuma il 15-20% su un iPhone 14 o precedente. Tieni il telefono collegato per i job lunghi.
Ignorare i limiti di upload del free tier. Otter limita le registrazioni gratuite intorno ai 40 minuti; Rev limita gli export sul free tier. Spezza i video lunghi o aspettati un paywall a metà job.
Non riconcedere i permessi dopo gli aggiornamenti iOS. iOS 18 ha resettato diversi stati di permesso. Se un’app fallisce in modo silenzioso, controlla Impostazioni → Privacy e Sicurezza → Microfono prima di reinstallare.
Domande frequenti
iPhone può trascrivere video senza internet? Sì. I Live Captions (Impostazioni → Accessibilità → Live Captions) girano on-device da iOS 16 in poi, e la trascrizione di Voice Memos di iOS 18 funziona anche offline una volta scaricato il modello linguistico. Aspettati un’accuratezza dell’85-90% su inglese pulito. App cloud come Otter e Rev hanno bisogno di una connessione, quindi l’affidabilità offline è il vantaggio principale del percorso nativo.
iOS 18 include una funzione di trascrizione video integrata? iOS 18 non ha un pulsante dedicato alla trascrizione video, ma sovrappone due funzioni che coprono il caso d’uso: i Live Captions a livello di sistema che leggono qualsiasi audio in riproduzione, video inclusi, e la trascrizione di Voice Memos per audio importato. Insieme sostituiscono la maggior parte delle app standalone per contenuti brevi in inglese — non per audio con accento o multi-speaker.
Quale app iPhone gratis è più accurata per la trascrizione video? Otter.ai è l’opzione gratuita più forte nel 2026 per riunioni e interviste in inglese pulito, intorno al 95-97% di accuratezza con etichette speaker. Rev Voice Recorder la batte sull’inglese con accento ma limita più duramente gli export gratuiti. Per audio multilingua un’app basata su Whisper le batte entrambe, ma di solito richiede un tier a pagamento su iOS.
Quanto può essere lungo un video perché la trascrizione su iPhone funzioni bene? I Live Captions funzionano in modo affidabile fino a circa 5 minuti prima che l’accuratezza on-device scivoli. Voice Memos gestisce circa 30 minuti puliti su iPhone recenti. Otter e app simili trascrivono registrazioni di più ore, anche se i free tier limitano le singole registrazioni a 30-40 minuti. Per video oltre l’ora, spezzali.
Posso trascrivere video su iPad con gli stessi metodi? Sì. Live Captions, trascrizione Voice Memos e ogni app di terze parti citata qui hanno versioni iPad identiche. iPadOS 18 rispecchia iOS 18 sulle funzioni di trascrizione. Il vantaggio dell’iPad è lo schermo più grande per pulire la trascrizione inline e il multitasking affiancato con il video sorgente.
Da dove ripartire
iPhone gestisce la trascrizione casual abbastanza bene da rendere le app standalone un overkill per contenuti brevi. Per job lunghi o critici, il Metodo 2 vince ancora. Il workflow iPhone è una riga della matrice di decisione fonte-metodo — se lavori anche con YouTube, Zoom o screen recording, il pillar copre la scelta del metodo per ognuna. Se la trascrizione è uno step verso il contenuto social, la nostra guida completa al generatore di citazioni AI copre la pipeline downstream — e un tool di trascrizione dedicato come TurboScribe vale uno sguardo solo se il testo grezzo è la consegna finale.