La trascrizione video gratis nel 2026 si divide onestamente in quattro percorsi, e la SERP ne nasconde tre dietro signup di prova e funnel con watermark. I risultati di pagina uno puntano tutti allo stesso free tier di SaaS dedicate perché è il funnel che vendono. Questa guida mappa ogni strada davvero gratuita — la piattaforma su cui sei già, un free tier SaaS con limiti reali, OpenAI Whisper self-hosted e i side-channel via AI assistant — con trade-off onesti per ogni percorso e senza la pretesa che uno solo vada bene per tutti i casi. Per la tassonomia completa dei metodi tra paid e free, la guida completa alla trascrizione video è il pillar di riferimento; questa pagina è il deep dive sul solo gratis.

Cosa significa davvero “gratis” nel 2026

La parola “gratis” nel marketing della trascrizione porta con sé quattro significati diversi e la maggior parte delle pagine top-10 li confonde di proposito. Una definizione pulita di “gratis” nel 2026 supera quattro soglie insieme: nessuna carta di credito registrata, nessun watermark sull’output, nessun limite duro di tempo per file o per mese e nessun signup obbligatorio per accedere al tool. Solo due dei quattro percorsi qui sotto superano ogni soglia. I percorsi 2 e 4 richiedono un signup che le pagine SEO sul free tier non mostrano above the fold.

Feature Senza signupSenza watermarkSenza limite di tempoSenza carta di credito
Percorso 1 — Piattaforma nativa
Percorso 2 — Free tier SaaS
Percorso 3 — Whisper self-hosted
Percorso 4 — AI assistant (ChatGPT Plus ecc.)

La decisione qui sotto tratta queste quattro soglie come non negoziabili. Se una pagina parla di “trascrizione gratis” e non riesce a superarle tutte e quattro, sta vendendo una prova — chiamala con il suo nome. I quattro percorsi che seguono, in ordine di attrito di setup, coprono ogni mossa onestamente gratis nel 2026.

Percorso 1: la piattaforma su cui sei già

La trascrizione gratis più veloce è quella che non devi caricare da nessuna parte. Quattro piattaforme offrono caption native o trascrizioni built-in per i contenuti che controlli — gratis per sempre, nessuna installazione, accuratezza nella fascia 82-90%.

YouTube Studio. Per i video sul tuo canale, YouTube genera caption automatiche entro pochi minuti dall’upload. Apri YouTube Studio, scegli il video, tab Sottotitoli, scarica il file auto-generato come .srt o .vtt. Togli i timestamp con un qualsiasi editor di testo e hai una trascrizione in plain text. L’accuratezza si aggira intorno all’85-90% su inglese pulito e cala su sorgenti accentate o rumorose. Nessun limite, nessun watermark, zero signup oltre l’account Google che hai già.

Facebook Meta Business Suite. Facebook genera caption automatiche sui video caricati per le pagine con storia account sufficiente. Creator Studio offre l’opzione di download del file .srt per i tuoi upload. L’accuratezza è paragonabile a quella di YouTube — circa 85% su inglese pulito.

Zoom e Google Meet. Entrambe le piattaforme generano in automatico una trascrizione completa della riunione sulle registrazioni di tua proprietà. La trascrizione cloud-recording di Zoom arriva nel tuo account dopo la chiamata, con diarizzazione speaker inclusa; Google Meet fa lo stesso quando la trascrizione è abilitata pre-call. Utile per interviste, webinar o qualsiasi sorgente in formato meeting — gratis, senza tool separato.

iPhone iOS Live Captions. Il percorso on-device. Live Captions di iOS 18 esegue il modello speech di Apple interamente sul dispositivo per qualsiasi audio in riproduzione sul telefono, video inclusi. Niente viene caricato da nessuna parte. L’accuratezza è 88-94% su clip brevi e pulite e drifta dopo i cinque minuti, quando il modello on-device perde contesto. Il workflow passo passo per trascrivere su iPhone copre i gotcha specifici di iOS, inclusa la modalità offline di Memo vocali.

Per Facebook in particolare, la guida ai metodi di trascrizione video Facebook ripercorre il flusso di download dei caption nativi più il fallback Whisper per i video che non possiedi.

Percorso 2: free tier delle SaaS dedicate

Il secondo percorso è quello a cui puntano tutti i risultati top-10 in SERP — un free tier su un tool commerciale. Quattro tool offrono free tier davvero usabili nel 2026, ma ognuno richiede signup e ognuno ha un limite che il marketing non mette in primo piano.

Feature Limite free tierWatermarkFormati di exportAccuratezza
TurboScribe Free 1 ora, 3 export/giorno Nessuno sul free tier TXT, SRT, VTT, DOCX 94-97%
Happy Scribe 10 min di prova (no free ricorrente) Nessuno TXT/SRT limitati 95-98%
Otter Free 300 min/mese, 30 min/file Nessuno Solo TXT 88-94%
Notta Free 120 min/mese, 3 min/file Nessuno TXT, DOCX, SRT 88-94%

TurboScribe Free è il più solido dei quattro per uso occasionale — tre export al giorno su video fino a trenta minuti l’uno, niente watermark, gamma completa di formati di export. Il trade è il limite di export giornaliero invece di un cap sui minuti mensili, che si sposa meglio con l’uso una tantum che con il batch. Happy Scribe è tecnicamente una prova da 10 minuti, non un free tier ricorrente — utile una volta, non come percorso gratis ripetibile. Otter Free gestisce un budget di minuti mensili più adatto a trascrizioni di riunioni. Notta Free è il più stretto dei quattro, con un tetto di tre minuti per file.

Tutti e quattro richiedono signup via email e fanno entrare l’account nel loro email marketing. Nessuno di questi è un dealbreaker per uso occasionale, ma nessuno supera la soglia “senza signup”. Per un confronto tool per tool più approfondito sulla classe SaaS dedicate, la round-up con le alternative a TurboScribe inquadra prezzi e limiti del free tier sui cinque competitor più credibili.

Percorso 3: Whisper open-source self-hosted

L’accuratezza più alta della lista gratis gira sul tuo laptop. OpenAI Whisper è open-source, di livello produzione e appartiene alla stessa famiglia di modelli che TurboScribe e ChatGPT Audio usano sotto il cofano. Tre sotto-percorsi, ordinati per attrito di setup.

Sotto-percorso A — wrapper Gradio nel browser. Siti come transcriber.gg ospitano Whisper dietro un front-end browser. Niente install, niente signup, niente account. Carichi un file, scegli la dimensione del modello, click su Transcribe. L’accuratezza segue il modello scelto — il modello medium si attesta al 94-96%, il large-v3 al 96-98%. Il processing gira sull’istanza ospitata, non sul tuo laptop, il che significa che il tuo file vive brevemente su un server pubblico durante l’elaborazione.

  1. Apri transcriber.gg o un wrapper Gradio Whisper analogo

    Front-end browser di OpenAI Whisper. Niente account, niente install, gira su un'istanza hosted.

  2. Carica il file video o audio

    MP4, MOV, MP3, M4A tutti accettati. Il limite di dimensione file è tipicamente 200MB sulle istanze pubbliche gratuite.

  3. Scegli la dimensione del modello Whisper

    Medium è il punto di equilibrio — accuratezza ~96%, processing ~2x in tempo reale. Large-v3 aggiunge 2-3 punti a 4x del tempo di elaborazione.

  4. Clicca Transcribe e aspetta

    Un video da 10 minuti viene processato in 2-5 minuti, a seconda del carico dell'istanza. La tab del browser deve restare aperta.

  5. Copia o scarica l'output TXT

    La trascrizione appare sotto l'area di upload. Copiala inline o tasto destro per salvare.

Sotto-percorso B — Whisper Python CLI. pip install openai-whisper più un singolo comando whisper yourfile.mp4 --model medium ti restituisce la trascrizione come TXT, SRT, VTT e JSON nella directory corrente. Richiede Python 3.9+ e FFmpeg sul sistema. Cinque minuti di setup la prima volta, trenta secondi a ogni run successivo. Completamente offline — il file non lascia mai il laptop.

Sotto-percorso C — Whisper.cpp. Un port C++ che gira su Apple Silicon (accelerazione Metal) o GPU NVIDIA (CUDA). Il più veloce dei tre sotto-percorsi, il setup più tosto. Ideale per i creator che trascrivono dozzine di ore al mese e vogliono throughput on-device quasi in tempo reale.

Costo per i tre sotto-percorsi: l’elettricità del laptop. Un video da 10 minuti viene processato in 2-5 minuti su un laptop dal 2022 in poi con il modello medium.

Percorso 4: side-channel via AI assistant

La maggior parte dei creator paga già un abbonamento ChatGPT Plus o Gemini Advanced. Entrambi i servizi trascrivono audio nativamente via Audio Mode — non sono venduti come prodotti di trascrizione, ma funzionano. Il workflow: estrai l’audio dal video (qualsiasi app voice-memo del telefono o l’one-liner Mac ffmpeg -i input.mp4 -vn audio.m4a), carica su ChatGPT Plus in Audio mode o Gemini Advanced, chiedi una trascrizione completa. L’output arriva come testo inline che puoi copiare.

L’accuratezza è in fascia Whisper, perché la pipeline audio di GPT-4o usa lo stesso modello di famiglia Whisper sotto. I limiti sono reali: ChatGPT Plus Audio si ferma intorno a 25MB / ~25 minuti per file, Gemini Advanced ha limiti analoghi. Non adatto al batch o al long-form, adatto al one-off occasionale quando hai già l’abbonamento.

Il costo è di fatto zero al margine — i $20/mese di abbonamento ti pagano già tutto il resto che fai con GPT o Gemini. Se non ne paghi nessuno, il Percorso 3 ti dà accuratezza migliore senza alcun abbonamento.

Quale percorso gratis si adatta a quale video?

La decisione si riduce a due domande: la sorgente è tua e quanto è lunga. Tua + breve = Percorso 1. Non tua + breve = Percorso 4 se hai ChatGPT Plus, Percorso 3 altrimenti. Tua o non tua + 5-30 min = Percorso 2 per il one-off occasionale, Percorso 3 se ti capita più di una volta a settimana. Oltre i 30 min o batch = Percorso 3, sempre. Privacy-sensitive = Percorso 1 o Percorso 3 in locale (sotto-percorsi B o C), mai il Percorso 2, mai il sotto-percorso A hosted del Percorso 3.

  • $0 Percorso 1 + Percorso 3 (locale)
  • $0* Percorso 2 + Percorso 4 (*signup/abbonamento)
  • 94-98% Accuratezza top-band (Percorsi 2-4)

Domande frequenti

Qual è il metodo gratis davvero più accurato per trascrivere video nel 2026?

Whisper self-hosted con il modello large-v3 — 96-98% su inglese pulito, gratis per sempre se hai un laptop dal 2020 in poi. Il trade-off sono cinque minuti di setup (installa Python, pip install openai-whisper). Per il gratis a setup zero, iOS Live Captions su iPhone arriva all’88-94% senza installazione. Vedi la guida completa alla trascrizione video per la fascia di accuratezza su tutti i metodi, incluso il tier a pagamento.

Posso trascrivere un video gratis senza fare signup da nessuna parte?

Sì. Tre percorsi richiedono zero signup: l’export da YouTube Studio (hai già l’account Google), iOS Live Captions (on-device, solo Apple ID per il telefono) e Whisper via istanze Gradio nel browser. I free tier SaaS (TurboScribe, Happy Scribe, Otter) richiedono tutti il signup. Se la trascrizione alimenta uno step di design downstream, il workflow del generatore di citazioni AI integra la trascrizione nello stage successivo invece di farla girare come tool gratis separato.

I tool gratis di trascrizione sono accurati abbastanza per contenuti pubblicati?

Di solito sì, con un passaggio di proofreading di 30-60 secondi. I percorsi gratis di fascia Whisper si attestano al 94-97% su inglese pulito — identici al TurboScribe a pagamento perché girano lo stesso modello sotto. Lo step di proofreading cattura il 3-6% di errori residui (omofoni, brand name, gergo). Non pubblicare senza.

Esiste un tool gratis senza limite di tempo?

Sì — due. Whisper self-hosted non ha limiti (l’elettricità del laptop è l’unico costo). I caption nativi di piattaforma (YouTube Studio, trascrizione Zoom) non hanno limiti quando il contenuto è tuo. Ogni “free tier” SaaS ha un limite. Vedi i prezzi ReelQuote se invece vuoi un tier a pagamento illimitato a costo fisso.

ChatGPT può trascrivere video gratis?

ChatGPT Free no; ChatGPT Plus sì via Audio mode, con un limite di 25MB / ~25 minuti per file. Anche Gemini Advanced di Google gestisce audio sul tier a pagamento. Per un percorso gratis completo senza abbonamento, Whisper self-hosted gira lo stesso modello sotto a ChatGPT Plus.

Qual è la fregatura dei free tier SaaS di trascrizione?

Tre fregature: limiti di tempo (10-300 min/mese), restrizioni sui formati di export (alcuni solo TXT) e creazione account-poi-email-marketing. Nessuna è un dealbreaker per uso occasionale. Se trascrivi più di un’ora al mese, il tier a pagamento o Whisper self-hosted si ripaga in meno di una settimana.

Da qui in poi

“Gratis” non è binario. I quattro percorsi qui sopra coprono quattro forme diverse di “gratis” — on-device, hosted, self-hosted, bundled — e scegliere quello sbagliato spreca il signup o l’ora di setup che un altro percorso ti avrebbe risparmiato. Mappa la tua sorgente prevalente e il volume mensile rispetto alla regola di decisione qui sopra, poi scegli. Per la tassonomia completa dei metodi tra la classe free tier nativa e i tier a pagamento, il pillar copre dove ogni percorso gratis si incastra nello stack più ampio della trascrizione.