In questo articolo
Cos'è la validazione CSV?
La validazione CSV (Comma-Separated Values) verifica che un file sia conforme alla struttura, alla codifica e al formato dati attesi. Sebbene il CSV sembri semplice, i file reali contengono frequentemente problemi: conteggi di colonne inconsistenti, delimitatori errati, problemi di codifica, virgolette non escapate e newline incorporate.
Il CSV è uno dei formati di scambio dati più utilizzati, ma anche uno dei meno standardizzati. Non esiste un unico standard CSV ufficiale — RFC 4180 fornisce delle linee guida, ma la maggior parte degli strumenti implementa le proprie varianti. Questo significa che i file provenienti da fonti diverse possono essere strutturalmente incompatibili.
Come funziona la validazione CSV
Il validatore CSV di CheckTown analizza il file e controlla struttura, codifica e coerenza.
- Rilevamento del delimitatore — identifica se il file usa virgole, punto e virgola, tabulazioni o altri delimitatori
- Coerenza delle righe — verifica che ogni riga abbia lo stesso numero di colonne della riga di intestazione
- Controllo della codifica — rileva problemi di codifica dei caratteri inclusi i marcatori BOM e le sequenze UTF-8 non valide
Prova gratuitamente — nessuna registrazione richiesta
Valida un file CSV →Quando usare la validazione CSV
La validazione CSV è più utile prima di importare file in database, API o pipeline di elaborazione dati.
- Importazioni dati — valida il CSV prima di caricarlo in database o sistemi CRM per prevenire dati corrotti
- Pipeline ETL — aggiungi la validazione come primo step nei flussi di trasformazione dati per rilevare tempestivamente gli errori di origine
- Scambio di file — valida i file ricevuti da partner esterni prima dell'elaborazione per garantire la compatibilità strutturale
Domande frequenti
Qual è l'errore CSV più comune in pratica?
I conteggi di colonne inconsistenti (chiamati anche righe irregolari) sono il problema CSV più comune. Si verificano quando una riga ha più o meno colonne dell'intestazione, di solito causato da virgole non escapate all'interno dei valori dei campi. Il secondo problema più comune è la codifica — i file creati su Windows spesso usano la codifica Windows-1252 anziché UTF-8.
Come devono essere gestite le virgole all'interno dei valori dei campi in CSV?
I campi contenenti virgole devono essere racchiusi tra virgolette doppie. Se il campo contiene anche virgolette doppie, queste devono essere escapate raddoppiandole. Ad esempio, un campo contenente il valore She said, "hello" verrebbe scritto come "She said, ""hello""" in un CSV valido.
Qual è la differenza tra CSV e TSV?
TSV (Tab-Separated Values) usa caratteri di tabulazione come delimitatori invece delle virgole. Il TSV è meno comune ma evita conflitti di delimitatori nei dati che contengono virgole. Entrambi i formati seguono la stessa struttura generale e le stesse regole di quotatura.