Mentre programava en PHP a la feina, una de les pàgines mostrava al principi això: ””
Tal com diu en aquest article de la wikipedia: http://en.wikipedia.org/wiki/UTF-8#Byte_order_mark això passa quan el fitxer s’ha desat amb alguns programes de Windows amb codificació UTF-8 que incorporen al principi els bytes 0xEF, 0xBB i 0xBF. És la codificació UTF-8 del Unicode byte order mark (BOM), comunament referida com UTF-8 BOM.
Per eliminar el UTF-8 BOM podem usar aquest script en perl que desem per exemple al fitxer eliminaBom.pl:
#!/usr/bin/perl @file=<>; $file[0] =~ s/^\xEF\xBB\xBF//; print(@file);
I l’executarem així:
perl eliminaBom.pl < fitxerAmbBom.txt > fitxerSenseBom.txt
Fet 🙂
GD Star Rating
loading...
Eliminació del BOM (Byte Order Mark) en un fitxer codificat amb UTF-8, loading...