Eliminació del BOM (Byte Order Mark) en un fitxer codificat amb UTF-8

Mentre programava en PHP a la feina, una de les pàgines mostrava al principi això: ””

Tal com diu en aquest article de la wikipedia: http://en.wikipedia.org/wiki/UTF-8#Byte_order_mark això passa quan el fitxer s’ha desat amb alguns programes de Windows amb codificació UTF-8 que incorporen al principi els bytes 0xEF, 0xBB i 0xBF. És la codificació UTF-8 del Unicode byte order mark (BOM), comunament referida com UTF-8 BOM.

Per eliminar el UTF-8 BOM podem usar aquest script en perl que desem per exemple al fitxer eliminaBom.pl:

#!/usr/bin/perl
@file=<>;
$file[0] =~ s/^\xEF\xBB\xBF//;
print(@file);

I l’executarem així:

perl eliminaBom.pl < fitxerAmbBom.txt > fitxerSenseBom.txt

Fet 🙂

GD Star Rating
loading...
Eliminació del BOM (Byte Order Mark) en un fitxer codificat amb UTF-8, 5.0 out of 5 based on 1 rating