• Tag Archives BOM
  • Eliminació del BOM (Byte Order Mark) en un fitxer codificat amb UTF-8

    Mentre programava en PHP a la feina, una de les pàgines mostrava al principi això: ””

    Tal com diu en aquest article de la wikipedia: http://en.wikipedia.org/wiki/UTF-8#Byte_order_mark això passa quan el fitxer s’ha desat amb alguns programes de Windows amb codificació UTF-8 que incorporen al principi els bytes 0xEF, 0xBB i 0xBF. És la codificació UTF-8 del Unicode byte order mark (BOM), comunament referida com UTF-8 BOM.

    Per eliminar el UTF-8 BOM podem usar aquest script en perl que desem per exemple al fitxer eliminaBom.pl:

    #!/usr/bin/perl
    @file=<>;
    $file[0] =~ s/^\xEF\xBB\xBF//;
    print(@file);
    

    I l’executarem així:

    perl eliminaBom.pl < fitxerAmbBom.txt > fitxerSenseBom.txt

    Fet 🙂

    GD Star Rating
    loading...