=?ISO-8859-1?Q?English_=A3_signs_lost_importing_=2Ecsv_file_via_ExcelC?==?ISO-8859-1?Q?onnection?=

Collapse
This topic is closed.
X
X
 
  • Time
  • Show
Clear All
new posts
  • JimL

    =?ISO-8859-1?Q?English_=A3_signs_lost_importing_=2Ecsv_file_via_ExcelC?==?ISO-8859-1?Q?onnection?=

    Hello Group,

    I am trying to import data in a .csv file - the data contains English
    pound signs (£). When importing data via filestreams etc I use the
    "Default" code page - which is 1252 (ISO 8859-1). However I can see no
    way to make the import of my csv file aware of this in the following
    scenario, and the imported data contains character strings instead of
    pound signs.

    Can anyone help?

    sPath = finputFile.Dire ctoryName

    ExcelConnection = New
    OleDb.OleDbConn ection("Provide r=Microsoft.Jet .OLEDB.4.0;Data Source= "
    + sPath + ";Extended Properties='tex t;HDR=Yes;FMT=D elimited;IMEX=1 ;'")
    Try
    Using ExcelCommand As New OleDb.OleDbComm and("SELECT *
    FROM " + finputFile.Name , ExcelConnection )

    Using ExcelAdapter As New
    OleDb.OleDbData Adapter((ExcelC ommand)
    ExcelConnection .Open()

    Using ExcelDataSet As New DataSet()
    ExcelAdapter.Fi ll(ExcelDataSet , "Supplier")
    '// Create the XML file
    oXMLDoc = New XmlDocument
    oXMLDoc.Preserv eWhitespace = True
    oXMLDoc.LoadXml (ExcelDataSet.G etXml())
    oXMLDoc.Save(ms InputXMLFile)

    End Using

    End Using

    End Using
    Finally


    Thanks,
    Jim
  • Peter Gibbons

    #2
    Re: English =?UTF-8?B?wqMgc2lnbnM gbG9zdCBpbXBvcn RpbmcgLmNzdiBma Ww=?==?UTF-8?B?ZSB2aWEgRXh jZWxDb25uZWN0aW 9u?=

    I just wanted to mention that codepage 1252 is _NOT_ the same as ISO
    8859-1. Here are the differences (character names are in german):

    =/≠;PositionDec;Po sitionHex;CP1Ch arDec;CP1CharHe x;CP1Char;CP2Ch arDec;CP2CharHe x;Cp2Char;CP1Ch arinCP2PosDec;C P1CharinCP2PosH ex;CP2CharinCP1 PosDec;CP2Chari nCP1PosHex;CP1C harName;CP2Char Name
    ≠;128;0x80;8364; €;0x20AC;128; €;0x80;0;0x00; 0;0x00;Euro-Zeichen;<Steuer ung>
    ≠;130;0x82;8218; ‚;0x201A;130; ‚;0x82;0;0x00; 0;0x00;Einfache s
    Anführungszeic hen unten;Hier ist ein Zeilenumbruch zugelassen
    ≠;131;0x83;402;Æ ’;0x192;131;ƒ; 0x83;0;0x00;0;0 x00;Kleiner lateinischer
    Buchstabe F mit Häkchen;Hier ist kein Zeilenumbruch zugelassen
    ≠;132;0x84;8222; „;0x201E;132; „;0x84;0;0x00; 0;0x00;Doppelte s
    Anführungszeic hen unten;<Steuerun g>
    ≠;133;0x85;8230; …;0x2026;133; …;0x85;0;0x00; 0;0x00;Horizont ale
    Ellipse;Nächst e Zeile
    ≠;134;0x86;8224; †;0x2020;134;†; 0x86;0;0x00;0;0 x00;Kreuz;Anfan g des
    ausgewählten Bereichs
    ≠;135;0x87;8225; ‡;0x2021;135; ‡;0x87;0;0x00; 0;0x00;Doppelkr euz;Ende des
    ausgewählten Bereichs
    ≠;136;0x88;710;Ë †;0x2C6;136;ˆ; 0x88;0;0x00;0;0 x00;Modifikatio nszeichen
    Zirkumflex-Akzent;Zeichent abellensatz
    ≠;137;0x89;8240; ‰;0x2030;137; ‰;0x89;0;0x00; 0;0x00;Promille zeichen;Zeichen tabellensatz
    mit Ausrichtung
    ≠;138;0x8A;352;Š;0x160;138;Š;0 x8A;0;0x00;0;0x 00;Großer lateinischer
    Buchstabe S mit Caron;Zeilentab ellensatz
    ≠;139;0x8B;8249; ‹;0x2039;139; ‹;0x8B;0;0x00; 0;0x00;Einfache s spitzes
    Anführungszeic hen nach links;Partielle Zeile nach unten
    ≠;140;0x8C;338;Å ’;0x152;140;ÂŒ; 0x8C;0;0x00;0;0 x00;Große lateinische
    Ligatur Oe;Partielle Zeile nach oben
    ≠;142;0x8E;381;Å ½;0x17D;142;ÂŽ; 0x8E;0;0x00;0;0 x00;Großer lateinischer
    Buchstabe Z mit Caron;Einfaches Umschalten zwei
    ≠;145;0x91;8216; ‘;0x2018;145; ‘;0x91;0;0x00; 0;0x00;Einfache s linkes
    Anführungszeic hen;Benutzerdef inierte Verwendung eins
    ≠;146;0x92;8217; ’;0x2019;146; ’;0x92;0;0x00; 0;0x00;Einfache s rechtes
    Anführungszeic hen;Benutzerdef inierte Verwendung zwei
    ≠;147;0x93;8220; “;0x201C;147; “;0x93;0;0x00; 0;0x00;Doppelte s linkes
    Anführungszeic hen;Satzübertr agungsstatus
    ≠;148;0x94;8221; ”;0x201D;148; ”;0x94;0;0x00; 0;0x00;Doppelte s rechtes
    Anführungszeic hen;Abbrechungs zeichen
    ≠;149;0x95;8226; •;0x2022;149; •;0x95;0;0x00; 0;0x00;Aufzähl ungszeichen;War tende
    Meldung
    ≠;150;0x96;8211; –;0x2013;150; –;0x96;0;0x00; 0;0x00;Bindestr ich;Anfang des
    geschützten Bereichs
    ≠;151;0x97;8212; —;0x2014;151; —;0x97;0;0x00; 0;0x00;Gedanken strich;Ende
    des geschützten Bereichs
    ≠;152;0x98;732;Ë œ;0x2DC;152;˜; 0x98;0;0x00;0;0 x00;Kleine Tilde;Anfang der
    Zeichenfolge
    ≠;153;0x99;8482; ™;0x2122;153; ™;0x99;0;0x00; 0;0x00;Warenzei chen;<Steuerung >
    ≠;154;0x9A;353;Å ¡;0x161;154;š; 0x9A;0;0x00;0;0 x00;Kleiner lateinischer
    Buchstabe S mit Caron;Einführu ngszeichen für einzelnes Zeichen
    ≠;155;0x9B;8250; ›;0x203A;155; ›;0x9B;0;0x00; 0;0x00;Einfache s spitzes
    Anführungszeic hen nach rechts;Einführ ungszeichen für Steuerungsseque nz
    ≠;156;0x9C;339;Å “;0x153;156;œ; 0x9C;0;0x00;0;0 x00;Kleine lateinische
    Ligatur Oe;Zeichenfolge n-Abschlusszeiche n
    ≠;158;0x9E;382;Å ¾;0x17E;158;ž; 0x9E;0;0x00;0;0 x00;Kleiner lateinischer
    Buchstabe Z mit Caron;Datenschu tzmeldung
    ≠;159;0x9F;376;Å ¸;0x178;159;Ÿ; 0x9F;0;0x00;0;0 x00;Großer lateinischer
    Buchstabe Y mit Diärese;Anwend ungsprogrammbef ehl
    1252~Windows-1252~Westeuropà ¤isch (Windows) »
    28591~iso-8859-1~Westeuropäis ch (ISO)

    But ISO 8859-1 (codepage 28591) has the same characters at different
    codepoint positions like the codepages
    37,500,1047,202 73,20277,20278, 20280,20284,202 85,20297,20871

    If you plan to work with international textfiles stop using textpad. It
    doesn't support working with unicode files that contain multiple scripts.


    Regards,
    Peter

    Comment

    Working...