<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Problem with UTF-8 &amp;quot;fixed record&amp;quot; files in QlikView</title>
    <link>https://community.qlik.com/t5/QlikView/Problem-with-UTF-8-quot-fixed-record-quot-files/m-p/878255#M306654</link>
    <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Hello,&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;I have data in a text file, encoded in UTF-8 (w/o BOM), with fixed records.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;When the file contains a special character, this one is considered as 2 characters, and all the following data is parsed wrong (with a shift).&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;This file:&lt;/P&gt;&lt;PRE __default_attr="plain" __jive_macro_name="code" class="jive_macro_code jive_text_macro _jivemacro_uid_14285095012749837" jivemacro_uid="_14285095012749837"&gt;
&lt;P&gt;BRAND&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; MODEL&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; DATE&amp;nbsp;&amp;nbsp;&amp;nbsp; VALUE&amp;nbsp;&amp;nbsp; &lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; A3&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140101abcdefgh&lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; A4&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140202abcdefgh&lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Coupé&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140303abcdefgh&lt;/P&gt;
&lt;/PRE&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;loaded with QlikView:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;PRE __default_attr="plain" __jive_macro_name="code" class="jive_macro_code jive_text_macro _jivemacro_uid_14285095394001278" jivemacro_uid="_14285095394001278"&gt;
&lt;P&gt;Data:&lt;/P&gt;
&lt;P&gt;LOAD @1:16 AS BRAND, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @17:35 AS MODEL, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @36:43 AS DATE, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @44:n AS VALUE&lt;/P&gt;
&lt;P&gt;FROM&lt;/P&gt;
&lt;P&gt;test.csv&lt;/P&gt;
&lt;P&gt;(fix, utf8,header is 1 lines);&lt;/P&gt;
&lt;/PRE&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;will give me a wrong DATE for the last record: "2014030" instead of "20140303", because the "é" of "Coupé" will count as 2 characters.&lt;/P&gt;&lt;P&gt;And it's VALUE will be "3abcdefgh" (with a "3" that should not be there).&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;If I convert the same file in ANSI, I don't have the problem.&lt;/P&gt;&lt;P&gt;(please, don't answer me "&lt;EM&gt;so, convert the file in ANSI&lt;/EM&gt;" &lt;IMG src="https://community.qlik.com/legacyfs/online/emoticons/wink.png" /&gt;)&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
    <pubDate>Wed, 08 Apr 2015 16:17:31 GMT</pubDate>
    <dc:creator>nicolas_martin</dc:creator>
    <dc:date>2015-04-08T16:17:31Z</dc:date>
    <item>
      <title>Problem with UTF-8 "fixed record" files</title>
      <link>https://community.qlik.com/t5/QlikView/Problem-with-UTF-8-quot-fixed-record-quot-files/m-p/878255#M306654</link>
      <description>&lt;HTML&gt;&lt;HEAD&gt;&lt;/HEAD&gt;&lt;BODY&gt;&lt;P&gt;Hello,&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;I have data in a text file, encoded in UTF-8 (w/o BOM), with fixed records.&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;When the file contains a special character, this one is considered as 2 characters, and all the following data is parsed wrong (with a shift).&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;This file:&lt;/P&gt;&lt;PRE __default_attr="plain" __jive_macro_name="code" class="jive_macro_code jive_text_macro _jivemacro_uid_14285095012749837" jivemacro_uid="_14285095012749837"&gt;
&lt;P&gt;BRAND&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; MODEL&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; DATE&amp;nbsp;&amp;nbsp;&amp;nbsp; VALUE&amp;nbsp;&amp;nbsp; &lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; A3&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140101abcdefgh&lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; A4&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140202abcdefgh&lt;/P&gt;
&lt;P&gt;Audi&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Coupé&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; 20140303abcdefgh&lt;/P&gt;
&lt;/PRE&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;loaded with QlikView:&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;PRE __default_attr="plain" __jive_macro_name="code" class="jive_macro_code jive_text_macro _jivemacro_uid_14285095394001278" jivemacro_uid="_14285095394001278"&gt;
&lt;P&gt;Data:&lt;/P&gt;
&lt;P&gt;LOAD @1:16 AS BRAND, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @17:35 AS MODEL, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @36:43 AS DATE, &lt;/P&gt;
&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; @44:n AS VALUE&lt;/P&gt;
&lt;P&gt;FROM&lt;/P&gt;
&lt;P&gt;test.csv&lt;/P&gt;
&lt;P&gt;(fix, utf8,header is 1 lines);&lt;/P&gt;
&lt;/PRE&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;will give me a wrong DATE for the last record: "2014030" instead of "20140303", because the "é" of "Coupé" will count as 2 characters.&lt;/P&gt;&lt;P&gt;And it's VALUE will be "3abcdefgh" (with a "3" that should not be there).&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;&lt;/P&gt;&lt;P&gt;If I convert the same file in ANSI, I don't have the problem.&lt;/P&gt;&lt;P&gt;(please, don't answer me "&lt;EM&gt;so, convert the file in ANSI&lt;/EM&gt;" &lt;IMG src="https://community.qlik.com/legacyfs/online/emoticons/wink.png" /&gt;)&lt;/P&gt;&lt;/BODY&gt;&lt;/HTML&gt;</description>
      <pubDate>Wed, 08 Apr 2015 16:17:31 GMT</pubDate>
      <guid>https://community.qlik.com/t5/QlikView/Problem-with-UTF-8-quot-fixed-record-quot-files/m-p/878255#M306654</guid>
      <dc:creator>nicolas_martin</dc:creator>
      <dc:date>2015-04-08T16:17:31Z</dc:date>
    </item>
  </channel>
</rss>

