<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>article tFileInputXML Component does not extract element values within a Spark Job in Official Support Articles</title>
    <link>https://community.qlik.com/t5/Official-Support-Articles/tFileInputXML-Component-does-not-extract-element-values-within-a/ta-p/2151718</link>
    <description>&lt;DIV class="talend-tkb-migrated-content"&gt;&lt;DIV class="lia-message-template-content-zone"&gt; 
 &lt;TABLE style="word-break: keep-all;"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1" style="width: 25%;"&gt;&lt;STRONG&gt;Talend Version (Required)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;6.3.1&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt; &lt;P&gt;&lt;STRONG&gt;Summary&lt;/STRONG&gt;&lt;/P&gt; &lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Additional Versions&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Product (Required)&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;Big Data&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Component (Required)&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;Studio Spark&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Problem Description&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt; &lt;P&gt;A Talend 6.3.1 Spark Job contains a &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component to extract XML element values (for instance, here, &lt;STRONG&gt;ID&lt;/STRONG&gt;) within element (&lt;STRONG&gt;Incident&lt;/STRONG&gt;) that has an Attribute (&lt;STRONG&gt;Active&lt;/STRONG&gt;) from an XML document:&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;PRE&gt;&amp;lt;Incident &lt;STRONG&gt;Active&lt;/STRONG&gt;="true"&amp;gt;
&amp;lt;ID&amp;gt;Incident2017&amp;lt;/ID&amp;gt;
&amp;lt;AssignmentGroup&amp;gt;FoundationTeam&amp;lt;/AssignmentGroup&amp;gt;
&amp;lt;CommentsCount&amp;gt;0&amp;lt;/CommentsCount&amp;gt;
&amp;lt;CompanyName&amp;gt;My Company&amp;lt;/CompanyName&amp;gt;
..
&amp;lt;/Incident&amp;gt;&lt;/PRE&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;The expected behavior is that &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component extracts the &lt;STRONG&gt;Incident2017&lt;/STRONG&gt; value for the &lt;STRONG&gt;ID&lt;/STRONG&gt; element. The problem is that the element values extracted by the &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component are null values when executing a Spark Job.&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;When you remove the &lt;STRONG&gt;Active&lt;/STRONG&gt; attribute of the&lt;STRONG&gt; Incident&lt;/STRONG&gt; element, then the element values (here, &lt;STRONG&gt;Incident2017&lt;/STRONG&gt;, &lt;STRONG&gt;FoundationTeam&lt;/STRONG&gt;, and &lt;STRONG&gt;My Company&lt;/STRONG&gt;) can be extracted correctly with the &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component in a Spark job.&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;This issue does not occur when executing &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component within a Standard Job.&lt;/P&gt; &lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Problem root cause&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Solution or Workaround&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;This issue is fixed with Talend 6.4.1 and 6.3.2 versions. For Talend 6.2.1, the issue is solved by applying patch &lt;STRONG&gt;Patch_20170522_TPS-1949_v1-6.3.1.zip&lt;/STRONG&gt;.&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;JIRA ticket number&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;A href="https://jira.talendforge.org/browse/TBD-4903" target="_blank"&gt;TBD-4903&lt;/A&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt; 
&lt;/DIV&gt;&lt;/DIV&gt;</description>
    <pubDate>Fri, 09 Feb 2024 18:22:49 GMT</pubDate>
    <dc:creator>TalendSolutionExpert</dc:creator>
    <dc:date>2024-02-09T18:22:49Z</dc:date>
    <item>
      <title>tFileInputXML Component does not extract element values within a Spark Job</title>
      <link>https://community.qlik.com/t5/Official-Support-Articles/tFileInputXML-Component-does-not-extract-element-values-within-a/ta-p/2151718</link>
      <description>&lt;DIV class="talend-tkb-migrated-content"&gt;&lt;DIV class="lia-message-template-content-zone"&gt; 
 &lt;TABLE style="word-break: keep-all;"&gt;&lt;TBODY&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1" style="width: 25%;"&gt;&lt;STRONG&gt;Talend Version (Required)&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;6.3.1&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt; &lt;P&gt;&lt;STRONG&gt;Summary&lt;/STRONG&gt;&lt;/P&gt; &lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Additional Versions&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Product (Required)&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;Big Data&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Component (Required)&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;Studio Spark&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Problem Description&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt; &lt;P&gt;A Talend 6.3.1 Spark Job contains a &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component to extract XML element values (for instance, here, &lt;STRONG&gt;ID&lt;/STRONG&gt;) within element (&lt;STRONG&gt;Incident&lt;/STRONG&gt;) that has an Attribute (&lt;STRONG&gt;Active&lt;/STRONG&gt;) from an XML document:&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;PRE&gt;&amp;lt;Incident &lt;STRONG&gt;Active&lt;/STRONG&gt;="true"&amp;gt;
&amp;lt;ID&amp;gt;Incident2017&amp;lt;/ID&amp;gt;
&amp;lt;AssignmentGroup&amp;gt;FoundationTeam&amp;lt;/AssignmentGroup&amp;gt;
&amp;lt;CommentsCount&amp;gt;0&amp;lt;/CommentsCount&amp;gt;
&amp;lt;CompanyName&amp;gt;My Company&amp;lt;/CompanyName&amp;gt;
..
&amp;lt;/Incident&amp;gt;&lt;/PRE&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;The expected behavior is that &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component extracts the &lt;STRONG&gt;Incident2017&lt;/STRONG&gt; value for the &lt;STRONG&gt;ID&lt;/STRONG&gt; element. The problem is that the element values extracted by the &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component are null values when executing a Spark Job.&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;When you remove the &lt;STRONG&gt;Active&lt;/STRONG&gt; attribute of the&lt;STRONG&gt; Incident&lt;/STRONG&gt; element, then the element values (here, &lt;STRONG&gt;Incident2017&lt;/STRONG&gt;, &lt;STRONG&gt;FoundationTeam&lt;/STRONG&gt;, and &lt;STRONG&gt;My Company&lt;/STRONG&gt;) can be extracted correctly with the &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component in a Spark job.&lt;/P&gt; &lt;P&gt;&amp;nbsp;&lt;/P&gt; &lt;P&gt;This issue does not occur when executing &lt;STRONG&gt;tFileInputXML&lt;/STRONG&gt; component within a Standard Job.&lt;/P&gt; &lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Problem root cause&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&amp;nbsp;&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;Solution or Workaround&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;This issue is fixed with Talend 6.4.1 and 6.3.2 versions. For Talend 6.2.1, the issue is solved by applying patch &lt;STRONG&gt;Patch_20170522_TPS-1949_v1-6.3.1.zip&lt;/STRONG&gt;.&lt;/TD&gt;&lt;/TR&gt;&lt;TR&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;STRONG&gt;JIRA ticket number&lt;/STRONG&gt;&lt;/TD&gt;&lt;TD colspan="1" rowspan="1"&gt;&lt;A href="https://jira.talendforge.org/browse/TBD-4903" target="_blank"&gt;TBD-4903&lt;/A&gt;&lt;/TD&gt;&lt;/TR&gt;&lt;/TBODY&gt;&lt;/TABLE&gt; 
&lt;/DIV&gt;&lt;/DIV&gt;</description>
      <pubDate>Fri, 09 Feb 2024 18:22:49 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Official-Support-Articles/tFileInputXML-Component-does-not-extract-element-values-within-a/ta-p/2151718</guid>
      <dc:creator>TalendSolutionExpert</dc:creator>
      <dc:date>2024-02-09T18:22:49Z</dc:date>
    </item>
  </channel>
</rss>

