<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>topic Re: performance improvement in Talend Studio</title>
    <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370447#M133487</link>
    <description>&lt;P&gt;Parallelisation in tDBOutput is often not a performance win, instead it could potentially kill performance because of deadlocks&lt;/P&gt;</description>
    <pubDate>Fri, 08 Oct 2021 12:01:49 GMT</pubDate>
    <dc:creator>Anonymous</dc:creator>
    <dc:date>2021-10-08T12:01:49Z</dc:date>
    <item>
      <title>performance improvement</title>
      <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370443#M133483</link>
      <description>&lt;P&gt;Reading 21 .dat files which holds 22million records and writing into two target tables and reject files after schema check. This is a migration project and we are trying to match the job run time of datastage which is 1.3mins whereas in talend it is taking 2.6mins.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Job design&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;1) tFileList (reading 21 files) --&amp;gt; tFileInputDelimited --&amp;gt; tMap1&lt;/P&gt;&lt;P&gt;2) tDBInput1--&amp;gt; tMap1&lt;/P&gt;&lt;P&gt;3) tMap1 --&amp;gt; splits into 2 flow --&amp;gt; flow 1 --&amp;gt; tSchemaComplaianceCheck1 --&amp;gt; tDBOupt1 and tFileOutputDelimited1&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;flow 2 --&amp;gt; tSchemaComplaianceCheck2 --&amp;gt; tDBOupt2 and tFileOutputDelimited2&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;P&gt;To achieve 2.6mins below is the configuration,&lt;/P&gt;&lt;P&gt;1) In Iterate link - enabled parallel execution to 4&lt;/P&gt;&lt;P&gt;2) Fetch Size in&amp;nbsp;tDBInput1 - 10000&lt;/P&gt;&lt;P&gt;3) tDBOupt1 and tDBOupt2&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;BATCH_SIZE - 100000&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;COMMIT EVERY - 50000&lt;/P&gt;&lt;P&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;Parllel Execution - 12&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Can anyone please suggest, performance improvement steps?&lt;/P&gt;</description>
      <pubDate>Fri, 15 Nov 2024 23:39:09 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370443#M133483</guid>
      <dc:creator>RakeshKumar1</dc:creator>
      <dc:date>2024-11-15T23:39:09Z</dc:date>
    </item>
    <item>
      <title>Re: performance improvement</title>
      <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370444#M133484</link>
      <description>&lt;P&gt;Please help on this question? how can I get the performance. &lt;/P&gt;</description>
      <pubDate>Fri, 08 Oct 2021 09:18:24 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370444#M133484</guid>
      <dc:creator>RakeshKumar1</dc:creator>
      <dc:date>2021-10-08T09:18:24Z</dc:date>
    </item>
    <item>
      <title>Re: performance improvement</title>
      <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370445#M133485</link>
      <description>&lt;P&gt;Hi @Rakesh Kumar​&amp;nbsp;,&lt;/P&gt;&lt;P&gt; you can try to allocate more memory to the jvm : run tab --&amp;gt; advanced settings --&amp;gt; use pecific JVM arguments&lt;/P&gt;&lt;P&gt;-Xms number M memory allocated a the launch of the job&lt;/P&gt;&lt;P&gt;-Xmx number M max memory allocated.&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;in tDBOutput do you use Insert or Update ?&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;Also if the tSchemaComplianceCheck are the same make the split after it&lt;/P&gt;&lt;P&gt;Send me Love and kudos&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;</description>
      <pubDate>Fri, 08 Oct 2021 09:42:03 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370445#M133485</guid>
      <dc:creator>gjeremy1617088143</dc:creator>
      <dc:date>2021-10-08T09:42:03Z</dc:date>
    </item>
    <item>
      <title>Re: performance improvement</title>
      <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370446#M133486</link>
      <description>&lt;P&gt;The tDBInput1 looks like a lookup table. If the datasets are always the same you can write the content into a tHashOutput before and reuse it with the tHashInput for the actual lookup to tMap_1&lt;/P&gt;</description>
      <pubDate>Fri, 08 Oct 2021 12:00:36 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370446#M133486</guid>
      <dc:creator>Anonymous</dc:creator>
      <dc:date>2021-10-08T12:00:36Z</dc:date>
    </item>
    <item>
      <title>Re: performance improvement</title>
      <link>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370447#M133487</link>
      <description>&lt;P&gt;Parallelisation in tDBOutput is often not a performance win, instead it could potentially kill performance because of deadlocks&lt;/P&gt;</description>
      <pubDate>Fri, 08 Oct 2021 12:01:49 GMT</pubDate>
      <guid>https://community.qlik.com/t5/Talend-Studio/performance-improvement/m-p/2370447#M133487</guid>
      <dc:creator>Anonymous</dc:creator>
      <dc:date>2021-10-08T12:01:49Z</dc:date>
    </item>
  </channel>
</rss>

