Context Navigation

← Previous Change
Next Change →

Changeset 16603 for trunk

Timestamp:

06/02/13 16:24:14 (13 years ago)

Author:

tbretz

Message:

Fixed some stupid mistakes of the changes yesterday... maybe I was too tired altready that I evern misinterpreted the output of my test program.

File:

: 1 edited

trunk/Mars/mcore/DrsCalib.h (modified) (16 diffs)

Legend:

: Unmodified
: Added
: Removed

trunk/Mars/mcore/DrsCalib.h

-              r16561
+              r16603
 public:
+    DrsCalibrate() : fNumEntries(0), fNumSamples(0), fNumChannels(0) { }
+    DrsCalibrate() : fNumEntries(0), fNumSamples(0), fNumChannels(0)
+    {
+        fSum.reserve(1024*1440);
+        fSum2.reserve(1024*1440);
+    }
     void Reset()
+    {
 …
         fNumSamples  = samples;
         fSum.resize(samples*channels);
         fSum2.resize(samples*channels);
+        fSum.assign(samples*channels, 0);
+        fSum2.assign(samples*channels, 0);
+    }
 …
                 fSum2[abs] += v*v;
+            }
         */
+        }*/
         // This version is 2.5 times faster because the compilers optimization
 …
             const size_t pos = ch*1024;
+            const int16_t *pval    = val + pos;
+            const int16_t *end_val = val + 1024;
+            int64_t *beg_sum  = fSum.data()  + pos;
+            int64_t *beg_sum2 = fSum2.data() + pos;
+            int64_t *psum  = beg_sum  + spos;
+            int64_t *psum2 = beg_sum2 + spos;
+            const int16_t *beg_val  = val          + pos;
+            int64_t       *beg_sum  = fSum.data()  + pos;
+            int64_t       *beg_sum2 = fSum2.data() + pos;
+            const int16_t *pval  = beg_val;          // val[rel]
+            int64_t       *psum  = beg_sum  + spos;  // fSum[abs]
+            int64_t       *psum2 = beg_sum2 + spos;  // fSum2[abs]
             while (psum<beg_sum+1024)
 …
                 const int64_t v = *pval++;
                 *psum++  = v;
                 *psum2++ = v*v;
+                *psum++  += v;
+                *psum2++ += v*v;
+            }
 …
             psum2 = beg_sum2;
             while (pval<end_val)
+            while (pval<beg_val+1024)
+            {
                 const int64_t v = *pval++;
                 *psum++  = v;
                 *psum2++ = v*v;
+                *psum++  += v;
+                *psum2++ += v*v;
+            }
+        }
 …
             const size_t pos = ch*1024;
+            const int16_t *pval    = val + pos;
+            const int16_t *end_val = val + 1024;
+            const int32_t *beg_offset = offset + pos;
+            const int32_t *poffset    = beg_offset + spos;
+            int64_t *beg_sum  = fSum.data()  + pos;
+            int64_t *beg_sum2 = fSum2.data() + pos;
+            int64_t *psum     = beg_sum    + spos;
+            int64_t *psum2    = beg_sum2   + spos;
+            const int16_t *beg_val    = val          + pos;
+            const int32_t *beg_offset = offset       + pos;
+            int64_t       *beg_sum    = fSum.data()  + pos;
+            int64_t       *beg_sum2   = fSum2.data() + pos;
+            const int16_t *pval    = beg_val;            // val[rel]
+            const int32_t *poffset = beg_offset + spos;  // offset[abs]
+            int64_t       *psum    = beg_sum    + spos;  // fSum[abs]
+            int64_t       *psum2   = beg_sum2   + spos;  // fSum2[abs]
             while (psum<beg_sum+1024)
 …
                 const int64_t v = int64_t(*pval++)*scale - *poffset++;
                 *psum++  = v;
                 *psum2++ = v*v;
+                *psum++  += v;
+                *psum2++ += v*v;
+            }
 …
             poffset = beg_offset;
             while (pval<end_val)
+            while (pval<beg_val+1024)
+            {
                 const int64_t v = int64_t(*pval++)*scale - *poffset++;
                 *psum++  = v;
                 *psum2++ = v*v;
+                *psum++  += v;
+                *psum2++ += v*v;
+            }
+        }
 …
                 fSum2[rel] += v*v;
+            }
         }*/
+            }*/
         // This version is 1.5 times faster because the compilers optimization
 …
             const size_t pos = ch*fNumSamples;
             const int16_t *pval = val + pos;
             const int32_t *beg_offset = offset + ch*1024;
             const int32_t *poffset    = beg_offset + spos;
+            int64_t *beg_sum  = fSum.data()  + pos;
             int64_t *beg_sum2 = fSum2.data() + pos;
             int64_t *psum     = beg_sum;
             int64_t *psum2    = beg_sum2;
+            const int32_t *beg_offset = offset       + ch*1024;
+            const int16_t *beg_val    = val          + pos;
+            int64_t *beg_sum          = fSum.data()  + pos;
+            int64_t *beg_sum2         = fSum2.data() + pos;
+            const int16_t *pval    = beg_val;             // val[rel]
+            const int32_t *poffset = beg_offset + spos;   // offset[abs]
+            int64_t *psum          = beg_sum;             // fSum[rel]
+            int64_t *psum2         = beg_sum2;            // fSum2[rel]
             if (spos+fNumSamples>1024)
 …
                     const int64_t v = int64_t(*pval++)*scale - *poffset++;
                     *psum++  = v;
                     *psum2++ = v*v;
+                    *psum++  += v;
+                    *psum2++ += v*v;
+                }
 …
                 const int64_t v = int64_t(*pval++)*scale - *poffset++;
                 *psum++  = v;
                 *psum2++ = v*v;
+                *psum++  += v;
+                *psum2++ += v*v;
+            }
+        }
 …
             return;
+        }
         /*
         for (size_t i=0; i<roi; i++)
 …
             const int64_t div = gain[abs];
             vec[i] = div==0 ? 0 : double(v)*scalegain/div;
+        }*/
+        }
+        */
         // This version is faster because the compilers optimization
         // is not biased by the evaluation of %1024
         // (Here we are dominated by numerics... improvement ~10%)
+        const int32_t *poffset = offset + start;
+        const int64_t *pgain   = gain   + start;
+        const int16_t *pval    = val;
+        float *pvec = vec;
+        const int32_t *poffset = offset + start; // offset[abs]
+        const int64_t *pgain   = gain   + start; // gain[abs]
+        const int16_t *pval    = val;            // val[rel]
+        float         *pvec    = vec;            // vec[rel]
         if (start+roi>1024)
 …
             const int64_t div = gain[abs]*scalerel;
             vec[i] = div==0 ? 0 : double(v)*scalegain/div;
         }*/
+        }
+        */
         // (Here we are dominated by numerics... improvement ~10%)
+        const int32_t *poffset = offset + start;
+        const int64_t *pgain   = gain   + start;
+        const int16_t *pval    = val;
+        const int64_t *ptrgoff = trgoff;
+        float *pvec = vec;
+        const int32_t *poffset = offset + start; // offset[abs]
+        const int64_t *pgain   = gain   + start; // gain[abs]
+        const int16_t *pval    = val;            // val[rel]
+        const int64_t *ptrgoff = trgoff;         // trgoff[rel]
+        float         *pvec    = vec;            // vec[rel]
         if (start+roi>1024)

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 16603 for trunk

Legend:

trunk/Mars/mcore/DrsCalib.h

Download in other formats: