Ignore:
Timestamp:
08/01/03 11:33:07 (21 years ago)
Author:
tbretz
Message:
*** empty log message ***
Location:
trunk/MagicSoft/Mars/mranforest
Files:
5 edited

Legend:

Unmodified
Added
Removed
  • trunk/MagicSoft/Mars/mranforest/MRanForest.cc

    r2296 r2297  
    9898}
    9999
     100Int_t MRanForest::GetNumDim() const
     101{
     102    return fGammas ? fGammas->GetM().GetNcols() : 0;
     103}
     104
     105
    100106Double_t MRanForest::CalcHadroness(const TVector &event)
    101107{
     
    127133}
    128134
     135Int_t MRanForest::GetNumData() const
     136{
     137    return fHadrons && fGammas ? fHadrons->GetM().GetNrows()+fGammas->GetM().GetNrows() : 0;
     138}
     139
    129140Bool_t MRanForest::SetupGrow(MHMatrix *mhad,MHMatrix *mgam)
    130141{
     
    134145
    135146    // determine data entries and dimension of Hillas-parameter space
    136     fNumHad=fHadrons->GetM().GetNrows();
    137     fNumGam=fGammas->GetM().GetNrows();
    138     fNumDim=fHadrons->GetM().GetNcols();
    139 
    140     if (fNumDim!=fHadrons->GetM().GetNcols()) return kFALSE;
    141 
    142     fNumData=fNumHad+fNumGam;
     147    //fNumHad=fHadrons->GetM().GetNrows();
     148    //fNumGam=fGammas->GetM().GetNrows();
     149
     150    const Int_t dim = GetNumDim();
     151
     152    if (dim!=fGammas->GetM().GetNcols())
     153        return kFALSE;
     154
     155    const Int_t numdata = GetNumData();
    143156
    144157    // allocating and initializing arrays
    145     fHadTrue.Set(fNumData);
     158    fHadTrue.Set(numdata);
    146159    fHadTrue.Reset();
    147     fHadEst.Set(fNumData);
     160    fHadEst.Set(numdata);
    148161
    149162    fPrior.Set(2);
    150163    fClassPop.Set(2);
    151     fWeight.Set(fNumData);
    152     fNTimesOutBag.Set(fNumData);
     164    fWeight.Set(numdata);
     165    fNTimesOutBag.Set(numdata);
    153166    fNTimesOutBag.Reset();
    154167
    155     fDataSort.Set(fNumDim*fNumData);
    156     fDataRang.Set(fNumDim*fNumData);
     168    fDataSort.Set(dim*numdata);
     169    fDataRang.Set(dim*numdata);
    157170
    158171    // calculating class populations (= no. of gammas and hadrons)
    159172    fClassPop.Reset();
    160     for(Int_t n=0;n<fNumData;n++)
     173    for(Int_t n=0;n<numdata;n++)
    161174        fClassPop[fHadTrue[n]]++;
    162175
    163176    // setting weights taking into account priors
    164177    if (!fUsePriors)
    165     {
    166178        fWeight.Reset(1.);
    167     }else{
     179    else
     180    {
    168181        for(Int_t j=0;j<2;j++)
    169             fPrior[j] *= (fClassPop[j]>=1) ?
    170                 Float_t(fNumData)/Float_t(fClassPop[j]):0;
    171 
    172         for(Int_t n=0;n<fNumData;n++)
     182            fPrior[j] *= (fClassPop[j]>=1) ? (Float_t)numdata/fClassPop[j]:0;
     183
     184        for(Int_t n=0;n<numdata;n++)
    173185            fWeight[n]=fPrior[fHadTrue[n]];
    174186    }
     
    186198
    187199    return kTRUE;
     200}
     201
     202void MRanForest::InitHadEst(Int_t from, Int_t to, const TMatrix &m, TArrayI &jinbag)
     203{
     204    for (Int_t ievt=from;ievt<to;ievt++)
     205    {
     206        if (jinbag[ievt]>0)
     207            continue;
     208        fHadEst[ievt] += fRanTree->TreeHad(m, ievt-from);
     209        fNTimesOutBag[ievt]++;
     210    }
    188211}
    189212
     
    206229    }
    207230
    208     TArrayF classpopw(2);
    209     TArrayI jinbag(fNumData); // Initialization includes filling with 0
    210     TArrayF winbag(fNumData); // Initialization includes filling with 0
     231    const Int_t numdata = GetNumData();
    211232
    212233    // bootstrap aggregating (bagging) -> sampling with replacement:
     
    215236    // {0,1,...,fNumData-1}, which is the set of the index numbers of
    216237    // all events in the training sample
    217     for (Int_t n=0; n<fNumData; n++)
    218     {
    219         const Int_t k = Int_t(gRandom->Rndm()*fNumData);
     238    TArrayF classpopw(2);
     239    TArrayI jinbag(numdata); // Initialization includes filling with 0
     240    TArrayF winbag(numdata); // Initialization includes filling with 0
     241
     242    for (Int_t n=0; n<numdata; n++)
     243    {
     244        const Int_t k = Int_t(gRandom->Rndm()*numdata);
    220245
    221246        classpopw[fHadTrue[k]]+=fWeight[k];
     
    237262
    238263    // growing single tree
    239     fRanTree->GrowTree(hadrons,gammas,fNumData,fNumDim,fHadTrue,datsortinbag,
    240                        fDataRang,classpopw,jinbag,winbag,fWeight);
     264    fRanTree->GrowTree(hadrons,gammas,fHadTrue,datsortinbag,
     265                       fDataRang,classpopw,jinbag,winbag);
    241266
    242267    // error-estimates from out-of-bag data (oob data):
     
    249274    // determined from oob-data is underestimated, but can still be taken as upper limit.
    250275
    251     for (Int_t ievt=0;ievt<fNumHad;ievt++)
     276    const Int_t numhad = hadrons.GetNrows();
     277    InitHadEst(0, numhad, hadrons, jinbag);
     278    InitHadEst(numhad, numdata, gammas, jinbag);
     279    /*
     280    for (Int_t ievt=0;ievt<numhad;ievt++)
    252281    {
    253282        if (jinbag[ievt]>0)
     
    256285        fNTimesOutBag[ievt]++;
    257286    }
    258     for (Int_t ievt=0;ievt<fNumGam;ievt++)
    259     {
    260         if (jinbag[fNumHad+ievt]>0)
     287
     288    for (Int_t ievt=numhad;ievt<numdata;ievt++)
     289    {
     290        if (jinbag[ievt]>0)
    261291            continue;
    262         fHadEst[fNumHad+ievt] += fRanTree->TreeHad(gammas, ievt);
    263         fNTimesOutBag[fNumHad+ievt]++;
    264     }
    265 
     292        fHadEst[ievt] += fRanTree->TreeHad(gammas, ievt-numhad);
     293        fNTimesOutBag[ievt]++;
     294    }
     295    */
    266296    Int_t n=0;
    267297    Double_t ferr=0;
    268     for (Int_t ievt=0;ievt<fNumData;ievt++)
     298    for (Int_t ievt=0;ievt<numdata;ievt++)
    269299        if (fNTimesOutBag[ievt]!=0)
    270300        {
     
    301331    // fDataRang(m,n) is the rang of fData(m,n), i.e. if rang = r, fData(m,n) is the r-th highest
    302332    // value of all fData(m,.). There may be more then 1 event with rang r (due to bagging).
    303 
    304     TArrayF v(fNumData);
    305     TArrayI isort(fNumData);
     333    const Int_t numdata = GetNumData();
     334
     335    TArrayF v(numdata);
     336    TArrayI isort(numdata);
    306337
    307338    const TMatrix &hadrons=fHadrons->GetM();
    308339    const TMatrix &gammas=fGammas->GetM();
    309340
    310     for (Int_t j=0;j<fNumHad;j++)
     341    const Int_t numgam = gammas.GetNrows();
     342    const Int_t numhad = hadrons.GetNrows();
     343
     344    for (Int_t j=0;j<numhad;j++)
    311345        fHadTrue[j]=1;
    312346
    313     for (Int_t j=0;j<fNumGam;j++)
    314         fHadTrue[j+fNumHad]=0;
    315 
    316     for (Int_t mvar=0;mvar<fNumDim;mvar++)
    317     {
    318         for(Int_t n=0;n<fNumHad;n++)
     347    for (Int_t j=0;j<numgam;j++)
     348        fHadTrue[j+numhad]=0;
     349
     350    const Int_t dim = GetNumDim();
     351    for (Int_t mvar=0;mvar<dim;mvar++)
     352    {
     353        for(Int_t n=0;n<numhad;n++)
    319354        {
    320355            v[n]=hadrons(n,mvar);
     
    322357        }
    323358
    324         for(Int_t n=0;n<fNumGam;n++)
     359        for(Int_t n=0;n<numgam;n++)
    325360        {
    326             v[n+fNumHad]=gammas(n,mvar);
    327             isort[n+fNumHad]=n;
     361            v[n+numhad]=gammas(n,mvar);
     362            isort[n+numhad]=n;
    328363        }
    329364
    330         TMath::Sort(fNumData,v.GetArray(),isort.GetArray(),kFALSE);
     365        TMath::Sort(numdata,v.GetArray(),isort.GetArray(),kFALSE);
    331366
    332367        // this sorts the v[n] in ascending order. isort[n] is the event number
     
    334369        // event numbers are 0,1,...).
    335370
    336         for(Int_t n=0;n<fNumData-1;n++)
     371        for(Int_t n=0;n<numdata-1;n++)
    337372        {
    338373            const Int_t n1=isort[n];
    339374            const Int_t n2=isort[n+1];
    340375
    341             fDataSort[mvar*fNumData+n]=n1;
    342             if(n==0) fDataRang[mvar*fNumData+n1]=0;
     376            fDataSort[mvar*numdata+n]=n1;
     377            if(n==0) fDataRang[mvar*numdata+n1]=0;
    343378            if(v[n]<v[n+1])
    344379            {
    345                 fDataRang[mvar*fNumData+n2]=fDataRang[mvar*fNumData+n1]+1;
     380                fDataRang[mvar*numdata+n2]=fDataRang[mvar*numdata+n1]+1;
    346381            }else{
    347                 fDataRang[mvar*fNumData+n2]=fDataRang[mvar*fNumData+n1];
     382                fDataRang[mvar*numdata+n2]=fDataRang[mvar*numdata+n1];
    348383            }
    349384        }
    350         fDataSort[(mvar+1)*fNumData-1]=isort[fNumData-1];
     385        fDataSort[(mvar+1)*numdata-1]=isort[numdata-1];
    351386    }
    352387}
     
    354389void MRanForest::ModifyDataSort(TArrayI &datsortinbag, Int_t ninbag, const TArrayI &jinbag)
    355390{
     391    const Int_t numdim=GetNumDim();
     392    const Int_t numdata=GetNumData();
     393
    356394    ninbag=0;
    357     for (Int_t n=0;n<fNumData;n++)
     395    for (Int_t n=0;n<numdata;n++)
    358396        if(jinbag[n]==1) ninbag++;
    359397
    360     for(Int_t m=0;m<fNumDim;m++)
     398    for(Int_t m=0;m<numdim;m++)
    361399    {
    362400        Int_t k=0;
    363401        Int_t nt=0;
    364         for(Int_t n=0;n<fNumData;n++)
     402        for(Int_t n=0;n<numdata;n++)
    365403        {
    366             if(jinbag[datsortinbag[m*fNumData+k]]==1)
     404            if(jinbag[datsortinbag[m*numdata+k]]==1)
    367405            {
    368                 datsortinbag[m*fNumData+nt]=datsortinbag[m*fNumData+k];
     406                datsortinbag[m*numdata+nt]=datsortinbag[m*numdata+k];
    369407                k++;
    370408            }else{
    371                 for(Int_t j=1;j<fNumData-k;j++)
     409                for(Int_t j=1;j<numdata-k;j++)
    372410                {
    373                     if(jinbag[datsortinbag[m*fNumData+k+j]]==1)
     411                    if(jinbag[datsortinbag[m*numdata+k+j]]==1)
    374412                    {
    375                         datsortinbag[m*fNumData+nt]=datsortinbag[m*fNumData+k+j];
     413                        datsortinbag[m*numdata+nt]=datsortinbag[m*numdata+k+j];
    376414                        k+=j+1;
    377415                        break;
  • trunk/MagicSoft/Mars/mranforest/MRanForest.h

    r2296 r2297  
    2929class MRanTree;
    3030class TVector;
     31class TMatrix;
    3132
    3233class MRanForest : public MParContainer
     
    4243    MHMatrix *fGammas;
    4344    MHMatrix *fHadrons;
    44 
    45     Int_t   fNumGam;
    46     Int_t   fNumHad;
    47     Int_t   fNumData;
    48     Int_t   fNumDim;
    4945
    5046    // true  and estimated hadronness
     
    6561    // estimates for classification error of growing forest
    6662    TArrayD fTreeHad;
     63
     64    void InitHadEst(Int_t from, Int_t to, const TMatrix &m, TArrayI &jinbag);
    6765
    6866protected:
     
    9088    MRanTree *GetCurTree() { return fRanTree; }
    9189    Int_t      GetNumTrees() const { return fNumTrees; }
    92     Int_t      GetNumData() const { return fNumData; }
    93     Int_t      GetNumDim() const { return fNumDim; }
     90    Int_t      GetNumData() const;
     91    Int_t      GetNumDim() const;
    9492    Double_t   GetTreeHad(Int_t i) const { return fTreeHad.At(i); }
    9593 
     
    9997    Bool_t AsciiWrite(ostream &out) const;
    10098
    101     ClassDef(MRanForest, 1) // Storage container for tree structure
     99    ClassDef(MRanForest, 0) // Storage container for tree structure
    102100};
    103101
  • trunk/MagicSoft/Mars/mranforest/MRanForestFill.cc

    r2207 r2297  
    5353//
    5454//
    55 MRanForestFill::MRanForestFill(const char *name, const char *title):fNumTrees(100)
     55MRanForestFill::MRanForestFill(const char *name, const char *title):fNumTrees(-1)
    5656{
    5757    //
     
    9898Int_t MRanForestFill::Process()
    9999{
    100     fNum++;
    101     if(!(fRanForest->AddTree(fRanTree)))
     100    if (!(fRanForest->AddTree(fRanTree)))
    102101        return kFALSE;
    103102
    104     return fNum<fNumTrees;
     103    fNum++;
     104
     105    return fNumTrees<0 ? kTRUE : fNum<fNumTrees;
    105106}
    106107
     
    108109{
    109110    fRanForest->SetNumTrees(fNum);
    110 
    111111    return kTRUE;
    112112}
  • trunk/MagicSoft/Mars/mranforest/MRanTree.cc

    r2296 r2297  
    7676}
    7777
    78 void MRanTree::GrowTree(const TMatrix &mhad, const TMatrix &mgam,Int_t numdata, Int_t numdim,TArrayI &hadtrue,
    79                         TArrayI &datasort,TArrayI &datarang,TArrayF &tclasspop,TArrayI &jinbag,
    80                         TArrayF &winbag,TArrayF &weight)
     78void MRanTree::GrowTree(const TMatrix &mhad, const TMatrix &mgam,
     79                        const TArrayI &hadtrue, TArrayI &datasort,
     80                        const TArrayI &datarang, TArrayF &tclasspop, TArrayI &jinbag,
     81                        const TArrayF &winbag)
    8182{
    8283    // arrays have to be initialized with generous size, so number of total nodes (nrnodes)
    8384    // is estimated for worst case
    84     Int_t nrnodes=2*numdata+1;
     85    const Int_t numdim =mhad.GetNcols();
     86    const Int_t numdata=winbag.GetSize();
     87    const Int_t nrnodes=2*numdata+1;
    8588
    8689    // number of events in bootstrap sample
     
    9194    TArrayI bestsplit(nrnodes);
    9295    TArrayI bestsplitnext(nrnodes);
    93     TArrayI nodepop(nrnodes);
    94     TArrayI parent(nrnodes);
    95     TArrayI nodex(numdata);
    96     TArrayI nodestart(nrnodes);
    97 
    98     TArrayI ncase(numdata);
    99     TArrayI iv(numdim);
    100     TArrayI idmove(numdata);
    10196
    10297    fBestVar.Set(nrnodes);
     
    113108
    114109    // tree growing
    115     BuildTree(datasort,datarang,hadtrue,numdim,numdata,bestsplit,
    116               bestsplitnext,nodepop,nodestart,tclasspop,nrnodes,
    117               idmove,ncase,parent,jinbag,iv,winbag,ninbag);
     110    BuildTree(datasort,datarang,hadtrue,bestsplit,
     111              bestsplitnext,tclasspop,winbag,ninbag);
    118112
    119113    // post processing, determine cut (or split) values fBestSplit
     
    141135}
    142136
    143 Int_t MRanTree::FindBestSplit(TArrayI &datasort,TArrayI &datarang,TArrayI &hadtrue,Int_t mdim,
    144                              Int_t numdata,Int_t ndstart,Int_t ndend,TArrayF &tclasspop,
    145                              Int_t &msplit,Float_t &decsplit,Int_t &nbest,TArrayI &ncase,
    146                              TArrayI &jinbag,TArrayI &iv,TArrayF &winbag,Int_t kbuild)
     137Int_t MRanTree::FindBestSplit(const TArrayI &datasort,const TArrayI &datarang,
     138                              const TArrayI &hadtrue,Int_t ndstart,Int_t ndend,TArrayF &tclasspop,
     139                              Int_t &msplit,Float_t &decsplit,Int_t &nbest,
     140                              const TArrayF &winbag)
    147141{
    148142    if(!gRandom)
     
    151145        return kFALSE;
    152146    }
     147
     148    const Int_t nrnodes = fBestSplit.GetSize();
     149    const Int_t numdata = (nrnodes-1)/2;
     150    const Int_t mdim = fGiniDec.GetSize();
    153151
    154152    // weighted class populations after split
     
    161159    // and nsplitnext is the case number of the next larger value of msplit.
    162160
    163     Int_t nc,nbestvar=0,k;
    164     Float_t crit;
    165     Float_t rrn, rrd, rln, rld, u;
     161    Int_t nbestvar=0;
    166162
    167163    // compute initial values of numerator and denominator of Gini-index,
    168164    // Gini index= pno/dno
    169     Float_t pno=0;
    170     Float_t pdo=0;
    171 
     165    Double_t pno=0;
     166    Double_t pdo=0;
    172167    for (Int_t j=0;j<2;j++)
    173168    {
     
    190185
    191186        // Gini index = rrn/rrd+rln/rld
    192         rrn=pno;
    193         rrd=pdo;
    194         rln=0;
    195         rld=0;
     187        Double_t rrn=pno;
     188        Double_t rrd=pdo;
     189        Double_t rln=0;
     190        Double_t rld=0;
    196191
    197192        TArrayF wl(2); // left node
     
    202197        for(Int_t nsp=ndstart;nsp<=ndend-1;nsp++)
    203198        {
    204             nc=datasort[mvar*numdata+nsp];
    205 
    206             u=winbag[nc];
    207             k=hadtrue[nc];
    208 
    209             rln=rln+u*(2*wl[k]+u);
    210             rrn=rrn+u*(-2*wr[k]+u);
    211             rld=rld+u;
    212             rrd=rrd-u;
    213 
    214             wl[k]=wl[k]+u;
    215             wr[k]=wr[k]-u;
    216 
    217             if (datarang[mvar*numdata+nc]<datarang[mvar*numdata+datasort[mvar*numdata+nsp+1]])
    218             {
    219                 if (TMath::Min(rrd,rld)>1.0e-5)
    220                 {
    221                     crit=(rln/rld)+(rrn/rrd);
    222                     if (crit>critvar)
    223                     {
    224                         nbestvar=nsp;
    225                         critvar=crit;
    226                     }
    227                 }
    228             }
     199            const Int_t &nc=datasort[mvar*numdata+nsp];
     200            const Int_t &k=hadtrue[nc];
     201
     202            const Float_t &u=winbag[nc];
     203
     204            rln+=u*(2*wl[k]+u);
     205            rrn+=u*(-2*wr[k]+u);
     206            rld+=u;
     207            rrd-=u;
     208
     209            wl[k]+=u;
     210            wr[k]-=u;
     211
     212            if (datarang[mvar*numdata+nc]>=datarang[mvar*numdata+datasort[mvar*numdata+nsp+1]])
     213                continue;
     214            if (TMath::Min(rrd,rld)<=1.0e-5)
     215                continue;
     216
     217            const Double_t crit=(rln/rld)+(rrn/rrd);
     218            if (crit<=critvar)
     219                continue;
     220
     221            nbestvar=nsp;
     222            critvar=crit;
    229223        }
    230224
    231         if (critvar>critmax) {
    232             msplit=mvar;
    233             nbest=nbestvar;
    234             critmax=critvar;
    235         }
     225        if (critvar<=critmax)
     226            continue;
     227
     228        msplit=mvar;
     229        nbest=nbestvar;
     230        critmax=critvar;
    236231    }
    237232
    238233    decsplit=critmax-crit0;
    239     if (critmax<-1.0e10) jstat=1;
    240 
    241     return jstat;
    242 }
    243 
    244 void MRanTree::MoveData(TArrayI &datasort,Int_t mdim,Int_t numdata,Int_t ndstart,
     234
     235    return critmax<-1.0e10 ? 1 : jstat;
     236}
     237
     238void MRanTree::MoveData(TArrayI &datasort,Int_t ndstart,
    245239                        Int_t ndend,TArrayI &idmove,TArrayI &ncase,Int_t msplit,
    246240                        Int_t nbest,Int_t &ndendl)
     
    249243    // the data in the part of datasort corresponding to the current node is moved to the
    250244    // left if it belongs to the left child and right if it belongs to the right child-node.
    251 
    252     Int_t nc,k,ih;
     245    const Int_t numdata = ncase.GetSize();
     246    const Int_t mdim    = fGiniDec.GetSize();
     247
    253248    TArrayI tdatasort(numdata);
    254249
    255250    // compute idmove = indicator of case nos. going left
    256251
    257     for (Int_t nsp=ndstart;nsp<=nbest;nsp++)
    258     {
    259         nc=datasort[msplit*numdata+nsp];
    260         idmove[nc]=1;
    261     }
    262     for (Int_t nsp=nbest+1;nsp<=ndend;nsp++)
    263     {
    264         nc=datasort[msplit*numdata+nsp];
    265         idmove[nc]=0;
     252    for (Int_t nsp=ndstart;nsp<=ndend;nsp++)
     253    {
     254        const Int_t &nc=datasort[msplit*numdata+nsp];
     255        idmove[nc]= nsp<=nbest?1:0;
    266256    }
    267257    ndendl=nbest;
     
    271261    for(Int_t msh=0;msh<mdim;msh++)
    272262    {
    273         k=ndstart-1;
     263        Int_t k=ndstart-1;
    274264        for (Int_t n=ndstart;n<=ndend;n++)
    275265        {
    276             ih=datasort[msh*numdata+n];
    277             if (idmove[ih]==1) {
    278                 k++;
    279                 tdatasort[k]=datasort[msh*numdata+n];
    280             }
     266            const Int_t &ih=datasort[msh*numdata+n];
     267            if (idmove[ih]==1)
     268                tdatasort[++k]=datasort[msh*numdata+n];
    281269        }
    282270
    283271        for (Int_t n=ndstart;n<=ndend;n++)
    284272        {
    285             ih=datasort[msh*numdata+n];
    286             if (idmove[ih]==0){
    287                 k++;
    288                 tdatasort[k]=datasort[msh*numdata+n];
    289             }
     273            const Int_t &ih=datasort[msh*numdata+n];
     274            if (idmove[ih]==0)
     275                tdatasort[++k]=datasort[msh*numdata+n];
    290276        }
    291         for(Int_t k=ndstart;k<=ndend;k++)
    292             datasort[msh*numdata+k]=tdatasort[k];
     277
     278        for(Int_t m=ndstart;m<=ndend;m++)
     279            datasort[msh*numdata+m]=tdatasort[m];
    293280    }
    294281
     
    299286}
    300287
    301 void MRanTree::BuildTree(TArrayI &datasort,TArrayI &datarang,TArrayI &hadtrue,Int_t mdim,
    302                          Int_t numdata,TArrayI &bestsplit,TArrayI &bestsplitnext,
    303                          TArrayI &nodepop,TArrayI &nodestart,TArrayF &tclasspop,
    304                          Int_t nrnodes,TArrayI &idmove,TArrayI &ncase,TArrayI &parent,
    305                          TArrayI &jinbag,TArrayI &iv,TArrayF &winbag,Int_t ninbag)
     288void MRanTree::BuildTree(TArrayI &datasort,const TArrayI &datarang,
     289                         const TArrayI &hadtrue, TArrayI &bestsplit,
     290                         TArrayI &bestsplitnext, TArrayF &tclasspop,
     291                         const TArrayF &winbag, Int_t ninbag)
    306292{
    307293    // Buildtree consists of repeated calls to two void functions, FindBestSplit and MoveData.
     
    318304    // the next node to be split is numbered k+1.  When no more nodes can be split, buildtree
    319305    // returns.
    320 
    321     Int_t msplit, nbest, ndendl;
    322     Float_t decsplit=0;
    323     TArrayF classpop(2*nrnodes);
     306    const Int_t mdim    = fGiniDec.GetSize();
     307    const Int_t nrnodes = fBestSplit.GetSize();
     308    const Int_t numdata = (nrnodes-1)/2;
     309
     310    TArrayI nodepop(nrnodes);
     311    TArrayI nodestart(nrnodes);
     312    TArrayI parent(nrnodes);
     313
     314    TArrayI ncase(numdata);
     315    TArrayI idmove(numdata);
     316    TArrayI iv(mdim);
     317
     318    TArrayF classpop(nrnodes*2);
    324319    TArrayI nodestatus(nrnodes);
    325 
    326     nodestart.Reset();
    327     nodepop.Reset();
    328320
    329321    for (Int_t j=0;j<2;j++)
     
    331323
    332324    Int_t ncur=0;
    333     nodestart[0]=0;
    334325    nodepop[0]=ninbag;
    335326    nodestatus[0]=2;
    336327
    337328    // start main loop
    338     for (Int_t kbuild=0;kbuild<nrnodes;kbuild++)
     329    for (Int_t kbuild=0; kbuild<nrnodes; kbuild++)
    339330    {
    340331          if (kbuild>ncur) break;
     
    346337          const Int_t ndend=ndstart+nodepop[kbuild]-1;
    347338          for (Int_t j=0;j<2;j++)
    348             tclasspop[j]=classpop[j*nrnodes+kbuild];
    349 
    350           const Int_t jstat=FindBestSplit(datasort,datarang,hadtrue,mdim,numdata,
    351                                           ndstart,ndend,tclasspop,msplit,decsplit,
    352                                           nbest,ncase,jinbag,iv,winbag,kbuild);
    353 
    354           if(jstat==1) {
     339              tclasspop[j]=classpop[j*nrnodes+kbuild];
     340
     341          Int_t msplit, nbest;
     342          Float_t decsplit=0;
     343          const Int_t jstat=FindBestSplit(datasort,datarang,hadtrue,
     344                                          ndstart,ndend,tclasspop,msplit,
     345                                          decsplit,nbest,winbag);
     346
     347          if (jstat==1)
     348          {
    355349              nodestatus[kbuild]=-1;
    356350              continue;
    357           }else{
    358               fBestVar[kbuild]=msplit;
    359               fGiniDec[msplit]+=decsplit;
    360 
    361               bestsplit[kbuild]=datasort[msplit*numdata+nbest];
    362               bestsplitnext[kbuild]=datasort[msplit*numdata+nbest+1];
    363351          }
    364352
    365           MoveData(datasort,mdim,numdata,ndstart,ndend,idmove,ncase,
     353          fBestVar[kbuild]=msplit;
     354          fGiniDec[msplit]+=decsplit;
     355
     356          bestsplit[kbuild]=datasort[msplit*numdata+nbest];
     357          bestsplitnext[kbuild]=datasort[msplit*numdata+nbest+1];
     358
     359          Int_t ndendl;
     360          MoveData(datasort,ndstart,ndend,idmove,ncase,
    366361                   msplit,nbest,ndendl);
    367362
     
    377372          for (Int_t n=ndstart;n<=ndendl;n++)
    378373          {
    379               const Int_t nc=ncase[n];
    380               const Int_t j=hadtrue[nc];
     374              const Int_t &nc=ncase[n];
     375              const Int_t &j=hadtrue[nc];
    381376              classpop[j*nrnodes+ncur+1]+=winbag[nc];
    382377          }
     
    384379          for (Int_t n=ndendl+1;n<=ndend;n++)
    385380          {
    386               const Int_t nc=ncase[n];
    387               const Int_t j=hadtrue[nc];
     381              const Int_t &nc=ncase[n];
     382              const Int_t &j=hadtrue[nc];
    388383              classpop[j*nrnodes+ncur+2]+=winbag[nc];
    389384          }
  • trunk/MagicSoft/Mars/mranforest/MRanTree.h

    r2296 r2297  
    6161
    6262    // functions used in tree growing process
    63     void GrowTree(const TMatrix &mhad, const TMatrix &mgam,Int_t numdata,
    64                   Int_t numdim,TArrayI &hadtrue,
    65                   TArrayI &datasort,TArrayI &datarang,TArrayF &tclasspop,TArrayI &jinbag,
    66                   TArrayF &winbag,TArrayF &weight);
     63    void GrowTree(const TMatrix &mhad, const TMatrix &mgam,
     64                  const TArrayI &hadtrue, TArrayI &datasort,
     65                  const TArrayI &datarang,
     66                  TArrayF &tclasspop, TArrayI &jinbag, const TArrayF &winbag);
    6767
    68     Int_t FindBestSplit(TArrayI &datasort,TArrayI &datarang,TArrayI &hadtrue,Int_t mdim,
    69                         Int_t numdata,Int_t ndstart,Int_t ndend,TArrayF &tclasspop,
    70                         Int_t &msplit,Float_t &decsplit,Int_t &nbest,TArrayI &ncase,
    71                         TArrayI &jinbag,TArrayI &iv,TArrayF &winbag,Int_t kbuild);
     68    Int_t FindBestSplit(const TArrayI &datasort, const TArrayI &datarang,
     69                        const TArrayI &hadtrue,
     70                        Int_t ndstart, Int_t ndend, TArrayF &tclasspop,
     71                        Int_t &msplit, Float_t &decsplit, Int_t &nbest,
     72                        const TArrayF &winbag);
    7273
    73     void MoveData(TArrayI &datasort,Int_t mdim,Int_t numdata,Int_t ndstart,
    74                   Int_t ndend,TArrayI &idmove,TArrayI &ncase,Int_t msplit,
    75                   Int_t nbest,Int_t &ndendl);
     74    void MoveData(TArrayI &datasort, Int_t ndstart, Int_t ndend,
     75                  TArrayI &idmove, TArrayI &ncase, Int_t msplit,
     76                  Int_t nbest, Int_t &ndendl);
    7677
    77     void BuildTree(TArrayI &datasort,TArrayI &datarang,TArrayI &hadtrue,Int_t mdim,
    78                    Int_t numdata,TArrayI &bestsplit,TArrayI &bestsplitnext,
    79                    TArrayI &nodepop,TArrayI &nodestart,TArrayF &tclasspop,
    80                    Int_t nrnodes,TArrayI &idmove,TArrayI &ncase,TArrayI &parent,
    81                    TArrayI &jinbag,TArrayI &iv,TArrayF &winbag,Int_t ninbag);
     78    void BuildTree(TArrayI &datasort, const TArrayI &datarang,
     79                   const TArrayI &hadtrue,
     80                   TArrayI &bestsplit,TArrayI &bestsplitnext,
     81                   TArrayF &tclasspop,
     82                   const TArrayF &winbag,
     83                   Int_t ninbag);
    8284
    8385    Double_t TreeHad(const TVector &event);
Note: See TracChangeset for help on using the changeset viewer.