W, Z e QCD jets + visti dai PAT
2 Sommario ● PAT – Cosa sono – Cosa servono – Come si usano ● Esempi: – 'PAT-tificazione' dei MC CSA08 e SUMMER08 (Z, W, QCDjets + pT > 11 GeV) – Alcune distribuzioni di grandezze significative – Conclusioni – Appendice: il Configuration Browser
3 Physics Analysis Toolkit ● Tutorial: ● General: ● Recipies: ● Si propongono come uno strumento di analisi potente, modulare e flessibile ● Vogliono amalgamare ed uniformare necessita' e sforzi dei vari PAGs ● Assommano ~tutti gli step formali e non di un' analisi Sono intesi (diventare) lo strumento principale di analisi ad ogni livello Utilizzano algoritmi forniti da Offline e POGs Si innestano nel framework software di CMS (CMSSW e FWLite)
4 PAT: Un “ponte” tra il dato e l' analisi finale. Di fatto non sono altro che un MODO di processare i dati o meglio, nel linguaggio di CMSSW, un PATH attraverso cui far passare l'oggetto “event”; In pratica: i moduli si basano sulla classe Candidate ● oggetto con vertice + 4 vettore ● madri e figlie ● Rif. a mebri detector-like ● modulati da Selectors e Combiners
5 pat::jet, pat::met, pat::photon, pat::electron, pat::muons, pat::tau ● ereditano da reco::X ● si possono aggiungere altre info ● si interfacciano con i particle flow objects ● hanno metodi per accedere a MC info, correzioni, isolation, ID, 'parenti' etc Si scrivono nell'event oggetti con le caratteristiche volute ed processati coi metodi desiderati (selezioni, algoritmi etc); alla fine si ha in mano oggetti del tipo
6 ● Event interpretation – “Layer 0”, DA RECO/AOD: cleaning and disambiguation dell'evento + associazione di informazioni (Trigger/MC matching) --> reco::Candidates (+assoc.info) – “Layer 1”: si creano oggetti estesi che racchiudono informazioni esterne associate --> pat::Object ● Event hypothesis – “Layer 2”: event hypothesis dependent tasks --> rende possibile una manipolazione dell'evento in chiave di analisi (sorting di stati finali, Combiners) ● Analisi – [Starter Kit”: tool base per esplorazione dati ed istogrammi] – >> INSERIRE QUI L'ANALISI << I PAT sono stati concepiti con una struttura a LAYER per aumentarne flessibilita' e user-friendliness NB: si puo' fare tutto in una volta!
7 Un main.cfg contiene vari oggetti '.cff' * i vari L1 'cleaner.cfi' [ p.es selezione del tipo di input RECO, ID-based, custom(...) setting dell'isolamento in track.ecal.hacal, rimozione di 'doppioni' o oggetti overlapping (Jet con elettroni, tau etc) * MC Matcher Seq.cff * Trigger MatcherSeq.cff [ID della particella nel MC, DR_min, Pt_rel, l'HLT etc] patLayer1.cff Il patLayer1.cff chiama i vari producer.cff; questia loro volta chiamano: ● Producer.cfi -> ● Selector.cfi, -> ● countFilter.cfi-> (MC/Trig, isolation, correction factors*, b-tagging) numero Min/max di oggetti InputTag src = allLayer1Jets string cut = "et > 0. & abs(eta) 0" } patLayer0.cff Il patLayer0.cff chiama: patLayer(0)1_EventContent.cff seleziona i tag da inserire nell'evento (p.es " keep recoMuons_muons__* " ) patLayer(0)1_ReplaceDefaults_full.cff (!!) ivi si puo' manipolare DIRETTAMENTE i vari settings Si puo' inserire il proprio analyzer e/o 'Layer2' obj. (Z candid, combiners) * nei Producer si puo' immergere le risoluzioni
8 MuonPT11: QCD jets with gen-level filter one muon with pT > ev pb pb-1 Zmumu: Z with gen-level dilepton (electron or muon) filter ev. 664 pb pb-1 Wmunu: W with gen-level dilepton (electron or muon) filter ev pb pb-1 Processato: MC del CSA08_S156: CMSSW_2_0_9, default settings; output in /raid4/bellan/CSA08 Original size W Z QC D+ 138 GB 9.1 GB 5.7 TB 11.9 GB 762 MB 428 GB Final size ~8%! Per esercizio/confornto/update di versioni anche (vedi /castor/cern.ch/user/b/bellanpa): SUMMER08_IDEAL_v9_v1/GEN-SIM-RECO (CMSSW 2_1_x) Zmumu (~12000 ev, *more to come*), Wmn(~ ev.) #ev ℒ
9 10 pb^-1 Qualche distribuzione saliente pT (GeV) Taglio al livello di generatore a 40 GeV GeV Specie nel secondo muone piu' energetico si evidenzia il limite cinematico a ~45 geV Wmn Zmm QCD+m u Total NB: selezioni specifiche per W e Z praticamente assenti Z_M u2 Z_M u1 Mu1 Wm n Zm m
10 La Z viene prodotta prevalentemente ad alto (~3) Ge V eta Z eta Ad alti pT le Z sono piu' centrali Wmn Zmm QCD+ mu Z = 1 – pT (pT-ISO())
11 distanza azimutale tra i due La Z e' spesso prodotta a pT 0 con jets a bilanciare l'impulso nella direzione opposta Cos pT (Ge V) Ad alto pT la Z e' piu' boostata -> l'apertura tra i due muoni si discosta maggiormanete dal back-to-back Differenze nel pt della Z (dovute alla situazione di idealita') Summer08 Ideal 2_1_x CSA08_S156 2_0_x Ge V Z
12 Summer08 Ideal 2_1_x CSA08_S156 2_0_x 10 pb^-1 Wmn QCD+m u Total Ge V WnWn
13 Summer08 Ideal 2_1_x CSA08_S156 2_0_x Zoo m 10 pb^-1 Wmn QCD+m u Total WnWn
14 Molteplicita' di, jets, Wmn Zmm QCD+ mu Wmn Zmm QCD+ mu Wmn Zmm QCD+ mu Tutti gli isto normalizzati ad uno
15 Punti di forza Punti deboli ● Strumenti di analisi standardizzati, condivisi (piu' agevolmente debuggabili); software 'blessed' ● Dovrebbero consentiere un piu' rapido approval dei risultati ● Permettono di passare agevolmente da un analisi all'altra ● 'Schema generale maneggevole e intuitivo; molte technicalities runnano 'sotto il tappeto' ● Layer0 un po' criptico ● Alcune info non facilmente accessibili/gestibili ● Realta' in divenire... speriamo non troppo! Concludendo... ● PAT pratici e comodi (a livello analisi standard) ● sara' sconveniente (e difficile!) non usarli occorre conoscerli e rimanere aggiornati
16 Il Configuration Browser * visualizza la struttura completa del Config File e dei relativi includes * mappa in quali files si posson cercare vari moduli * Mappa quali moduli usano input da quali altri moduli (!) * Edita i moduli coll'editor preferito Tree view Box view Properties Moduli che usano info da altri moduli via InputTag sono connessi da linee per schematizzare e comprendere i Config. Files in Python Informazioni su label,filename e modulo/sequenza di definizione, parametri in input etc