Gli algoritmi di ordinamento non basati sul confronto Zotti Paolo 62SI December 2001

Slides:



Advertisements
Presentazioni simili
Problema dellordinamento Input: Sequenza di n numeri Output: Permutazione π = tale che: a 1 a 2 …… a n Subroutine in molti problemi E possibile effettuare.
Advertisements

Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità E1 Dallanalisi del problema alla definizione dellalgoritmo.
Analisi della complessità degli algoritmi
Analisi della complessità degli algoritmi
Fondamenti di Informatica I CDL in Ingegneria Elettronica - A.A CDL in Ingegneria Elettronica - A.A Il Problema dellordinamento.
Fondamenti di Informatica I CDL in Ingegneria Elettronica - A.A CDL in Ingegneria Elettronica - A.A Il Problema dellordinamento.
8. Problemi ricorrenti: ordinamento e ricerca Ing. Simona Colucci
Hash Tables Indirizzamento diretto Tabelle Hash Risoluzioni di collisioni Indirizzamento aperto.
Algoritmi e Dimostrazioni Stefano Berardi
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Ordinamenti lineari.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Usa la tecnica del.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Ordinamenti ottimi.
Algoritmi e Strutture Dati
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Ordinamenti lineari.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Ordinamenti lineari.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Usa la tecnica del.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl 1 Ordinamenti lineari.
Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie di analisi.
Iterazione enumerativa (for)
TEORIA RAPPRESENTAZIONALE DELLA MISURA
Algoritmo di Ford-Fulkerson
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Capitolo 4 Ordinamento:
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Capitolo 4 Ordinamento:
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
Capitolo 4 Ordinamento: Selection e Insertion Sort Algoritmi e Strutture Dati.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Usa la tecnica del.
Capitolo 4 Ordinamento: Selection e Insertion Sort Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati
Capitolo 4 Ordinamento: Selection e Insertion Sort Algoritmi e Strutture Dati.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Problemi e algoritmi Anno Accademico 2009/2010.
Algoritmi e Strutture Dati (Mod. A)
Alberi di Ricorrenza Gli alberi di ricorrenza rappresentano un modo conveniente per visualizzare i passi di sostitu- zione necessari per risolvere una.
Algoritmi e Strutture Dati (Mod. B)
07/04/2003Algoritmi Ricerca in una sequenza di elementi Data una sequenza di elementi, occorre verificare se un elemento fa parte della sequenza oppure.
QuickSort Quick-Sort(A,s,d) IF s < d THEN q = Partiziona(A,s,d) Quick-Sort(A,s,q-1) Quick-Sort(A,q + 1,d)
successioni e limiti di successioni
Notazioni Asintotiche e Ordini di Grandezza delle funzioni
Intelligenza Artificiale Algoritmi Genetici
Elementi di Informatica di base
Radix-Sort(A,d) // A[i] = cd...c2c1
Algoritmi e Strutture Dati
La complessità media O(n log n) di Quick-Sort vale soltanto se tutte le permutazioni dell’array in ingresso sono ugualmente probabili. In molte applicazioni.
IL MASSIMO DI UN ARRAY ESERCIZIO
ALGORITMI a.
IO E LA MATEMATICA PROCEDURALE
Algoritmi CHE COS’è UN ALGORITMO di ORDINAMENTO?
Definizione di un algoritmo
Algoritmi e Strutture Dati Luciano Gualà
Implementazione di dizionari Problema del dizionario dinamico Scegliere una struttura dati in cui memorizzare dei record con un campo key e alcuni altri.
Rappresentazione dell’informazione nel calcolatore.
La ricorsione.
GLI ALGORITMI VISIBILE SUL BLOG INFORMATICA ANNO SCOLASTICO 2013 / 2014 GABRIELE SCARICA 2°T.
Ordinamento in tempo lineare Il limite inferiore Ω(n log n) vale per tutti gli algoritmi di ordinamento generali, ossia per algoritmi che non fanno alcuna.
Paola Disisto, Erika Griffini, Yris Noriega.  Insieme ordinato di operazioni non ambigue ed effettivamente computabili che, quando eseguito, produce.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Capitolo 4 Ordinamento:
Il problema della ricerca Algoritmi e Strutture Dati.
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw - Hill Companies, srl Capitolo 4 Ordinamento:
Complessità Computazionale
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
GLI ALGORITMI DI ORDINAMENTO
“ Pseudocodice ” Un programma per computer lavorerà su in insieme di “ variabili ” contenenti i dati del problema, soluzioni intermedie, soluzioni finali.
Analisi matematica Introduzione ai limiti
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Lezione n. Parole chiave: Corso di Laurea: Insegnamento: Docente: A.A Salvatore Cuomo La ricorsione 15 Approccio ricorsivo, esercizi sulla.
Transcript della presentazione:

Gli algoritmi di ordinamento non basati sul confronto Zotti Paolo 62SI December

Struttura del Progetto IL PROGETTO E DIVISO IN 2 PARTI IL PROGETTO E DIVISO IN 2 PARTI : RELAZIONE SOFTWARE - Linguaggio C++

Struttura della relazione ARGOMENTI ATTINENTI ALLORDINAMENTO ARGOMENTI ATTINENTI ALLORDINAMENTO Introduzione allordinamento Complessità degli algoritmi di ordinamento I numeri casuali Le liste concatenate (semplici e doppie) STUDIO DI 3 ALGORITMI DI ORDINAMENTO NON BASATI SUL CONFRONTO E LO SCAMBIO STUDIO DI 3 ALGORITMI DI ORDINAMENTO NON BASATI SUL CONFRONTO E LO SCAMBIO Counting Sort Radix Sort Bucket Sort TESTING DEGLI ALGORITMI TESTING DEGLI ALGORITMI Test sugli algoritmi di ordinamento Test sulla generazione di numeri casuali

Input: Insieme di dati disordinato Ordinamento effettuato con: Counting Sort o Radix Sort o Bucket Sort Cosa fa il software creato Output: Insieme di dati ordinato Calcolo del tempo

Struttura del software Scenario Diagrams Scenario Diagrams Class Rand State Diagrams State Diagrams Class Bucket Sort Component Diagrams Component Diagrams Class Liste Use Case Diagrams Use Case Diagrams Class Counting Sort State Diagrams State Diagrams Class Radix Sort Il listato principale, Main, coordina tutto il programma Main

Introduzione Buon giorno sono il sign. Cormen, il mago degli algoritmi. Vi aiuterò a capire meglio il contenuto di questa relazione. Cominciamo subito con alcune definizioni basilari

Il tempo di calcolo T ( n ) Il tempo occorrente ad ordinare un insieme di dati, si puo rappresentare attraverso una funzione. La funzione T(n). n Tempo Quantità dei dati Esatto! Il tempo di calcolo di una procedura è il costo complessivo delle operazioni elementari in funzione della dimensione n dei dati in ingresso. Nel valutare il tempo di calcolo T(n), è difficile quantificare con esattezza il numero di operazioni elementari eseguite. Questa difficoltà viene aggirata valutando il numero di operazioni in ordine di grandezza, cioè esprimendole come limitazioni della funzione T(n) al tendere allinfinito della dimensione n dei dati in ingresso.

La limitazione può essere: O Limitazione superiore Caso Peggiore 2 Limitazione sup. e inf. equivalente S Limitazione inferiore Caso Migliore Il costo delle operazioni é valutato principalmente nel caso peggiore, perché presenta il vantaggio di garantire che lalgoritmo non richiederà mai per nessun dato in ingresso di dimensione n, un tempo maggiore.

Input Output ALGORITMO Cosa è un algoritmo??? Qualsiasi procedura computazionale ben definita che prende alcuni valori, come input e produce alcuni valori, come output é chiamata algoritmo. Un algoritmo é quindi una sequenza di passi computazionali che trasformano l'input nell'output.

Insieme di dati disordinato ALGORITMO Di ordinamento Cosa è lordinamento? L'ordinamento, consiste nel disporre un gruppo di informazioni in ordine crescente o decrescente utilizzando un algoritmo di ordinamento. Insieme di dati ordinato

Chiave dellordinamento Occupazione Hobby Residenza Religione Nome l Cognome Data nascita Chiave Struttura di dati In genere, quando si esegue un ordinamento, come chiave dell'ordinamento, cioè l'oggetto con cui si fa il confronto, viene utilizzata solo una parte delle informazioni disponibili. La chiave é quella parte dei dati che determina la posizione relativa dei vari elementi. Pertanto nel confronto fra gli elementi, viene utilizzata solo la chiave ma, nello scambio dei dati, viene trasferita l'intera struttura.

Ora vi spiegherò gli algoritmi di ordinamento trattati in questa relazione. Sono tutti algoritmi che non basano il proprio funzionamento sul confronto e lo scambio di dati. Passiamo allo studio del primo algoritmo di ordinamento: Counting Sort

Counting Sort: idea di base Counting Sort, si basa sullipotesi che ognuno degli n elementi in input sia un intero nellintervallo da 1 a k ove k è un numero non troppo grande. Si determina, per ogni elemento x in input, il numero di elementi minori di x. Questa informazione può essere usata per porre lelemento x, direttamente nella sua esatta posizione nellarray di output. Per es., se vi sono 10 elementi minori di x, x va messo in undicesima posizione nellarray di output. Lalgoritmo deve gestire situazioni in cui alcuni elementi abbiano lo stesso valore, infatti non si vuole metterli tutti nella stessa posizione nellarray di output.

Counting Sort: proprietà E veloce perché fa delle ipotesi sullinput, infatti, assume che linput, consista di numeri interi in un piccolo intervallo. E veloce perché fa delle ipotesi sullinput, infatti, assume che linput, consista di numeri interi in un piccolo intervallo. Stabile Stabile Risorse occorrenti: 3 array Risorse occorrenti: 3 array array A: array di dimensione n, contenente gli n numeri da ordinare: array B: array di dimensione n, contenente la sequenza degli n numeri ordinata Array C: array di dimensione k, temporaneo di lavoro, dove k é il massimo numero trovato in A

Cosa significa stabile??? Un algoritmo è stabile quando elementi con lo stesso valore, compaiono nellarray di input, nello stesso ordine in cui compaiono in quello di output. Cioè, lo spareggio tra due elementi con lo stesso valore avviene secondo la regola per cui qualunque numero compaia per primo nellarray di input, appare per primo nellarray di output.

Counting Sort : esempio C A s Esecuzione di Counting Sort su un array di input A[ 8 ], dove ogni elemento di A é un intero positivo non più grande di k=6. Temporaneo di lavoro B inputoutput Si dimensiona larray C, con il massimo numero k in A

Counting Sort : prima fase A input Scorrendo tutto larray partendo da A [ 1 ] fino ad arrivare ad A [ 8 ]; se il valore di un elemento in input é i, si incrementa C[ i ]. Così, alla fine C[ i ] contiene il numero di elementi di input uguali ad i per ciascun intero i=1,2,…,k. C C C C C C C C

Seconda fase: somma cumulata Si determina per ciascun i = 1,2,…,k, quanti elementi dell'input sono minori o uguali ad i. Questo viene fatto determinando la somma cumulata degli elementi dell'array C[ ]. Si determina per ciascun i = 1,2,…,k, quanti elementi dell'input sono minori o uguali ad i. Questo viene fatto determinando la somma cumulata degli elementi dell'array C[ ]. For x = 2 to 6 For x = 2 to 6 C [ i ] = C [ i ] + C [ i-1 ] C [ i ] = C [ i ] + C [ i-1 ] C prima C dopo

Terza fase: sistemazione in B B input A output C

Counting Sort: terza fase, prima iterazione Partendo dallultima posizione di A, si prende il numero contenuto in A [ 8 ] = 4. Guardiamo cosa è contenuto in C [ 4 ] = 7. Sistemiamo il 4 in B [ 7 ] B A O C

Counting Sort: seconda iterazione B A O C Qualcosa non funziona, così facendo perdiamo un dato.

Attenzione! Dobbiamo gestire il caso in cui gli elementi contenuti in A, non siano tutti distinti A O O

Ripartiamo dallinizio B C Prima Dopo Per questo, decrementiamo C[4], in modo che alla prossima iterazione, nel caso di elementi non distinti, il numero si inserisca nellarray di output, nella sua corretta posizione A O C

Counting Sort: terza fase, prima iterazione Partendo dallultima posizione di A, si prende il numero contenuto in A [ 8 ] = 4. Guardiamo cosa è contenuto in C [ 4 ] = 7. Sistemiamo il 4 in B [ 7 ] Decrementiamo C [ 4 ] B A O C C Dopo

Counting Sort: terza fase, seconda iterazione B A O C C

Counting Sort: terza fase, terza iterazione B A O C C Dopo

Situzione finale: array ordinato B Continuando con queste iterazioni, alla fine otterremo unarray ordinato.

Tempo impiegato da Counting Sort T= 2 ( k+n ) Abbiamo calcolato attraverso formule matematiche, che il tempo è lineare e quindi che Il limite superiore e inferiore si equivalgono cioè che il tempo impiegato nel caso peggiore (array ordinato in modo decrescente) equivale al tempo impiegato nel caso migliore (array ordinato in modo crescente). Questa è una caratteristica degli algoritmi di ordinamento non basati sul confronto. Ora dobbiamo verificare con dei test se il tempo calcolato equivale al tempo realmente impiegato dallalgoritmo. n Tempo

La limitazione può essere: O Limitazione superiore Caso Peggiore 2 Limitazione sup. e inf. equivalente S Limitazione inferiore Caso Migliore

Test Counting Sort

Scopo del test, verificare e dimostrare 2 ipotesi, la prima: Scopo del test, verificare e dimostrare 2 ipotesi, la prima: dato che questo algoritmo di ordinamento é basato sulla distribuzione e usa metodi, per ordinare l'insieme dei dati, non basati sul confronto e lo scambio, l'ordine dei numeri in input non dovrebbe influire sulle prestazioni dell'algoritmo;

Prima ipotesi dimostrata CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Lordine dei numeri non influisce sulle prestazioni dellalgoritmo.

Test Counting Sort La seconda ipotesi da dimostrare è la seguente: La seconda ipotesi da dimostrare è la seguente: il tempo necessario all'ordinamento cresca in modo lineare al crescere di n, dove n rappresenta la quantità dei numeri da ordinare.

Verifica della linearità CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Il tempo cresce in modo lineare, allaumentare della dimensione n dei dati in ingresso.

Passiamo allo studio del prossimo algoritmo di ordinamento: Radix Sort

Radix Sort IDEA DI BASE IDEA DI BASE Lidea, consiste nell'utilizzare un qualsiasi algoritmo di ordinamento, che ordini l'array usando come chiave di ordinamento la cifra meno significativa. Quando l'intero array è ordinato sulla cifra meno significativa, lo si ordina sulla seconda cifra meno significativa utilizzando un algoritmo stabile. Il processo continua finché i numeri sono stati ordinati su tutte le d cifre. A quel punto, i numeri sono completamente ordinati.

Radix Sort Ossia: For X = 1 to N Usa un ordinamento stabile per ordinare lintero array sulla cifra X

Proprietà, particolarità e risorse utilizzate Risorse hardware occorrenti: Risorse hardware occorrenti: Quelle utilizzate dallalgoritmo di ordinamento intermedio Particolarità: Particolarità: Radix Sort, ordina i numeri in modo contro intuitivo, cioè non naturale, ordinando prima sulla cifra meno significativa, poi sulla seconda cifra meno significativa, e così via fino alla cifra più significativa. Proprietà: Stabilità: Se l'algoritmo utilizzato per l'ordinamento intermedio é stabile, cioè, ha la proprietà che numeri con lo stesso valore appaiono nell'array di output nello stesso ordine di ingresso, avremo alla fine un array ordinato. La stabilità dellalgoritmo di ordinamento intermedio è indispensabile.

Radix Sort : esempio 329 ARRAY ORIGINALE s Esecuzione di Radix Sort su un array di input A [ 7 ], dove ogni elemento di A é un intero positivo

Radix Sort La prima operazione che deve eseguire RadixSort, é quella di effettuare l'ordine, usando come chiave di ordinamento, la cifra meno significativa dei numeri stessi. La prima operazione che deve eseguire RadixSort, é quella di effettuare l'ordine, usando come chiave di ordinamento, la cifra meno significativa dei numeri stessi. Logicamente, ad ogni ordinamento sulla chiave (cifra meno significativa), deve corrispondere uno spostamento di tutta la struttura (il numero in esame). Per questo, é importante che l'ordine intermedio venga eseguito da un algoritmo di ordinamento stabile. Logicamente, ad ogni ordinamento sulla chiave (cifra meno significativa), deve corrispondere uno spostamento di tutta la struttura (il numero in esame). Per questo, é importante che l'ordine intermedio venga eseguito da un algoritmo di ordinamento stabile Larray al primo passaggio: i numeri risultano parzialmente ordinati. Larray al primo passaggio: i numeri risultano parzialmente ordinati O

Radix Sort la seconda operazione che deve eseguire RadixSort é quella di effettuare l'ordine, usando come chiave di ordinamento, la seconda cifra meno significativa la seconda operazione che deve eseguire RadixSort é quella di effettuare l'ordine, usando come chiave di ordinamento, la seconda cifra meno significativa Larray al secondo passaggio: i numeri risultano parzialmente ordinati. Larray al secondo passaggio: i numeri risultano parzialmente ordinati O

Radix Sort la terza operazione che deve eseguire RadixSort é quella di effettuare l'ordine, usando come chiave di ordinamento, la terza cifra meno significativa la terza operazione che deve eseguire RadixSort é quella di effettuare l'ordine, usando come chiave di ordinamento, la terza cifra meno significativa Larray al terzo passaggio: i numeri risultano ordinati. Larray al terzo passaggio: i numeri risultano ordinati O

Possiamo calcolare in anticipo i cicli da effettuare??? Importante: in questo caso, dato che i numeri interi presi in analisi, sono composti da 3 cifre ciascuno, sono sufficienti 3 passaggi per ottenere un ordine definitivo. Importante: in questo caso, dato che i numeri interi presi in analisi, sono composti da 3 cifre ciascuno, sono sufficienti 3 passaggi per ottenere un ordine definitivo. Quindi, in un array contenente n numeri interi composti ognuno di d cifre, occorrono d passaggi per ordinare completamente il vettore. Quindi, in un array contenente n numeri interi composti ognuno di d cifre, occorrono d passaggi per ordinare completamente il vettore.

Tempo impiegato da Radix Sort IL TEMPO E LINEARE. Il limite superiore e inferiore si equivalgono. n Tempo 2 ( d x n )

Test Radix Sort

Scopo del test, verificare e dimostrare 2 ipotesi, la prima: Scopo del test, verificare e dimostrare 2 ipotesi, la prima: dato che questo algoritmo di ordinamento é basato sulla distribuzione e usa metodi, per ordinare l'insieme dei dati, non basati sul confronto e lo scambio, l'ordine dei numeri in input non dovrebbe influire sulle prestazioni dell'algoritmo;

Lordine dei numeri non influisce sul tempo CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Lordine dei numeri non influisce sulle prestazioni dellalgoritmo.

Test Radix Sort Seconda ipotesi da dimostrare: Seconda ipotesi da dimostrare: il tempo necessario all'ordinamento cresca in modo lineare al crescere di n, dove n rappresenta la quantità dei numeri da ordinare.

Verifica della linearità CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Il tempo cresce in modo lineare, allaumentare della dimensione n dei dati in ingresso.

Passiamo allo studio dellultimo algoritmo di ordinamento, cioè Bucket Sort

Bucket Sort IDEA DI BASE (1) IDEA DI BASE (1) L'idea generale di Bucket Sort é quella di dividere un intervallo prefissato in n sotto intervalli di uguale dimensione, detti bucket (cestini), e quindi distribuire gli n elementi da ordinare nei rispettivi bucket.

Esempio: ordine delle carte da ramino Cuori fiori picche quadri 5 Il bucket cuori conterrà le carte di cuori Il bucket quadri conterrà le carte di quadri Il bucket fiori conterrà le carte di fiori Il bucket picche conterrà le carte di picche

Bucket Sort IDEA DI BASE IDEA DI BASE L'idea generale di Bucket Sort é quella di dividere un intervallo prefissato in n sotto intervalli di uguale dimensione, detti bucket (cestini), e quindi distribuire gli n elementi da ordinare nei rispettivi bucket. Sotto l'assunzione che gli elementi dell'input siano uniformemente distribuiti nell'intervallo specificato, non ci si aspetta che molti numeri cadano nello stesso bucket. Per produrre l'output, si ordinano semplicemente i numeri di ogni bucket, con un algoritmo di ordinamento e quindi, si elencano gli elementi di ogni bucket prendendoli in ordine.

Bucket Sort Cioè: 1) For X = 1 to N (N= quantità numeri in input) trova in quale bucket va inserito lelemento array[x] e inseriscicelo trova in quale bucket va inserito lelemento array[x] e inseriscicelo 2) For X = 1 to numero bucket ordina il bucket [X] con un algoritmo di ordinamento ordina il bucket [X] con un algoritmo di ordinamento 3) Concatena insieme i bucket [1]…bucket [2]… ……bucket [numero dei bucket] ……bucket [numero dei bucket]

Bucket Sort Risorse hardware occorrenti: Risorse hardware occorrenti: Il codice richiede un array, liste [ bucket ], di liste a doppio concatenamento, dove ogni elemento di liste [ bucket ] rappresenta un bucket. Proprietà: Proprietà: BucketSort assume che l'input sia generato da un processo casuale che distribuisce gli elementi in modo uniforme sull'intervallo designato.

Bucket Sort: esempio s Esecuzione di Bucket Sort su un array di input A [ 8 ], dove ogni elemento di A é un double positivo. Supponiamo di dividere l'intervallo [0…1], in 10 sotto intervalli di uguale dimensione, e quindi distribuire gli n elementi da ordinare nei bucket. A Situazione iniziale

Prima operazione: distribuire I numeri Bucket 0 A Bucket Bucket Bucket Bucket 4 Bucket 5 Bucket 6 Bucket Bucket

Bucket Sort Secondo passaggio La seconda operazione che deve eseguire Bucket Sort é quella di ordinare i numeri di ogni bucket, con un algoritmo di ordinamento adatto, in questo caso, visto che l'insieme numerico in input é composto da tipi double, si può utilizzare lalgoritmo di ordinamento Insert Sort.

Ordinare I numeri Bucket 0 Bucket 1 Bucket 2 Bucket 3 Bucket 4 Bucket 5 Bucket 6 Bucket 7 Bucket 8 Bucket

Risultato dellordinamento in ogni bucket Bucket 0 Bucket Bucket Bucket Bucket 4 Bucket 5 Bucket 6 Bucket Bucket

Secondo passaggio: ordinare ogni Bucket con un algoritmo di ordinamento basato sul confronto Bucket 0 Bucket 1 Bucket 2 Bucket 3 Bucket 4 Bucket 5 Bucket 6 Bucket 7 Bucket 8 Bucket

Bucket Sort: terzo passaggio La terza ed ultima operazione da eseguire, é quella di concatenare insieme le liste (bucket) liste[0], liste[1],..., liste[n-1] in quest'ordine copiando gli elementi nell'array originale ordinati[ ], ottenendo il seguente risultato: Array ordinato B

Seconda operazione: ordinare I numeri in ogni bucket Bucket Bucket Bucket Bucket Bucket B

Test Bucket Sort

Precisazioni Per non uscire dallargomento della relazione, cioè, gli algoritmi non basati sul confronto e lo scambio, e per sperimentare il comportamento di Bucket Sort con un algoritmo di ordinamento non basato sul confronto, ho deciso di usare come algoritmo di ordinamento intermedio, Radix Sort. Il range dei numeri in input è [0…(2^31)-1] Questo intervallo è stato diviso in bucket

Verificare e dimostrare che: dato che questo algoritmo di ordinamento é basato sulla distribuzione e usa metodi, per ordinare l'insieme dei dati, non basati sul confronto e lo scambio, l'ordine dei numeri in input non dovrebbe influire sulle prestazioni dell'algoritmo;

Lordine dei numeri non influisce sul tempo CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Lordine dei numeri non influisce sulle prestazioni dellalgoritmo.

Era ovvio!!! Se l'algoritmo usato per l'ordinamento intermedio non è influenzato dallordine dei numeri in input, é ovvio che anche Bucket Sort non ne viene influenzato semplicemente perché questo algoritmo, non fa altro che ordinare ogni bucket con lalgoritmo di ordinamento intermedio Radix Sort.

Verificare e dimostrare che: il tempo necessario all'ordinamento cresca in modo lineare al crescere di n, dove n rappresenta la quantità dei numeri da ordinare.

IL TEMPO E LINEARE CASUALE DECRESCENTE CRESCENTE Quantità numeri Inf. Ordine dei numeri time Il tempo cresce in modo lineare, allaumentare della dimensione n dei dati in ingresso.

LOGICO! Il risultato era quello che ci si aspettava, infatti Bucket Sort non fa altro che ordinare i numeri presenti in ogni bucket, usando l'algoritmo Radix Sort che ha un tempo di ordinamento lineare. Da notare, il notevole incremento temporale rispetto a Radix Sort, causato dalla gestione delle liste che rappresentano i bucket.

Differenza con Radix Sort

Secondo Test Bucket Sort

Premessa Si consideri il comportamento di un qualsiasi algoritmo di ordinamento basato sul confronto. Il tempo impiegato da questo algoritmo dipende pesantemente dall'ordine con cui i numeri sono memorizzati nei cestini e dalla quantità numerica presente in ognuno di essi. Si consideri il comportamento di un qualsiasi algoritmo di ordinamento basato sul confronto. Il tempo impiegato da questo algoritmo dipende pesantemente dall'ordine con cui i numeri sono memorizzati nei cestini e dalla quantità numerica presente in ognuno di essi. Nel caso peggiore (ordine inverso), assumendo che ci siano n elementi nel bucket dobbiamo scorrere n-1 elementi. Per ogni elemento occorre esaminare e spostare altri n-1 elementi, per cui risulta una complessità O(n^2), cioè il tempo non cresce in modo lineare ma esponenziale. Nel caso peggiore (ordine inverso), assumendo che ci siano n elementi nel bucket dobbiamo scorrere n-1 elementi. Per ogni elemento occorre esaminare e spostare altri n-1 elementi, per cui risulta una complessità O(n^2), cioè il tempo non cresce in modo lineare ma esponenziale. Con una tale complessità, é conveniente che la presenza numerica in ogni cestino sia la più bassa possibile quindi maggiore è Con una tale complessità, é conveniente che la presenza numerica in ogni cestino sia la più bassa possibile quindi maggiore è Il numero dei cestini minore sarà la presenza numerica in ognuno di essi e di conseguenza minore sarà il tempo di calcolo. Questo è lo scopo della distribuzione di Bucket Sort

Insert Sort casuali

SCOPERTA Visto che Radix Sort ha un tempo lineare la distribuzione diventa assurda perché non ci interessa più che la distribuzione numerica in ogni cestino sia la più bassa possibile Il tempo è e resterà sempre lineare. La conseguenza di questa affermazione é che Bucket Sort, in questo caso, deve essere implementato con 1 solo cestino. A questo punto é solo una perdita di tempo sistemare i numeri nel cestino per poi ordinarli con Radix Sort, é più intelligente farli ordinare direttamente da Radix Sort.

Verificare e dimostrare che: implementare l'algoritmo Bucket Sort usando per l'ordinamento intermedio un algoritmo non basato sul confronto è assurdo. Nessun testo analizzato, contiene spiegazioni riguardo alla fondamentale importanza di usare per lordinamento intermedio un algoritmo basato sul confronto e al contrario, dellassurdità di usarne uno non basato sul confronto Lesperimento consiste nellordinare le stesse quantità numeriche, prima utilizzando un solo bucket e poi utilizzandoli tutti, osservando se il tempo è lo stesso.

Invece usando Radix Sort Quantità numeri Inf. time Il notevole incremento temporale è causato dalla gestione delle liste( bucket).

Il tempo è sprecato in questa fase Bucket 0 Bucket Bucket Bucket Bucket 4 Bucket 5 Bucket 6 Bucket Bucket

Analisi teorica Escludendo il tempo utilizzato nella gestione delle liste e nella distribuzione degli n numeri nei cestini, le prestazioni devono essere equivalenti sia nel caso che si utilizzi 1 solo cestino, sia che si utilizzino tutti i cestini. Lipotesi è dimostrata.

Importante Note: Note: Questo non significa che Bucket Sort è inutile, infatti é nato per ordinare sequenze numeriche in virgola mobile. Usando questo tipo di dati, non é possibile implementare per l'ordinamento intermedio, algoritmi come Counting Sort o Radix Sort, ma diventa necessario rivolgersi ad algoritmi che basano il loro funzionamento sul confronto e lo scambio. Infatti, implementando Bucket Sort con un algoritmo di questo tipo, il numero dei cestini influisce in maniera determinante sul tempo di calcolo perché maggiore é il numero dei cestini, minore sarà la distribuzione numerica in ognuno di essi e di conseguenza, minore sarà il tempo di calcolo.

Test Bucket Sort A titolo di curiosità si osservi il prossimo grafico, che presenta Bucket Sort implementato con l'algoritmo di ordinamento intermedio Insert Sort. Per l'ordinamento di un insieme di numeri fino a circa 1 milione i tempi sono molto vicini allo zero, ma superando il milione di elementi il tempo di calcolo esplode. Infatti, quando la quantità di numeri é relativamente bassa, la distribuzione numerica in ogni cestino é di conseguenza molto bassa e Insert Sort deve eseguire un numero bassissimo di confronti e scambi. A titolo di curiosità si osservi il prossimo grafico, che presenta Bucket Sort implementato con l'algoritmo di ordinamento intermedio Insert Sort. Per l'ordinamento di un insieme di numeri fino a circa 1 milione i tempi sono molto vicini allo zero, ma superando il milione di elementi il tempo di calcolo esplode. Infatti, quando la quantità di numeri é relativamente bassa, la distribuzione numerica in ogni cestino é di conseguenza molto bassa e Insert Sort deve eseguire un numero bassissimo di confronti e scambi. Quando la quantità di numeri presenti in ogni cestino comincia ad aumentare notevolmente, il tempo occorrente all'ordinamento cresce in modo esponenziale. Quando la quantità di numeri presenti in ogni cestino comincia ad aumentare notevolmente, il tempo occorrente all'ordinamento cresce in modo esponenziale.

Grafico

I numeri casuali Il prossimo test viene effettuato per dimostrare che le sequenze numeriche create dal generatore di numeri casuali, siano effettivamente…..casuali. (forse!!!)

Numeri casuali Scopo del test, verificare e dimostrare che: Scopo del test, verificare e dimostrare che: Il primo esperimento, é stato eseguito per verificare che il generatore di numeri casuali crei un insieme di numeri interi, effettivamente distribuiti nell'intervallo [0..2 ^(31-1)] Il generatore crea di numeri e li riversa nei bucket che utilizza lalgoritmo BucketSort; viene contata la quantità di numeri presente in ogni cestino. l'operazione viene ripetuta altre 2 volte. viene calcolata la media in ogni cestino, riportata sul grafico. Se il generatore di numeri casuali, crea numeri interi uniformemente distribuiti nell'intervallo prefissato, nei cestini dovremmo trovare quantità piu o meno uguali di numeri.

Grafico

Bucket SortInsert sortQuick Sort Un algoritmo "efficiente" deve svolgere il suo compito in un tempo accettabile utilizzando le risorse a disposizione senza sprechi. Radix Sort Counting Sort Quindi uso intelligente delle risorse Conclusioni

Architetture e algoritmi Intel 286 Radix Sort Insert Sort Algoritmi ideati per risolvere lo stesso problema, spesso differiscono vistosamente per quanto riguarda la loro efficienza e queste differenze possono essere più significative della differenza tra un calcolatore molto lento e un supercomputer. Algoritmi ideati per risolvere lo stesso problema, spesso differiscono vistosamente per quanto riguarda la loro efficienza e queste differenze possono essere più significative della differenza tra un calcolatore molto lento e un supercomputer. Infatti, se proviamo ad ordinare di numeri ordinati in modo decrescente, con Radix Sort, su un computer dotato di processore intel 286, otterremo un tempo di ordinamento estremamente basso, rispetto ad un ordinamento della stessa sequenza numerica, effettuato sul computer dellInterprise, usando Insert Sort. Infatti, se proviamo ad ordinare di numeri ordinati in modo decrescente, con Radix Sort, su un computer dotato di processore intel 286, otterremo un tempo di ordinamento estremamente basso, rispetto ad un ordinamento della stessa sequenza numerica, effettuato sul computer dellInterprise, usando Insert Sort. Galaxy Questo non significa che Insert Sort, è un algoritmo di scarsa utilità. Infatti con questo algoritmo si possono ordinare i numeri in virgola mobile, cosa non possibile con gli algoritmi analizzati in questa relazione. Ogni algoritmo ha il suo campo di applicazione

Algoritmi efficienti e hardware veloce L'esempio precedente vuole dimostrare che: progettare algoritmi efficienti é importante quanto progettare sistemi hardware sempre più veloci; usare algoritmi specifici in base al problema da risolvere significa usare in modo intelligente le risorse e abbassare notevolmente i tempi di calcolo. Sono due tessere dello stesso mosaico Efficienza Miglior efficienza

The Best Quale algoritmo di ordinamento si é dimostrato il più efficiente in termini di utilizzo: delle risorse ? …e del tempo ?

Sono tutti ottimi Tutti gli algoritmi analizzati in questa ricerca sono degli ottimi "algoritmi di ordinamento", progettati in modo intelligente. Ognuno di questi è ottimo se usato in modo specifico. Bucket Sort Radix Sort Counting Sort Radix Sort Counting Sort Bucket Sort

Uso Intelligente degli algoritmi Counting Sort La scelta dellalgoritmo dipende dal lavoro che si deve eseguire. Sono il più veloce, ma la mia limitazione di range mi penalizza pesantemente, quindi usatemi quando dovete ordinare numeri appartenenti ad un intervallo limitato, per es 0…2^10 Sono un po meno veloce di Counting Sort ma lavoro in qualsiasi Range Radix Sort IDEA: Avere a disposizione unampia varietà di algoritmi da usare in modo appropriato a seconda del problema da risolvere Io devo lavorare solo con elementi in virgola mobile Bucket Sort

THEEND