Marco Lapegna home page

High Performance Parallel Computing

corso di laurea in Informatica - Universita' degli Studi di Napoli Federico II

LAB1: implementare le 6 versioni del prodotto di matrici secondo le indicazioni fornite nella Lezione 2/3. Inserirle in un file di nome matmat.c all'interno della cartella Dropbox condivisa. Funzione utile per il tempo di esecuzione disponibile qui: timers

LAB2: implementare la versione del prodotto di matrici a blocchi secondo le indicazioni fornite nella Lezione 2/3. Inserirla in un file matmatblock.c all'interno della cartella Dropbox condivisa

lezione 4: richiami calcolo parallelo

lezione 5: CPU multicore

lezione 6: prod. matrici su CPU multicore

LAB3: implementare la versione multithread del prodotto di matrici econdo le indicazioni fornite nella Lezione 6/7. Inserirla in un file matmatthread.c all'interno della cartella Dropbox condivisa

lezione 7: strumenti per il message passing: MPI

lezione 8/10: sistemi distribuiti e prodotto matrici

LAB4: implementare la versione distribuita del prodotto di matrici secondo le indicazioni fornite nella Lezione 9/10. Inserirla in un file matmatdist.c all'interno della cartella Dropbox condivisa

lezione 11: architettura software di ScaLAPACK

lezione 12: GPU computing e CUDA

lezione 13: prodotto matrici con CUDA

LAB5: implementare la versione CUDA del prodotto di matrici secondo le indicazioni fornite nella Lezione 12/13. Inserirla in un file matmatcuda.cu all'interno della cartella Dropbox condivisa

lezione 14: sistemi di calcolo distribuito

lezione 15: prodotto di matrici in ambienti di c.d.

lezione 16: un esempio di sistema per il c.d.: Netsolve

lezione 17: la fault tolerance

Lezioni anni precedenti al 2020/21 (Calcolo Parallelo e Distribuito 2)

lezione 1: introduzione
- HW0: studiare le prestazioni dell'algoritmo per il prodotto di matrici
lezione 2: influenza della cache
lezione 3: algoritmi a blocchi per l'algebra lineare
lezione 4: richiami di calcolo parallelo
lezione 5: prodotto tra matrici parallelo su m.d.
- HW1: implementazione alg. di Cannon o SUMMA in MPI
lezione 6: algoritmi di fattorizzazione: scalapack
lezione 7: introduzione al calcolo distribuito
lezione 8: prodotto tra matrici in ambiente distribuito
lezione 9: NetSolve
- HW2: implementazione alg. per prodotto tra matrici in NetSolve
lezione 10: gli algoritmi fault tolerant
lezione 11: I processori multicore
lezione 12: prodotto matrici in ambiente multicore
lezione 13: algoritmo di Cholesky in ambiente multicore
- HW3: implementazione alg. prodotto tra matrici in ambiente multicore
lezione 14: GPU computing eCUDA
- HW4: implementazione alg. prodotto tra matrici con CUDA