High Performance Parallel Computing
corso di laurea in Informatica - Universita' degli Studi di Napoli Federico II
lezione 2/3: influenza della cache
LAB1: implementare le 6 versioni del prodotto di matrici secondo le indicazioni fornite nella Lezione 2/3. Inserirle in un file di nome matmat.c all'interno della cartella Dropbox condivisa. Funzione utile per il tempo di esecuzione disponibile qui: timers
LAB2: implementare la versione del prodotto di matrici a blocchi secondo le indicazioni fornite nella Lezione 2/3. Inserirla in un file matmatblock.c all'interno della cartella Dropbox condivisa
lezione 4: richiami calcolo parallelo
lezione 6: prod. matrici su CPU multicore
LAB3: implementare la versione multithread del prodotto di matrici econdo le indicazioni fornite nella Lezione 6/7. Inserirla in un file matmatthread.c all'interno della cartella Dropbox condivisa
lezione 7: strumenti per il message passing: MPI
lezione 8/10: sistemi distribuiti e prodotto matrici
LAB4: implementare la versione distribuita del prodotto di matrici secondo le indicazioni fornite nella Lezione 9/10. Inserirla in un file matmatdist.c all'interno della cartella Dropbox condivisa
lezione 11: architettura software di ScaLAPACK
lezione 12: GPU computing e CUDA
lezione 13: prodotto matrici con CUDA
LAB5: implementare la versione CUDA del prodotto di matrici secondo le indicazioni fornite nella Lezione 12/13. Inserirla in un file matmatcuda.cu all'interno della cartella Dropbox condivisa
lezione 14: sistemi di calcolo distribuito
lezione 15: prodotto di matrici in ambienti di c.d.
lezione 16: un esempio di sistema per il c.d.: Netsolve
lezione 17: la fault tolerance
Lezioni anni precedenti al 2020/21 (Calcolo Parallelo e Distribuito 2)
HW0: studiare le prestazioni dell'algoritmo per il prodotto di matrici
lezione 5: prodotto tra matrici parallelo su m.d.
HW1: implementazione alg. di Cannon o SUMMA in MPI
HW2: implementazione alg. per prodotto tra matrici in NetSolve
lezione 12: prodotto matrici in ambiente multicore
lezione 13: algoritmo di Cholesky in ambiente multicore
HW3: implementazione alg. prodotto tra matrici in ambiente multicore
lezione 14: GPU computing eCUDA
HW4: implementazione alg. prodotto tra matrici con CUDA