Cargando…

Performant programming for GPUs

Programming for Heterogeneous Architectures - lecture 3 - Data locality, coalesced memory accesses, tiled data processing - GPU streams, pipelined memory transfers - Under the hood: branchless, warps, masked execution - Debugging and profiling a GPU application

Detalles Bibliográficos
Autor principal:	Campora, Daniel
Lenguaje:	eng
Publicado:	2021
Materias:	Thematic CSC
Acceso en línea:	http://cds.cern.ch/record/2773476

Internet

http://cds.cern.ch/record/2773476

Performant programming for GPUs

Internet

Ejemplares similares