O trabalho de Willians, Waterman e Patterson enfatiza que medir o tráfego entre a memória principal e memória cache é necessário em tempos de computação paralela e multicore. Este tráfego é considerado o principal gargalo na busca por desempenho e otimização quanto do uso de memória.
Com a maior dificuldade de otimizar o trabalho em HPC, os autores propõem um modelo que oferece orientações de desempenho e de fácil entendimento partindo da “análise pelo estrangulamento”, mostrando fatores relacionados ao gargalo de memória. Neste ponto, o trabalho também faz referência a Lei de Amdahl como exemplo de casos relacionados.
O modelo Roofline fornece um limite superior para o desempenho, de forma a auxiliar na identificação de quais sistemas podem ser viáveis para determinadas aplicações ou até mesmo como alterar o código de forma a extrair maior desempenho com relação ao uso da memória.
Entende-se que, os gargalos podem ser reduzidos com a reestruturação dos loops de acesso às unidades de memória, adequando o tamanho das unidades por loop para um tamanho que caiba na memória rápida e que se adeque a banda de acesso da memória lenta. Possivelmente isto aumentaria significativamente a largura de banda de memória.
No trabalho, os autores realizam alguns comparativos entre processadores e arquiteturas, demonstrando o topo em eficiência em cada uma, destacando as peculiaridades quanto ao esforço que pode ser desprendido para que esta eficiência seja otimizada.
Destaca-se que, em virtude da limitação de recursos computacionais, a proposta de adequar os programas à quantidade de memória rápida existente na máquina demostra ser indispensável na busca por melhor desempenho. A proposta deste artigo, somado à definição de limites de acesso a memória, assim como, a menor ociosidade do processador, contribui até hoje com a computação de alto desempenho e menor gasto energético.
Atividade realizada para a disciplina Processamento Paralelo.