sábado, 25 de agosto de 2012

Sumário e Crítica do Artigo “Stencil Computation Optimization and Auto-tuning on State-of-the-art Multicore Architectures”.


O artigo parte da necessidade de entender sobre as melhores estratégias para projetar de forma mais eficiente, o uso de sistemas multicore. Os autores focam seu trabalho no multicore stencil e destacam que esta é uma classe de algoritmos que fica no coração de muitos códigos de malha estruturados, inclusive o solver EDP. 

Neste trabalho, são exploradas as mais recentes arquiteturas HPC, apresentando suas principais diferenças e influências na aplicação de algoritmos auto-tuning. Os autores defendem que o design de cada arquitetura permite determinar uma melhor utilização do algoritmo, bem como uma melhor adaptação da arquitetura para problemas específicos. Um outro ponto importante é a obtenção de portabilidade de auto-tuning tanto para arquiteturas atuais, como para prever as tendências do desenvolvimento e garantir portabilidade com futuras arquiteturas. 

Outro ponto importante que é destacado neste trabalho e que entende-se como uma das principais tendências é a preocupação com a eficiência energética. A eficiência da arquitetura em Flop´s juntamente com a redução de watts, demostra uma preocupação com o custo energético envolvido no processamento.

Aqui foram realizados testes em aplicações científicas, resolvendo uma edp em domínio tridimensional, em que comparou-se os desempenhos e peculiaridades de cada arquitetura, aplicando o algoritmo auto-tunning. Os resultados mostraram que para algoritmos com paralelismo adequado, o emprego de um grande número de processadores mais simples, oferece maior potencial de desempenho do que o uso de processadores mais complexos em menor quantidade. Esta vantagem se aplica tanto em velocidade por Flop´s quanto por gasto de energia em Watt, que é menor nos chips mais simplificados.

A proposta de utilização do algoritmo auto-tuning parece retornar ganhos de desempenho consideráveis porém o maior benefício está no consumo energético, o que pode ser observado no uso da arquitetura CUDA. No entanto, a implementação do referido algoritmo é algo aparentemente complexo, visto a variedade de arquitetura de processadores e suas diferentes especificações.

Atividade desenvolvida para a disciplina Processamento Paralelo.

Nenhum comentário:

Postar um comentário

Curso Básico e Avançado de Java é na DevMedia!!!

Aprenda Java com a DevMedia!!! Para aqueles que desejam aprender sobre Java e ter sucesso nos estudos e na profissão, não perca o excelen...