Resumo expandido IC/UFPI

Propaganda
ÁREA:
CV ( )
CHSA ( )
ECET ( )
DESCRIÇÃO, VALIDAÇÃO E PROTOTIPAGEM DE BLOCO MÚLTI-NÚCLEOS
PARA PROJETO DE MICROPROCESSADORES MANY-CORE BASEADOS EM
REDES EM CHIP
Tiago dos Santo Patrocínio (Bolsista PIBIC/CNPq), Ivan Saraiva Silva (Orientador,
Departamento de Computação/UFPI)
Introdução
O projeto tem como finalidade o desenvolvimento de um subsistema de memória capaz de
trazer melhorias à arquitetura uVMP (UFPI’s Virtualizable Multicore Plataform)[6] trabalhada no
laboratório CESLa e registrada pelo NINTEC (Núcleo de Inovação e Transferência de Tecnologia).
Embora sejam apresentados siginificativos avanços nas arquiteturas de processadores e
memórias nos ultimos anos, ainda encontra-se barreiras. O subsistema é desenvolvido para substituir
o estado atual do componente presente na arquitetura, agregando avanços tecnológicos e resultando
em melhorias em relação ao desempenho do projeto. Para tanto, o projeto leva em consideração a
utilização de redes em chip, mais precisamente a rede SoCIN [1]. Ademais, tendo em vista problemas
relacionados a arquiteturas many-cores, recebem destaque os denominados Memory Wall [2] e
Power Wall [3], sendo proposto pelo projeto soluções que reduzam seus efeitos..
Metodologia
O projeto está sendo desenvolvido no Laboratório CESLa (Circuits and Embedded System
Laboratory) do Departamento de Computação da Universidade Federal do Piauí.
Até o presente momento, o cronograma está sendo seguido dentro do esperado. A
metodologia do plano de trabalho até dado momento consta em:
I.
Estudo das principais referencias bibliográficas do tema;

As referencias bibliográficas sobre o tema constam em artigos cientificos
de renomados autores da academia internacional
II. Estudo detalhado do modelo uVMP-SSC;

O modelo da arquitetura uVMP é obra dos integrantes do laboratório CESLa,
onde estão a disposição para auxiliar na estratégia e desenvolvimento do
trabalho.
III. Treinamento com as ferramentas;

As ferramentas à disposição são as placas de prototipagem DE0, DE2 e DE2-115
bem como os softwares Altera Quartus II e ModelSim, que em conjunto fornecem
o suficiente para a conclusão do plano de trabalho.
IV. Proposição da arquitetura do subsistema e da interface de rede;

A arquitetura do subsistema de memória leva em consideração o sistema de
redes em chip SoCIN. Além disso, visa reduzir ou solucionar problemas
relacionados à arquiteturas many-core.
V. Descrição do subsistema e da interface na linguagem VHDL de descrição de hardware;

Nesta etapa do desenvolvimento do trabalho, a arquitetura é descrita na
linguagem VHDL de descrição de hardware, viabilizando a prototipagem e
ÁREA:
CV ( )
CHSA ( )
ECET ( )
validação sobre as ferramentas disponíveis.
VI. Validação isolada;

É feita a validação do componente da memória de forma isolada, analisando seu
desempenho e integridade dos dados introduzidos.
VII. Validação integrada;

É feita a validação do componente da memória integrada ao modelo arquitetura
uVMP, analisando seu desempenho geral.
Arquitetura
O estudo das referências bibliográficas e do uVMP (UFPI’s Virtualizable Multicore Plataform)
forneceram a base necessária para a proposição de metas e técnicas de implementação do
subsistema de memória. A figura 1 apresenta o modelo utilizado nesse estudo.
Figura 2 – Esquema de configuração de núcleos escravos.
O uVMP propõem uma arquitetura multi-core com suporte a virtualização de recursos de
hardware, tornando possível a configuração do espaço endereçável. A arquitetura é composta por 1
núcleo mestre e 8 núcleos escravos, sendo que a função principal do mestre é de configurar e
agrupar núcleos escravos para desempenhar determinadas tarefas. A figura X apresenta o esquema
de configuração, composto por registradores que possuem a informação dos espaços endereçáveis e
quais núcleos serão ativados para desempenhar a função.
Figura 2 – Esquema de configuração de núcleos escravos.
O núcleo mestre é capaz de configurar os núcleos escravos de duas formas. A primeira é
agrupar os núcleos escravos SCi e SCi+4 (com 0 ≤ i ≤ 3) possibilitando o compartilhamento de
memória. A segunda forma é configurar os núcleos com espaços endereçáveis de memória privada,
permitindo troca de informações através de instruções definidas na arquitetura.
O subsistema de memória desenvolvido nesse estudo substitui o modelo antigo na arquitetura
ÁREA:
CV ( )
CHSA ( )
ECET ( )
uVMP, provendo ao núcleos escravos melhorias significativas no desempenho, reduzindo os efeitos
causados pelo problema conhecido como Memory Wall e Power Wall..
Resultados e Discussão
A implementação do subsistema de memória rendeu um aumento no desempenho geral da
arquitetura uVMP, contribuindo positivamente para a capacidade de processamento de aplicações em
paralelo. As tabelas apresentam resultado em ciclos das aplicações utilizadas na arquitura com a
implementação do subsistema de memória integrado. A aplicações utilizadas foram Multiplicação de
Matrizes e Merge Sort, ambas utilizando memória privada ou compartilhada.
Application
Execution Cycles
Comp. Cycles
Commu. Cycles
Matrix (S)
16053
26080
3074
Matrix (P)
11080
26736
10626
Matrix (SP)
11832
13469
9122
Merge sort (S)
3710
4364
963
Merge sort (P)
3942
4384
1488
Matrix/Merge
11832
31226
10706
Conclusão
As atividades desempenhadas durante o projeto junto ao apoio e suporte dos integrantes do
Laboratório CESLa (Circuits and Embedded System Laboratory) contribuiram positivamente para o
meu aprimoramento como discente. Acreditamos que as pesquisas desempenhadas e resultados
obtidos venham a ampliar a participação do Departamento de Computação na comunidade
acadêmica nacional e internacional, contribuindo, portanto, com avanços os tecnológicos para
industria e demais áreas relacionadas.
Referências
[1] ZEFERINO, c.a.; SUSIN, a.a., "SoCIN: A Parametric and Scalable Network-on-chip, "Integrated
Circuits and Systems Design, 2003. sbcci 2003. Proceedings. 16th Symposium on , vol., no.,
pp.169,174, 8-11 sept. 2003. doi: 10.1109/sbcci.2003.1232824.
[2] WULF, W. A. and MCKEE, S. A. Hitting the memory wall: Implications of the obvious. SIGARCH
Comput. Archit. News 23, 1 (march 1995), 20-24.6
[3] KURODA, T. Cmos design challenges to power wall. Microprocesses and Nanotechnology
Conference, 2001 International , VOL., NO., PP.6,7, OCT. 31 2001-NOV. 2 2001
[4] CHE, Z. Power-Efficient And Low-Latency Memory Access For Cmp Systems With Heterogeneous
Scratchpad On-Chip Memory. Master of science thesis. University of kentucky. College of engineering.
2013
[5] J. Hu, C. J. XUE, Q. ZHUGE, W.-C. TSENG, AND E. H.-M. SHA, “Towards Energy Efficient Hybrid
On-Chip Scratch Pad Memory With Non-Volatile Memory,” In Design, Automation & Test in Europe
Conference & Exhibition (DATE), 2011, PP. 1–6.
[6] SILVA, I. S.; NEPOMUCENO, R. MAFUTA, T. CARVALHO, E. S. Uvmp: Virtualizable Multi-core
Platform. XXXVIII Conferencia Latinoamericana en Informatica (CLEI), PP. 1 – 6, 2012.
[7] TOTA, S.V. ; CASU, M.R. ; RUO ROCH, M. ; ROSTAGNO, L. ; ZAMBONI, M. Medea: a hybrid
shared-memory/message-passing multiprocessor noc-based architecture. Design, automation & test
in europe conference & exhibition, PP. 45 – 50. March 2010.
Palavras-chave: Many-Core; Redes em Chip; MP-SoC.
Download