O emprego da Teoria dos Grafos para análise de dados

Propaganda
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
O emprego da Teoria dos Grafos para análise de dados de publicações em Design:
Design Studies (2001-2011)
Vinicius Gadis Ribeiro1
Sidnei Renato Silveira2
Jorge Rodolfo Silva Zabadal3
1. Introdução
O presente estudo busca analisar informações referente à produção científica m Design, baseando-se
em teoria dos grafos. Pode-se entender grafo como sendo uma representação simplificada de redes, as
quais relacionam elementos por algum critério. Os elementos em questão são chamados nodos ou
vértices, sendo as ligações entre eles, as relações ou arestas. Formalmente, diz-se que:
Um grafo não direcionado (ou simplesmente grafo) é definido por dois conjuntos: um conjunto V de
vértices, e um conjunto E de arestas; e por uma função de mapeamento w : E → P(V) - que associa,
a cada aresta um subconjunto de dois ou de um elemento de V, interpretado como os terminais da
aresta.
Grafos podem ou não ser orientados - por exemplo, apresentar a possibilidade de haver relação em um
sentido, e em outro, não; ademais, podem ser ou não valorados (ou seja, as relações apresentam valor
quantitativo). Para o presente trabalho, interessam grafos não-orientados não valorados.
Essas estruturas apresentam uma série de propriedades matemáticas interessantes, as quais
possibilitam, por exemplo, identificar quais são os nós são importantes estruturalmente e relevantes
para o fluxo de informação na rede, ou verificar se há elementos mais centrais, ou ainda se há
elementos mais relevantes ou influentes. Podem ser verificadas existência de agrupamentos em grafos,
ou o quanto um nodo é alcançável em relação ao outro. Podem ser identificados se há elementos que
são fortemente intermediários. Dessa forma, é relevante compreender alguns conceitos dessa teoria, a
saber:
Por vizinhança de um conjunto X de vértices de um grafo G entende-se o conjunto de todos os
vértices que têm algum vizinho em X. Esse conjunto é representado por será denotado por ΓG(X) ou
simplesmente por Γ(X). A vizinhança de um vértice v é o conjunto Γ({v}), que pode ser denotado
simplesmente por Γ(v).
A importância relativa de um nodo perante o grafo pode ser considerada pelas medidas de
centralidade. Destaca-se que alguns dos conceitos de centralidade foram inicialmente desenvolvidos
na análise de redes sociais (Newman, 2010). Em análise de redes, há quatro medidas de centralidade:
centralidade de grau, centralidade de intermediação, centralidade de proximidade e centralidade de
vetor próprio. Na situação do presente trabalho, empregou-se o conceito de centralidade de grau (Dg),
o qual pode ser entendido como a métrica do número de conexões que um nodo apresenta.
Já o coeficiente de agrupamento é uma medida do quanto há tendência de que os nodos têm de se
agruparem. Esse conceito é fundamental no caso da Teoria das Redes Complexas – as quais não
Doutor em Ciência da Computação, Centro Universitário Ritter dos Reis, Faculdade de Design – Programa
de Pós-graduação em Design, e-mail: [email protected]
2 Doutor em Ciência da Computação, Universidade Federal de Santa Maria – CESNORS – Curso de Sistemas
de Informação, e-mail: [email protected]
3 Doutor em Engenharia Mecânica, Universidade Federal do Rio Grande do Sul - Bacharelado Interdisciplinar
em Ciência e Tecnologia, e-mail: [email protected]
1
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
seguem exatamente a Teoria dos Grafos, pois essa última não necessariamente está relacionada com a
modelação de redes reais, por meio da análise de dados empíricos; diferente das últimas, as redes
complexas não são estáticas, mas evoluem no tempo, alterando a sua estrutura; e as redes constituem
estruturas onde processos dinâmicos podem ser simulados (Barrat, 2008). Entende-se que a estrutura
no qual os dados do presente trabalho se relacionam não são dinâmicas – sendo necessário, por
exemplo, maior quantidade de registros referentes à produção para ser alterada a estrutura; essa rede
não se alteraria apenas por si –, o que exclui a possibilidade de esse tratar de redes complexas.
2. Metodologia
Com o intuito de verificar a possibilidade do emprego de conceitos e métrica da teoria dos grafos
como apoio à revisão sistemática, com objetivo de verificar possíveis agrupamentos, instituições que
desenvolvem determinado tipo de pesquisa, quais metodologias mais empregadas e outras questões
concernentes, o presente trabalho empregou um programa de apoio. No intuito de automatizar o
processo de análise - o qual poderia ser proibitivo, dada a escalabilidade que as redes apresentam
atualmente, empregam-se programas de computador. Há diversos programas disponíveis
gratuitamente. Considerando-se a preferência de um grupo de pesquisadores da mesma universidade,
empregou-se Cythoscape (Shannon et al., 2003).
Para a entrada de dados, dados referentes aos artigos do período investigado (2001 a 2011) foram
tabulados em uma planilha, cujo formato é o empregado pelo programa em questão. A geração visual
do grafo não demandou esforços computacionais relevantes, e as ferramentas de análise são
automáticas.
3. Resultados obtidos e discussão
A presente seção apresenta os resultados parciais da investigação. No primeiro momento, buscou-se
verificar as formas de coleta de dados para cada tipo de pesquisa (quantitativa, qualitativa ou qualiquanti)
Figura 1: Agrupamento Experimentação
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016.
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
Destacam-se um grande grupo, no qual predominam as abordagens multimétodos, o estudo de caso e a
dissertação projeto. Há um agrupamento, no qual se concentram os estudos experimentais (figura 1).
Cada um desses agrupamentos reúne pelo menos oito técnicas de coleta de dados. Há ainda pequenos
agrupamentos com poucas técnicas de coletas de dados – o que aparentemente indica pouca
variabilidade de técnicas de coleta de dados.
Essa variabilidade é esperada em abordagens qualitativas – como estudo de caso ou abordagens
multimétodos -, ou mesmo na dissertação-projeto (ou design research). O fato não esperado fora a
experimentação, visto que frequentemente assume-se apenas coleta de dados em laboratório ou
campo. Analisando os conteúdos dos artigos, confirma-se a grande diversidade de métodos de coleta –
quase sempre, baseados na origem dos dados ou objeto de pesquisa.
Figura 2: rede tipo de coleta de dados versus tipo de método – geral.
A figura três apresenta a relação entre o país e o método de pesquisa. A questão aqui associada era se
haveria ou não predominância de métodos por países – ou seja, se seria possível estabelecer uma
tipologia entre essas duas variáveis.
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016.
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
Figura 3: País de Origem versus Método
Como se esperava, a quantidade de relações (grau do nodo) é maior nos países anglofalantes – sede do
periódico, Reino Unido e Estados Unidos. Contudo, essa informação pode ser alterada, ao se
considerar a questão do peso (ou seja, ao se avaliar o grau de cada método de pesquisa), conforme a
figura 4.
Figura 4: País versus Método, considerando o peso
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016.
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
Uma particularização desse grafo seria entender as relações não entre país e método, mas entre
instituição e método. Dessa forma, o papel da Holanda pode ser constatado (figura 4) devido à
instituição que lidera um tema de pesquisa. A tabela 1 apresenta dados que esclarecem esse peso da
Holanda no periódico: a tabela contém os percentuais de participação nesse periódico, por instituição,
dos 10 mais frequentes.
Tabela 1: Instituições mais frequentes – geral
Instituição
Total
Percentual
University of Technology Sydney
20
6,3291%
Delft University of Technology
19
6,0127%
Georgia Institute of Technology
7
2,2152%
Massachusetts Institute of Technology
7
2,2152%
The Open University
7
2,2152%
University of Cambridge
7
2,2152%
National Cheng Kung University
6
1,8987%
Bilkent University
5
1,5823%
Carnegie Mellon University
5
1,5823%
Eindhoven University of Technology
5
1,5823%
Analisando
o
site
da
instituição
(http://repository.tudelft.nl/islandora/search?collection
=research&f[0]=mods_subject_topic_ss%3A%22design%22), percebe-se que a Holanda é
representada pela Delft University of Technology – onde há grupo de pesquisa concentrado em
investigação de questões de Design, sendo pioneiros no tema design emotion.
4. Conclusões
Percebe-se que a prova de conceito aqui apresentada se revelou funcional: algumas das métricas da
teoria dos grafos pode ser empregada para apoio à revisão sistemática. A ferramenta computacional –
Cythoscape – proporcionou uma opção viável para o processamento, possuindo grande variedade de
formatos de apresentação, e flexibilidade para alterações. Dessa forma, visualmente, pode-se obter
informações cuja visibilidade poderia ser comprometida pela quantidade de relações.
Como trabalhos futuros, empreende-se ampliar a rede para os últimos volumes, além de setorizar por
áreas de Design, visto que particularidades podem ser obtidas, ao se analisar os dados considerando as
áreas específicas do Design.
Palavras-chave: Teoria dos Grafos, Revisão sistemática, Produção Científica em Design, Pesquisa
em Design.
Agradecimentos: o primeiro autor agradece à UniRitter pelo apoio.
Referências
Barrat, Alain; Barthelemy, Marc & Vespignani, Alessandro. Dynamical processes on complex
networks. Cambridge: Cambridge University Press, 2008.
Lipschutz, S. & Lipson, M. Schaum’s Outline of Theory and Problems of Discrete Mathematics
(2nd ed.). New York: McGraw-Hill, 1997
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016.
XII Semana de Extensão, Pesquisa e Pós-Graduação - SEPesq
Centro Universitário Ritter dos Reis
Newman, M. The mathematics of networks. In: Blume L, editor. SD, editors, The New Palgrave
Encyclopedia of Economics. 2nd edition. Basingstoke: Palgrave Macmillan, 2008.
Newman, M.E.J. Networks: An Introduction. Oxford, UK: Oxford University Press, 2010.
Shannon P. et al. Cytoscape: a software environment for integrated models of biomolecular interaction
networks. Genome Res, 13 (11), 2498-2504, 2003.
M. E. J. Newman The structure and function of complex networks. SIAM Review 45, 167-256. 2003.
XII Semana de Extensão, Pesquisa e Pós-Graduação
SEPesq – 24 a 28 de outubro de 2016.
Download