UNIVERSIDADE FEDERAL FLUMINENSE Latec – Laboratório de Tecnologia,Gestão de Negócios e Meio-ambiente Mestrado em Sistemas de Gestão TATIANA BARBOSA DE AZEVEDO ANÁLISE DE REDES SOCIAIS ATRAVÉS DE SOFTWARES DE ARS E DE DATA MINING: UM ESTUDO DE CASO EM TURMAS DE GRADUAÇÃO. Niterói 2011 TATIANA BARBOSA DE AZEVEDO ANÁLISE DE REDES SOCIAIS ATRAVÉS DE SOFTWARES DE ARS E DE DATA MINING: UM ESTUDO DE CASO EM TURMAS DE GRADUAÇÃO. Dissertação apresentada ao Curso de Mestrado de Sistema de Gestão da Universidade Federal Fluminense como requisito parcial para a obtenção do grau de Mestre em Sistemas de Gestão. Área de concentração Qualidade total. Linha de Pesquisa: Gestão do Conhecimento e Sistema de Informação. Orientador: Prof. Dr. Martius Vicente Rodriguez Y Rodriguez Ao meu querido marido Júlio, que sempre me incentivou, “cobrou” e motivou. Ao meu pai Tião, que mesmo depois de sua “partida”, continua demonstrando o valor de sua rede de amizades. A minha mãe Sonia, minha irmã Alessandra e minha sobrinha Laís, que sempre estiveram ao meu lado me apoiando. E principalmente aos meus filhos Letícia e Heitor que dividiram sua mãe com os livros, aulas, viagens e estudos. AGRADECIMENTOS Para agradecer nesse momento, torna-se necessário fazer um retrocesso em minha memória. Recordar as barreiras que enfrentei durante esse período de estudo: transferência do curso de Juiz de Fora para Niterói, cancelamento de aulas em decorrência da gripe suína, crise mundial (arrocho), troca de orientador, suspeita de câncer, cirurgia... Hoje, olhando para trás, agradeço muito ao responsável por tudo isso: DEUS. As barreiras e dificuldades do percurso tornaram tudo mais intenso. A alegria de superar cada medo e desafio, transformou cada etapa mais prazerosa e digna de comemoração. Agradeço também à minha maravilhosa família, que esteve ao meu lado me apoiando incondicionalmente em todos os dias de minha vida. Aos meus colegas Virgínia, Lúcia, Adalberto e Ormeu que foram tão importantes nesse processo. Agradeço também o apoio recebido do CEFET, que tornou esse sonho possível. Quero destacar ainda, meu encontro com meu orientador, que com sua simplicidade e ao mesmo tempo grandeza de atitude, se dispôs a dividir parte de seu imenso conhecimento comigo. No momento em que o conheci, compreendi o principal conceito das redes sociais informais. Onde pessoas, como ele, se dispõem a trocar seus conhecimentos com meros desconhecidos, pela simples razão de estarem relacionados em uma mesma rede social. Muito Obrigada ! “Todo homem que encontro é superior a mim em alguma coisa. E nesse particular eu aprendo dele.” Emerson "Fale, e eu esquecerei; ensine-me, e eu poderei lembrar; envolva-me, e eu aprenderei." Benjamin Franklin RESUMO Esse estudo relata os principais conceitos metodológicos da análise de redes sociais e das ferramentas de mineração de dados – data mining. Embasado nesses conceitos, foi elaborado um estudo de redes sociais informais, formadas por discentes de instituições e cursos de graduação distintos. Para o desenvolvimento desse trabalho foi feita a identificação do grupo a ser analisado, definição do problema, elaboração e aplicação de um questionário qualitativo nas redes. Baseado nesse questionário, foi feito o mapeamento das redes, através de software de análise de redes sociais (ARS), que possibilitou a identificação dos atores principais de cada uma das redes. Posteriormente, foi criada uma base de dados com os principais atributos coletados dos indivíduos das distintas redes. Nessa base foram aplicadas técnicas de data mining, para uma análise descritiva e preditiva dos atributos dos conectores centrais na busca de identificar o perfil dos atores principais das redes. Os resultados desse estudo demonstrarão a relação entre as características dos indivíduos e sua forma de participação na rede social. Palavras-chave: redes sociais, análise de redes sociais, softwares ARS, mineração de dados. ABSTRACT This study reports the main methodological concepts of social network analysis tools and data mining. Based upon these concepts, we designed a study of informal social networks, formed by students from different institutions and different undergraduate courses. To develop this, work was done to identify the group to be analyzed, to define the problem, to develop and implement a qualitative questionnaire on social networks. Based on this survey was the mapping of networks, using software social network analysis (SNA), which identified the main actors in each network. Subsequently, we created a database with the key attributes of the individuals collected from different networks. On this basis data mining techniques for descriptive and predictive analysis of the attributes of power connectors were applied in order to identify the profile of the main actors of the networks. These results demonstrate the relationship between patient characteristics and form of participation in social networks. Keywords: social networks, social network analysis, SNA software, data mining. LISTA DE FIGURAS Figura 01 - Representação de uma rede de elementos interligados. .....................26 Figura 02 - Origem da Análise de Redes Sociais...................................................28 Figura 03 - O Sociograma de Moreno. ...................................................................29 Figura 04 - Representação gráfica de Rede...........................................................38 Figura 05 - Dimensões estrutural e relacional das redes sociais. ..........................43 Figura 06 - Exemplo de uma rede mapeada pelo Software Visone. ......................47 Figura 07 - Exemplo de mapeamento de rede. ......................................................51 Figura 08 - Relação entre Base de Dados, D.W. e Mineração de Dados ............. 56 Figura 09 - Recursos envolvidos na Mineração de Dados. ....................................57 Figura 10 - Etapas do processo de mineração.......................................................59 Figura 11 - Taxonomia de Tarefas de Mineração de Dados. .................................61 Figura 12 - Taxonomia de itens em um supermercado. .........................................62 Figura 13 - Tipologia da pesquisa. .........................................................................67 Figura 14 - Etapas da pesquisa..............................................................................69 Figura 15 - Análise Estrtural da Rede de Trabalho - Turma 1. ...............................79 Figura 16 - Análise Estrutural da Rede de Confiança - Turma 1. ...........................84 Figura 17 - Análise Estrutural da Rede de Amizade - Turma 1. .............................89 Figura 18 - Análise Estrtural da Rede de Trabalho - Turma 2. ...............................94 Figura 19 - Análise Estrutural da Rede de Confiança - Turma 2. ...........................99 Figura 20 - Análise Estrutural da Rede de Amizade - Turma 2. ...........................104 Figura 21 - Análise Estrtural da Rede de Trabalho - Turma 3. .............................109 Figura 22 - Análise Estrutural da Rede de Confiança - Turma 3. .........................115 Figura 23 - Análise Estrutural da Rede de Amizade - Turma 3. ...........................120 Figura 24 - Pré-processamento dos dados. .........................................................127 Figura 25 - Gráfico de projeção dos atributos do conjunto de dados analisados, classificados por Satisfação. ................................................................................127 Figura 26 - Atributos do Arquivo Conectores, que será estudado. .......................128 Figura 27 - Estatísticas do atributo Idade.............................................................129 Figura 28 - Estatísticas do atributo Sexo..............................................................130 Figura 29 - Estatísticas do atributo Timidez. ........................................................131 Figura 30 - Estatísticas do atributo Liderança. .....................................................132 Figura 31 - Estatísticas do atributo Trabalho Equipe............................................133 Figura 32 - Estatísticas do atributo Nota. .............................................................134 Figura 33 - Estatísticas do atributo Frequência. ...................................................135 Figura 34 - Estatísticas do atributo Pontualidade. ................................................136 Figura 35 - Estatísticas do atributo Satisfação. ....................................................137 Figura 36 - Estatísticas do atributo Livros. ...........................................................138 Figura 37 - Estatísticas do atributo Tipo Escola. ..................................................139 Figura 38 - Atributos correlacionados...................................................................140 Figura 39 - Aplicação do algoritmo K-means.......................................................144 Figura 40 - Aplicação do algoritmo K-means com valor de K = 3.........................145 Figura 41 - Gráfico de 3 clusters, com eixo X Trabalho Equipe e eixo Y Notas ...148 LISTA DE QUADROS Quadro 01 - Temas estudados sobre Redes Sociais. ............................................33 Quadro 02 - Perspectiva abordando características estruturais de rede................38 Quadro 03 - Perspectiva abordando características estruturais da rede, analisando também coesão e mapeamento de grupos . ..........................................................39 Quadro 04 - Perspectiva centrada em egos. ..........................................................40 Quadro 05 - Características dos Softwares ARS. ..................................................47 Quadro 06 - Densidade da Rede de Trabalho - Turma 1. ......................................77 Quadro 07 - Centralidades de Entrada e Saída dos atores da Rede de Trabalho Turma 1. .................................................................................................................78 Quadro 08 - Centralidades de Intermediação dos atores da Rede de Trabalho Turma 1. .................................................................................................................80 Quadro 09 - Centralidade de Bonacich dos atores da Rede de Trabalho Turma 1. .................................................................................................................80 Quadro 10 - Densidade da Rede de Confiança - Turma 1. ....................................82 Quadro 11 - Centralidades de Entrada e Saída dos atores da Rede de Confiança Turma 1. .................................................................................................................83 Quadro 12 - Centralidades de Intermediação dos atores da Rede de Confiança Turma 1. .................................................................................................................84 Quadro 13 - Centralidade de Bonacich dos atores da Rede de Confiança Turma 1. .................................................................................................................85 Quadro 14 - Densidade da Rede de Amizade - Turma 1. ......................................87 Quadro 15 - Centralidades de Entrada e Saída dos atores da Rede de Amizade Turma 1. .................................................................................................................88 Quadro 16 - Centralidades de Intermediação dos atores da Rede de Amizade Turma 1. .................................................................................................................89 Quadro 17 - Centralidade de Bonacich dos atores da Rede de Amizade - Turma 1. ...............................................................................................................................90 Quadro 18 - Densidade da Rede de Trabalho - Turma 2. ......................................92 Quadro 19 - Centralidades de Entrada e Saída dos atores da Rede de Trabalho Turma 2. .................................................................................................................93 Quadro 20 - Centralidades de Intermediação dos atores da Rede de Trabalho Turma 2. .................................................................................................................94 Quadro 21 - Centralidade de Bonacich dos atores da Rede de Trabalho Turma 2. .................................................................................................................95 Quadro 22 - Densidade da Rede de Confiança - Turma 2. ....................................97 Quadro 23 - Centralidades de Entrada e Saída dos atores da Rede de Confiança Turma 2. .................................................................................................................98 Quadro 24 - Centralidades de Intermediação dos atores da Rede de Confiança Turma 2. .................................................................................................................99 Quadro 25 - Centralidade de Bonacich dos atores da Rede de Confiança Turma 2. ...............................................................................................................100 Quadro 26 - Densidade da Rede de Amizade - Turma 2. ....................................102 Quadro 27 - Centralidades de Entrada e Saída dos atores da Rede de Amizade Turma 2. ...............................................................................................................103 Quadro 28 - Centralidades de Intermediação dos atores da Rede de Amizade Turma 2. ...............................................................................................................104 Quadro 29 - Centralidade de Bonacich dos atores da Rede de Amizade - Turma 2. .............................................................................................................................105 Quadro 30 - Densidade da Rede de Trabalho - Turma 3. ....................................107 Quadro 31 - Centralidades de Entrada e Saída dos atores da Rede de Trabalho Turma 3. ...............................................................................................................108 Quadro 32 - Centralidades de Intermediação dos atores da Rede de Trabalho Turma 3. ...............................................................................................................110 Quadro 33 - Centralidade de Bonacich dos atores da Rede de Trabalho Turma 3. ...............................................................................................................111 Quadro 34 - Densidade da Rede de Confiança - Turma 3. ..................................113 Quadro 35 - Centralidades de Entrada e Saída dos atores da Rede de Confiança Turma 3. ...............................................................................................................114 Quadro 36 - Centralidades de Intermediação dos atores da Rede de Confiança Turma 3. ...............................................................................................................116 Quadro 37 - Centralidade de Bonacich dos atores da Rede de Confiança Turma 3. ...............................................................................................................116 Quadro 38 - Densidade da Rede de Amizade - Turma 3. ....................................118 Quadro 39 - Centralidades de Entrada e Saída dos atores da Rede de Amizade Turma 3. ...............................................................................................................119 Quadro 40 - Centralidades de Intermediação dos atores da Rede de Amizade Turma 3. ...............................................................................................................121 Quadro 41 - Centralidade de Bonacich dos atores da Rede de Amizade - Turma 3. .............................................................................................................................122 Quadro 42 - Arquivo de entrada no WEKA. .........................................................126 Quadro 43 - Arquivo de saída - utilizando 3 clusters............................................146 Quadro 44 - Arquivo de saída utilizando 2 clusters. .............................................149 Quadro 45 - Arquivo de saída utilizando 4 clusters. .............................................150 LISTA DE TABELAS Tabela 01 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 1......76 Tabela 02 - Atores em destaque na Rede de Trabalho - Turma 1. ........................81 Tabela 03 - Atores em destaque na Rede de Confiança - Turma 1. ......................86 Tabela 04 - Atores em destaque na Rede de Amizade - Turma 1. ........................91 Tabela 05 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 2......92 Tabela 06 - Atores em destaque na Rede de Trabalho - Turma 2. ........................96 Tabela 07 - Atores em destaque na Rede de Confiança - Turma 2. ....................101 Tabela 08 - Atores em destaque na Rede de Amizade - Turma 2. ......................106 Tabela 09 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 3....107 Tabela 10 - Atores em destaque na Rede de Trabalho - Turma 3. ......................112 Tabela 11 - Atores em destaque na Rede de Confiança - Turma 3. ....................117 Tabela 12 - Atores em destaque na Rede de Amizade - Turma 3. ......................123 Tabela 13 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 1....124 Tabela 14 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 2....124 Tabela 15 - Análise das Redes de Trabalho, Confiança e Amizade - Turma 3....124 LISTA DE GRÁFICOS Gráfico 01 - Tempo de formação das redes estudadas ........................................68 Gráfico 02 – Tamanho das redes estudadas.........................................................69 Gráfico 03 - Fontes de dados Bibliográficos..........................................................70 Gráfico 04 - Relação dos atributos Nota e Trabalho em Equipe. .........................141 Gráfico 05 - Relação dos atributos Tipo de Escola e Livros. ................................141 LISTA DE SIGLAS ARS – Análise de Redes Sociais BD – Banco de Dados DW – Data Warehouse CEFET – Centro Federal de Educação Tecnológica KDD – Knowledge Discovery on Databases MD – Mineração de Dados OLAP – On-Line Analytical Processing RSI – Redes Sociais Informais SNA – Social Network Analysis TI – Tecnologia da Informação UNIPAC – Universidade Presidente Antônio Carlos SUMÁRIO 1 INTRODUÇÃO............................................................................................... 19 1.1 A SITUAÇÃO PROBLEMA ......................................................................... 20 1.2 OBJETIVOS DA PESQUISA....................................................................... 21 1.2.1 Objetivo Geral......................................................................................... 21 1.2.2 Objetivos Específicos............................................................................ 21 1.3 DELIMITAÇÃO DA PESQUISA................................................................... 21 1.4 JUSTIFICATIVA E RELEVÂNCIA DA PESQUISA...................................... 22 1.4.1 Contribuição pessoal e profissional .................................................... 23 1.5 ESTRUTURA DO TRABALHO.................................................................... 23 2 REVISÃO DA LITERATURA......................................................................... 25 2.1 REDES SOCIAIS ........................................................................................ 25 2.1.1 Definição................................................................................................. 25 2.1.2 Histórico ................................................................................................. 28 2.1.3 Análise de Redes Sociais...................................................................... 35 2.1.3.1 Perspectiva Estrutural ........................................................................... 43 2.1.3.2 Perspectiva Relacional.......................................................................... 44 2.1.3.3 Perspectiva centrada em Ego ............................................................... 45 2.1.3.4 Softwares para Análise de Redes Sociais ............................................ 46 2.2 MINERAÇÃO DE DADOS – DATA MINING ............................................... 52 2.2.1 Dado, Informação, Conhecimento ........................................................ 52 2.2.2 Data Warehouse ..................................................................................... 54 2.2.3 Mineração de Dados (MD) ..................................................................... 56 2.2.3.1 Conceitos .............................................................................................. 56 2.2.3.2 Técnicas de Mineração de Dados......................................................... 60 2.2.3.2.1 Regras de Associação ....................................................................... 61 2.2.3.2.2 Classificação ...................................................................................... 62 2.2.3.2.3 Agrupamento (Clustering) .................................................................. 63 2.2.3.2.4 Padronização ..................................................................................... 63 3 METODOLOGIA............................................................................................ 64 3.1 DEFINIÇÃO DE PESQUISA ....................................................................... 64 3.2 ESTUDO DE CASO .................................................................................... 64 3.3 CLASSIFICAÇÃO DA PESQUISA .............................................................. 65 3.4 ABORDAGEM DA PESQUISA.................................................................... 66 3.5 POPULAÇÃO ALVO ................................................................................... 68 3.6 ETAPAS DA PESQUISA............................................................................. 69 3.6.1 Pesquisa bibliográfica ........................................................................... 70 3.6.2 Coleta de dados ..................................................................................... 70 3.6.3 Tratamento e análise dos dados........................................................... 71 3.7 LIMITAÇÃO DA PESQUISA ....................................................................... 71 4 ESTUDO DE CASO....................................................................................... 73 4.1 ETAPAS DO ESTUDO................................................................................ 73 4.2 ANÁLISE DAS REDES SOCIAIS ATRAVÉS DE SOFTWARE ARS........... 74 4.2.1 TURMA 1 ................................................................................................. 76 4.2.1.1 Análise da Rede de Trabalho................................................................ 76 4.2.1.2 Análise da Rede de Confiança.............................................................. 82 4.2.1.3 Análise da Rede de Amizade ................................................................ 87 4.2.2 TURMA 2 ................................................................................................. 92 4.2.2.1 Análise da Rede de Trabalho................................................................ 92 4.2.2.2 Análise da Rede de Confiança.............................................................. 97 4.2.2.3 Análise da Rede de Amizade ................................................................ 102 4.2.3 TURMA 3 ................................................................................................. 107 4.2.3.1 Análise da Rede de Trabalho................................................................ 107 4.2.3.2 Análise da Rede de Confiança.............................................................. 113 4.2.3.3 Análise da Rede de Amizade ................................................................ 118 4.2.4 SÍNTESE DA ANÁLISE DAS TRÊS REDES .......................................... 124 4.3 ANÁLISE DAS REDES SOCIAIS ATRAVÉS DE DATA MINING................ 125 4.3.1 INTERPRETAÇÃO DOS RESULTADOS REFERENTES....................... .... À CADA ATRIBUTO......................................................................................... 129 4.3.2 INTERPRETAÇÃO DOS RESULTADOS ATRAVÉS DO ....................... .... PROCESSO DE CLUSTERIZAÇÃO ................................................................ 143 4.3.3 ANÁLISE DOS RESULTADOS .............................................................. 150 5 CONCLUSÕES E TRABALHOS FUTUROS................................................. 155 6 REFERÊNCIAS BIBLIOGRÁFICAS.............................................................. 158 ANEXO 1 – FORMULÁRIO DA PESQUISA .................................................... 167 ANEXO 2 – INDICADORES QUANTITATIVOS DA ARS ................................ 171 ANEXO 3 – INSTITUIÇÕES PARTICIPANTES DA PESQUISA...................... 172 19 1 INTRODUÇÃO Diante da globalização e grande competitividade, torna-se claro aos gestores de mentes diferenciadas, que a gestão do conhecimento é ponto central para que um indivíduo esteja à frente de seus competidores e preparado para uma realidade de mercado com mudanças aceleradas e de múltiplas dimensões. Nessa perspectiva de valorização do conhecimento, destacam-se as redes sociais informais, que vislumbram uma reunião de indivíduos de diferentes competências, especialidades, características e organizações, em busca de potencializar a fluência e consistência do conhecimento. Num sentido etimológico o termo “rede” é derivado do latim (retis), e significa “entrelaçamento de fios, cordas, cordéis, arames com aberturas regulares fixadas por malhas, formando uma espécie de tecido”. A partir da noção de estrutura reticulada e entrelaçamento a palavra foi ganhando novos significados ao longo do tempo e abordagens cada vez mais interdisciplinares (LOIOLA; MOURA, 1997). Segundo Marteleto (2001), a rede social representa um conjunto de participantes autônomos, unindo idéias e recursos em torno de valores e interesses compartilhados. As relações podem ser direcionais ou não direcionais e as redes podem ter mais de uma relação. Uma rede social refere-se a um conjunto de pessoas (organizações ou entidades) conectadas por relacionamentos sociais, motivadas pela amizade, relação de trabalho ou troca de informação – uma representação formal de atores e suas relações. O fenômeno da conectividade é que constitui a dinâmica das redes e existe apenas na medida em que as conexões forem estabelecidas (MARTELETO, 2001). Uma rede é fundada na multiplicidade de seus elementos participantes e principalmente na horizontalidade das interligações. A rede é um tipo de organização específico, que se distingue das demais por conta de seus aspectos formais e seus aspectos processuais ou operacionais. Atualmente várias redes estão sendo criadas e fomentadas por diferentes indivíduos e organizações, com foco na aquisição, troca, criação e disseminação de conhecimento entre seus colaboradores, na busca de melhoria de desempenho e 20 eficiência para o enfrentamento das mudanças inevitáveis, tornando possível sobreviver nesse ambiente competitivo. Para melhor compreender a dinâmica das redes, destacam-se as ferramentas estratégicas de análise de redes sociais, que possibilitam o mapeamento das redes, auxiliando na compreensão das conexões que se estabelecem entre indivíduos, o fluxo de informações, além das características e peculiaridades das mesmas. Segundo Martelo (2005), a análise de redes estabelece um novo paradigma na pesquisa sobre a estrutura social. Para estudar como os comportamentos ou as opiniões dos indivíduos dependem das estruturas nas quais eles se inserem, a unidade de análise não são os atributos individuais (classe, sexo, idade, gênero), mas o conjunto de relações que os indivíduos estabelecem através das suas interações uns com os outros. Com a aplicação dessa ferramenta de análise de redes sociais, é possível identificar a teia global de alianças estratégicas de cada indivíduo e sua importância para o fluxo de informações na rede. Ao identificar os indivíduos com o papel de elo fundamental na rede, torna-se curioso compreender esse tipo de ator, seus atributos e características. Será que existe um padrão comportamental desses indivíduos? Quais as características que os levam a exercer papel de tamanha importância dentro dessa estrutura não hierárquica e enriquecedora? Esse é o foco principal desse estudo: mapear e identificar os atores principais das redes e reconhecer as similaridades em seus atributos que caracterizam o perfil desses indivíduos situados em posição de destaque nas redes as quais esses se conectam. 1.1 A SITUAÇÃO PROBLEMA A compreensão dessa dinâmica invisível das redes organizacionais, além de ser um fator de grande contribuição para a gestão de pessoas, é também um fator que gera curiosidades diversas. Que tipo de indivíduo conecta-se a uma rede social a fim de ampliar, mas também ceder a outros indivíduos seus próprios conhecimentos tácitos e explícitos? O que o torna facilitador e conector de 21 informações a vários outros indivíduos? Quais características comportamentais influenciam a dimensão posicional da rede? Através da análise de redes sociais é possível além de identificar os principais personagens de uma rede, compreender também as características comportamentais e atributos que melhor definem esse indivíduo. Considera-se portanto como o problema desse estudo, identificar, através da associação de ferramentas de data mining aos métodos de análise de redes sociais, a existência de uma similaridade de perfil dos conectores centrais das redes analisadas. 1.2 OBJETIVOS DA PESQUISA 1.2.1 Objetivo geral Mapear e identificar os atores principais de três redes de alunos de graduação e reconhecer nos conectores centrais características padrão. 1.2.2 Objetivos específicos • Mapear as redes através de software de análise de redes sociais; • Identificar os atores principais das redes; • Criar uma base de dados com os atributos dos conectores centrais das redes; • Analisar os atributos desses indivíduos através de data mining; • Analisar os resultados encontrados nas três redes. 1.3 DELIMITAÇÃO DA PESQUISA O estudo de redes sociais informais pode ter vários enfoques e se apoiar em diversos conceitos. O estudo de redes desse trabalho será focado em redes sociais informais do contexto acadêmico. Os principais conceitos que embasam a análise de redes sociais são: 22 • Ator: é considerado ator qualquer entidade existente no contexto da rede que participe ou não dos processos de inovação podendo ser uma unidade coletiva, corporativa ou individual; • Vínculo relacional: é uma ligação mantida entre atores; • Relação: é uma coleção de vínculos relacionais de um tipo específico entre atores de um grupo; • Subgrupo: é um subconjunto de atores e todos os vínculos relacionais entre eles; • Rede social: consiste de um conjunto finito de atores e as relações existentes entre eles. Cross e Prusak (2002) também identificam quatro papéis desempenhados por atores das redes: Conector Central, Expansor de Fronteiras, Corretor de Informação, Especialista Periférico. Esse estudo ficará centrado no Conector Central das redes analisadas. Buscando um maior detalhamento e conhecimento dos padrões comportamentais desses atores, que na dimensão posicional de uma rede são considerados elos fundamentais para o fluxo da informação na mesma. Para tal, será utilizada uma nova abordagem analítica, associando conhecimentos estabelecidos na literatura de análise de redes sociais convergindo com conhecimentos de data mining, Considerando o posicionamento de Dias, Mariano e Mayer (2007), devemos ter cuidado com o estudo de caso, pois o mesmo possui pouca generalização (não se pode garantir que os resultados possam ser aplicados com sucesso e na íntegra em outras organizações). 1.4 JUSTIFICATIVA E RELEVÂNCIA DA PESQUISA O tema redes sociais é um tema abrangente, e com enfoques variados. Transmite idéia de fluxo, de ligação, de circulação. É usualmente estudado no plano técnico-operacional, tecnológico, político, biológico, geográfico, financeiro. Nesse estudo analisaremos a rede na perspectiva social, onde indivíduos oriundos de diferentes organizações, profissões, culturas, relacionam-se em redes sociais informais na busca de ampliação de conhecimento. 23 O mapeamento das redes informais, busca compreender a dinâmica invisível dos relacionamentos entre indivíduos que voluntariamente tornam-se propulsores de informação e grandes colaboradores dentro de uma organização. Através desse mapeamento são reveladas conexões interpessoais difíceis de serem identificadas pelos meios tradicionais, proporcionando uma melhor compreensão do processo de troca informal de conhecimento existente nas redes. 1.4.1 Contribuição pessoal e profissional A contribuição de grande relevância desse trabalho no que se refere à Academia, será na apresentação de uma metodologia diferenciada de análise dos atores de uma rede social associando ARS com data mining. Esse estudo utilizará uma abordagem embasada na metodologia de análise de redes sociais para o estudo da dimensão relacional e posicional dos atores a elas conectados. Aliado ao estudo dos principais atributos desses atores, através da técnica de data mining na busca de similaridades ou padrões comportamentais que influenciam o desempenho acadêmico dos atores de destaque das redes. Esse estudo proporcionou à pesquisadora um contato fascinante com um tema ao qual ela estava imersa, às cegas. Essa imersão no universo das redes possibilitou à pesquisadora uma pretensiosa percepção da natureza e complexidade das redes sociais informais. Além de proporcionar uma nova visão do papel assumido pela pesquisadora em suas formas de participação e conexão nas redes sociais. No aspecto profissional, ao se fundamentar sobre o tema fascinante das redes, a pesquisadora identificou na análise de redes uma importante ferramenta a ser aplicada junto a seus “clientes”, alunos do CEFET, na busca de uma melhor gestão e disseminação do conhecimento. 1.5 ESTRUTURA DO TRABALHO Esse trabalho foi dividido em partes e será composto pela estrutura a seguir. O primeiro capítulo da pesquisa apresenta a Introdução, onde são descritas as questões que impulsionaram a pesquisadora a desenvolver esse trabalho, tais 24 como: o problema, a relevância e os objetivos da pesquisa. Essa foi redigida com o intuito de despertar e prender a atenção e curiosidade do leitor. O segundo capítulo da pesquisa apresenta a Revisão da Literatura, onde são descritos os conhecimentos adquiridos nas inúmeras literaturas relacionadas ao tema da pesquisa: análise de redes sociais e data mining. Através desses, a pesquisadora aprofundou seu embasamento teórico para o desenvolvimento de seu estudo de caso. O terceiro capítulo apresenta a Metodologia de Pesquisa, onde são descritas, de forma clara os aspectos metodológicos envolvidos no processo de desenvolvimento dessa pesquisa. Esse detalhamento possibilita a aplicação desse estudo de caso por outros pesquisadores. No quarto capítulo foi descrito todo o estudo de caso, com o mapeamento das redes, detalhamento das análises das informações pesquisadas e dos resultados obtidos com o estudo. O quinto capítulo apresenta a conclusão do estudo e as sugestões para pesquisas futuras. 25 2 REVISÃO DA LITERATURA 2.1 REDES SOCIAIS 2.1.1 Definição Cada indivíduo está inserido em diversas relações sociais, sejam elas de amizade, de trabalho, de estudo, familiar, dentre outras. Cada uma dessas relações sociais pode ser vista como uma rede. Dentro das redes, cada pessoa pode ser vista como uma estrela, a partir da qual linhas irradiam-se para outros pontos, que, por sua vez, conectam-se a outros pontos, formando sua rede de contatos (LAGO JÚNIOR, 2005). As redes sociais são definidas como um conjunto de dois elementos: atores e suas conexões. Wasserman e Faust (1994), destacam que as redes sociais são conjuntos de contatos que ligam vários atores, que podem ser de diferentes tipos, apresentarem conteúdos diferentes, bem como propriedades estruturais distintas. O estudo das redes possui vários enfoques. Os primeiros estudos partiram das ciências exatas, através da criação da teoria dos grafos. O grafo é um conjunto de nós, conectados por arestas, que em conjunto, formam uma rede. Mais tarde os estudos passaram pelas áreas das ciências biológicas, depois pela sociologia e antropologia, momento em que assume a definição de formas específicas de interação entre indivíduos e grupos familiares, grupos sociais, grupos de trabalho, etc.(SCOTT, 2000). Para Marteleto (2001), as redes sociais são um conjunto de participantes autônomos unindo idéias e recursos em torno de valores e interesses compartilhados. Além disso, a rede é uma estrutura não-linear, descentralizada, dinâmica, flexível, sem limites definidos e autoorganizável, e estabelece-se por relações horizontais de cooperação. Os autores enfatizam a constante mutação e a complexidade que o termo rede sofre dependendo do contexto em que é utilizado, podendo esse, assumir diferentes sentidos conforme a área de conhecimento. Castells (2003) afirma que as redes são estruturas abertas capazes de expandir de forma ilimitada, integrando novos nós, ou atores, desde que consigam 26 comunicar-se dentro da rede, ou seja, desde que compartilhem os mesmos códigos de comunicação (linguagem, valores, informações). Ainda seguindo a visão de Castells (2003) podemos de forma simplificada, considerar que: Rede é um conjunto de nós interconectados. Nó é o ponto no qual uma curva se entrecorta. As redes sociais representam um conjunto de pessoas, ou outras entidades sociais conectadas por relacionamentos sociais, essas se relacionam motivadas pela amizade, por relações de trabalho ou compartilhamento de informações e, por meio dessas ligações, vão construindo e re-construindo a estrutura social. Figura 01 – Representação de uma rede de elementos interligados. Dentro da bibliografia existem inúmeras descrições para os termos rede, tais como: − “uma rede, por definição, não tem centro, mas apenas nós de diferentes dimensões e relações internodais que são freqüentemente assimétricas. Entretanto, em última instância, todos os nós são necessários para a existência da rede”; (CASTELLS, 1998,p.11). 27 − “o termo rede, em sua multiplicidade, nos remete tanto a uma dimensão conceitual como a uma vertente instrumental”. Rede é uma proposta de ação, “um modo espontâneo de organização em oposição a uma dimensão formal e instituída”; (JUNQUEIRA, 1998, p. 96). -− “(...) o uso mais geral para o termo ‘rede’ é para uma estrutura de laços entre atores de um sistema social. Esses atores podem ser papéis, indivíduos, organizações, setores ou estados-nação. Os seus laços podem basear-se na conversação, afeto, amizade, parentesco, autoridade, trocas econômicas, troca de informação ou quaisquer outras coisas que constituem a base de uma relação “ (NOHRIA ; ECCLES, 1998). “[...] Com base em seu dinamismo, as redes, dentro do ambiente organizacional, funcionam como espaços para o compartilhamento de informação e do conhecimento.” (TOMAEL, ALCARA E DI CHIARA 2005, p. 94). Kanter; Kao; Wiersema (1998) ressaltam que nem todas as redes são espontâneas, os líderes organizacionais devem constantemente monitorar áreas em que atuam para manter e contribuir para criação de novas redes. É importante destacar que para o desenvolvimento e manutenção de uma rede é fundamental construir confiança entre seus integrantes e oferecer-lhes oportunidades de compartilhamento de idéias e conhecimentos. Segundo SCOTT (2000), as redes sociais incorporam tanto o fluxo de informações, que envolve a transferência de informações entre os indivíduos, o estabelecimento de normas sociais e a criação de certo consenso, quanto uma transferência de recursos e serviços, que ele denomina de ação instrumental. Para que a rede possa efetivar seu papel social é fundamental que haja confiança entre os atores da rede. Neto (2009) destaca que a confiança cria o alicerce para cada integrante singular da comunidade não depender apenas da eficiência com que ele enfrenta seus problemas, mas também se apoiar nas capacidades que cada um tem de “co-evoluir” em consonância com a identidade da organização. 28 2.1.2 Histórico Capra (1995) mostra que sempre que olhamos para a vida, olhamos para as redes. Para o autor, sempre houve uma espécie de rede na organização da sociedade. No entanto, a visão sistêmica de rede surge a partir de estudos realizados entre 1920 e 1930, quando a Biologia demonstrou o conceito de teias alimentares e os ciclos da vida, propondo que a rede é um padrão único de organização, comum a todos os sistemas vivos. Segundo J.Scott (2000), três vertentes embasaram a atual teoria de redes sociais: Analistas Sociométricos, Pesquisadores de Harvard e Antropólogos de Manchester. Figura 02 – Origem da Análise de Redes Sociais. Fonte: Scott (2000, p.8). 29 A primeira vertente diz respeito aos trabalhos desenvolvidos pelos analistas sociométricos, que criaram muitas técnicas avançadas através de trabalhos realizados em pequenos grupos. A técnica mais importante foi a teoria dos grafos (ramo da matemática que permite a resolução de problemas complexos, por meio de representações gráficas que incluem pontos, arcos, arestas, etc.). O representante de maior destaque dessa corrente é Moreno, responsável pelo desenvolvimento da utilização de sociogramas (representações gráficas que indicavam as relações sociais dos indivíduos, em vilas, tribos e, até mesmo cidades) representativas das propriedades formais de configurações sociais. Essas interações, chamadas por Moreno de “configurações sociais” representam as propriedades formais das forças de atração, repulsão e indiferença que operam nos grupos; revelando as conexões entre os sujeitos e permitindo ao pesquisador visualizar os canais de fluxo de comunicação entre os indivíduos e conexões entre as pessoas (SANTOS 2004). Figura 03 – O Sociograma de Moreno. Fonte: Freeman, J (2002). 30 A segunda vertente diz respeito aos trabalhos desenvolvidos pelos pesquisadores de Harward, também na década de 30. Esses exploraram os padrões das relações interpessoais informais e a formação de subgrupos (cliques, clusters). Os pesquisadores de maior destaque dessa corrente são Radeliffe-Brown. Warner e Mayo. Em seus trabalhos, Warner sofre diferentes influências empíricas e teóricas, tais como as noções de organicidade Radeliffe-Brown ou Radcliffe-Brown; relações recíprocas e análise de díades e tríades (Simmel); modelo sistêmico de sociedade (Henderson) e configurações sociais (Simmel, Moreno). Segundo o autor, cliques “são associações informais de pessoas, em torno das quais há um grau de sentimento de grupo e intimidade e onde certas normas de conduta foram tacitamente estabelecidas e aceitas” (DEGENNE; FORSÉ, 1994, p.94) Esse estudo revela um pioneirismo no uso de métodos formais de análise estrutural e uma das primeiras referências a utilizar a terminologia de redes para descrever a estruturação em subgrupos de sociedades; avança também na análise formal dos diagramas de estrutura dos cliques chamado de “análise posicional” (SILVA, 2003). A terceira vertente diz respeito aos trabalhos desenvolvidos pelos antropólogos de Manchester. Seus estudos foram fundamentados nas duas correntes anteriores e enfatizam a análise dos conflitos e contradições, ao invés da integração e coesão. Os pesquisadores de maior destaque dessa corrente são Radeliffe-Brown, Barnes, Mitchell e Bott, esses se destacam por sua contribuição na construção dos alicerces da teoria de análise de rede social. Segundo Scott (2000), a interpretação de Mitchell para a teoria dos grafos e para a sociometria o levou a focar, exatamente, nas características de organização informal e interpessoal que foram ressaltadas por Mayo, Warner e Homans. Para descrever as relações em grupos sociais de forma ilustrativa foram utilizados métodos matriciais que deram origem à teoria matricial. Na década de 40, foi feita uma releitura de alguns dos principais pesquisadores de Harvard originando um método de rearranjo da matriz em análise de rede social que divide a estrutura de qualquer grupo em um sistema interno, conhecido na atualidade como redes informais, e, um sistema externo através do qual as atividades do grupo são relacionadas às questões de adaptação ambiental. Para atingir a meta da construção de modelos formais, ele advogava uma abordagem matemática para a estrutura (SANTOS, 2004). O uso de matrizes para denotar relações em grupos 31 sociais cresceu a partir do ano 1940 e as operações matriciais passaram a ser amplamente usadas para definições e cálculos em análise de redes sociais, sendo a representação primária para a maioria dos softwares de análise de redes sociais (SILVA, 2003). Até a década de 50, Barnes e outros antropólogos desenvolveram estudos focados na urbanização, evidenciando que a tradicional abordagem antropológica para as organizações sociais não eram suficientemente ricas para sociedades complexas. Surgindo a necessidade de novos conceitos para quantificar a relação encontrada no campo, em termos tais como a abertura, a conectividade, densidade, círculo social, etc. aplicáveis às situações sociais estudadas (GALASKIEWICZ J. S. WASSERMAN, 1993). Baseado nos estudos de Barnes (estudos da corrente sociométrica), o psicólogo austríaco, Siegfried Nadel, passou a defender uma abordagem matemática à estrutura, sugerindo a aplicação de métodos algébricos e matriciais para a análise de papéis. Esse desenvolveu a idéia de “papel” como um conceito central da teoria sociológica. Dando continuidade a essas idéias Mitchell voltou-se para a teoria dos grafos e para a sociometria, focado nas principais características das organizações interpessoais e informais, voltando sua atenção às redes centradas em indivíduos. Gerando o conceito de ordem pessoal como o padrão de ligações pessoais que os indivíduos têm com um conjunto de pessoas e ligações que essas pessoas têm entre elas (LOZARES, 1996). Para Mitchell, essas interações que envolvem comunicação, estabelecimento de normas sociais, além de transferência de informação de bens e serviços entre pessoas, estabelecimento de normas sociais, são o verdadeiro campo de estudo da análise de redes. Em seus estudos, Mitchell definiu “rede total” de uma sociedade como o conjunto de ligações em permanente ramificação e reticulação que se espalha dentro e além dos limites de qualquer comunidade ou organização e redes parciais como aspectos específicos da rede total (LOZARES, 1996). Nos anos 60 e 70 essas escolas caminharam juntas até um novo desembocando em Harvard, quando a análise de redes sociais contemporânea foi criada. Foram destaque os trabalhos que abordam redes interorganizacionais de Cook em 1977 e os trabalhos de Brass em 1985 abordando as relações nas redes intraorganizacionais. . 32 Na década de 80 crescem as pesquisas utilizando modelos estatísticos para a análise de redes, nessa década foi desenvolvido, por Krackhardt um software para análise de redes intraorganizacionais denominado Krackplot 3.3. Muitos dos estudiosos que privilegiam as redes, tais como: Krackhardt e Porter (1986), Kuipers (1999), Cross e Prusak (2002), Kilduf e Tsai (2003), Silva (2004), dentre outros, apresentam como visão comum que as redes informais são poderosas ferramentas de suporte, aconselhamento, compartilhamento de informações, poder, status que auxiliam de forma invisível seus atores graças a seus contatos informais. Krackhardt e Hanson (1993) apresentaram a tipologia de redes de confiança, de troca de informações e redes de comunicação. Kuipers (1999), além de rede informal de confiança, apresenta como tipologia, as redes de informação, de amizade e de confiança. Lago Junior (2005) em seu trabalho descreve três tipos de redes informais: • Rede de amizade: rede informal baseada na troca de amizade e socialização. • Rede de confiança: rede informal na qual um ator se permite correr riscos, abrindo mão do controle dos resultados, e tornando-se dependente de outro ator (revela com quem eram trocadas confidências, em que laços de confiança são mais centrados na pessoa do que na posição formal que ocupa). • Rede de informação: rede informal na qual a informação é conduzida sobre o que está acontecendo na organização, e que afeta todos os seus membros (revela o fluxo de informações entre os atores). Os dois tipos básicos de redes intraorganizacionais são denominados de rede formal e informal. A rede social formal é considerada como uma série de ligações ou laços prescritos entre posições formais ou padronizadas em contraposição às estruturas informais, que não são explicitadas ou prescritas pelas organizações e é intensa a idéia de fluxo e troca entre os atores, implicando em benefícios mútuos e recíprocos (LIMA, 2008). 33 Ao longo dos anos, a teoria das redes vem sendo estudada e analisada por vários autores de diferentes áreas e visões, conforme quadro de temas de redes estudados ao longo dos últimos anos: Década de 50 e 60 Década de 70 Bavelas (1950); Bavelas e Barret (1951); Resolução de problema em grupo Leavitt Coleman, Katz e Menzel (1957) Difusão e adoção de inovações Kadushin (1966) Suporte social Michell (1969) Fenômenos urbanos complexos Kapferer (1969) Formação de coalisão grupal Laumann e Pappi (1973); Laumann, Tomada de decisão em comunidade Marsden e Galaskievwics (1977); Wellman (1979) Década de Cook (1977) Poder e redes interorganizacionais Zachary (1977) Formação de coalizão Rogers (1979) Difusão e adoção de inovações Thurman (1980) Formação de coalizão Fischer (1982) Urbanização e bem estar individual Brass (1985) Influências de gênero nas relações 80 intraorganizacionais Krackhardt e Porter (1986) Influências individuais na rotatividade Krackhardt (1987); Freeman, Romney, e Cognição e percepção social Reeman 1987 Krackhardt e Stern (1988); Nelson (1989) Resposta a crise e conflito nas organizações Krackhardt (1987), 1988 e 1992 Procedimentos QAP e modelos estatísticos Década de Krackhardt e Kilduff (1990) 90 Cultura organizacional e relações informais de amizade Krackhardt (1990); Ibarra e Andrews Relações de poder, sensemaking e (1995); Krackhardt e Carley (1998) impacto em inovações 34 Krackhardt e Kilduff (1994) Reputação Tolbert, Salancik, Krackhardt e Andrews Efeitos individuais de posições na rede (1995), Krackhardt e Carley (1998) Podolny, Stuart e Hannan (1996) Redes interorganizacionais Doreian, Kapuscincski, Krackhardt e Transitividade, reciprocidade e Szczypula (1996) equilíbrio grupal Wasserman e Pattison (1996) Modelos estatísticos Ibarra (1993); Smith-Lovin e Ibarra Gênero e redes intraorganizacionais (1997); Mehra, Kilduff e Brass (1998) A partir do ano 2000 Labianca, Brass e Gray (1998) Percepção de conflito intergrupal Brass, Butterfield e Skaggs (1998) Relações e comportamento antiético Kuipers (1999) Tipologia de redes informais Castells (1999) A sociedade em rede Carvalho (2000); Candido e Abreu (2000), Redes interorganizacionais Oliver (2001), Hasegawa e Furtado (2001) e Penno (2002) Mehra, Kilduff e Brass (2001) Redes de alto e baixo desempenho Lazer (2001) Rede e atitude individual Nascimento (2000), Marteleto (2001), Lai Transferência de informações em e Wong (2002) redes Sluzki (1997 e 200) Alternativa terapêutica e saúde mental Najmanovich (2002) Novo paradigma e rede Kadushin Motivação Leenders (2002) Modelo matemático Cross e Prusak (2002); Cross, Borgatti e Redes informais Parker (2002) Fernandez (2002) Intervenção em comunidades Tsai e Kilduff (2003) Abordagem cognitiva e rede intraorganizacional Quadro 01 – Temas estudados sobre Redes Sociais. Fonte: Wasserman e Faust (2008). 35 Segundo Martinho (2003), a articulação em rede passou a ser valorizada no final da década de 80 e início da década de 90, especialmente devido ao uso das redes eletrônicas. A partir dessa época, a função da rede foi explicitada e reconhecida e começou a ser considerada um elemento político na sustentação dos direitos sociais da nação. Ao analisar a estrutura das redes em uma organização, deve-se ter em mente que as redes são formadas por múltiplas relações internas e externas. Nessa perspectiva, podemos analisar as redes nos aspectos intra e interorganizacionais. No aspecto intraorganizacional, também conhecido por microambiente, estarão sendo analisados apenas os aspectos internos da organização, tais como relação entre as pessoas, os setores, o processo produtivo, etc.. No aspecto interoganizacional, estarão sendo analisadas as relações externas à organização. Essas ligações compreendem laços pessoais, alianças estratégicas, fluxos de informações, dentre outras. O objeto do estudo das redes é analisar essas estruturas, seus impactos e evolução. Segundo Nonaka e Takeuchi (1995), a criação do conhecimento organizacional, deve ser entendida como um processo que amplifica o conhecimento criado por indivíduos e cristaliza-o como parte da rede de conhecimentos da organização. Esse processo ocorre dentro de uma ‘comunidade de interação’ em expansão, que atravessa os níveis das fronteiras intra e interorganizacionais. 2.1.3 Análise de Redes Sociais A análise de redes é uma forma de análise de dados que difere dos métodos tradicionais de análise. Ela tem sido utilizada nas análises sociais, subsidiando pesquisadores para descrever fenômenos empíricos onde se dá importância às interações entre os atores de um determinado contexto social. A noção de redes sociais e os métodos de análise dessas redes têm sido bastante usado na comunidade científica para analisar relacionamentos entre entidades sociais e os padrões (WASSERMAN E FAUST, 2008). e implicações desses relacionamentos 36 A análise de redes sociais não toma como unidade de análise o ator individual que faz parte da rede em estudo, mas a coleção de atores ou indivíduos e as suas interações (WASSERMAN E FAUST, 1994). A análise de redes sociais (ARS) é uma técnica que propicia uma leitura dinâmica das interações sociais e uma alternativa à interpretação estática do papel social do indivíduo ou grupo dentro de um contexto (MARTELETO, 2001). A metodologia de Análise de Redes Sociais, conhecida também por Social Network Analysis (S.N.A.) é uma ferramenta de diagnóstico da dinâmica das interações sociais. Essa difere dos métodos tradicionais de análises sociais, auxiliando pesquisadores a compreender e descrever fenômenos empíricos onde se dá importância às interações entre indivíduos de um determinado contexto social. Segundo Martelo (2005), a análise de redes estabelece um novo paradigma na pesquisa sobre estrutura social. De caráter interdisciplinar a ARS interessou pesquisadores de várias áreas de conhecimento, dando assim, origem a diversas técnicas de análise que tem como base as relações entre os indivíduos numa estrutura em forma de redes (MARTELETO, 2004; SILVA, 2003). Em uma rede, os relacionamentos podem ser de diversos tipos: econômicos, políticos, afetivos e sociais. A estrutura é definida também como uma rede de relações e de limitações que exerce influência nas escolhas, nas orientações, nos comportamentos, e opiniões dos indivíduos. Os principais conceitos que embasam a análise de redes sociais são: ator, vínculo relacional, relação, subgrupo, rede social. Segundo Soares (2002), a análise de redes compreende os seguintes princípios: 1 - os atores e suas ações são vistos como interdependentes, em vez de unidades autônomas; 2 - os vínculos relacionais entre atores são canais de transferência ou fluxo de recursos (materiais ou não-materiais); 3 - os modelos de rede que centram atenção sobre os indivíduos vêem o ambiente estrutural da rede como algo que pode fornecer oportunidades ou constrangimentos à ação individual; 37 4 - os modelos de rede conceituam estrutura (social, econômica, política e assim por diante) como padrões duradouros de relações entre atores; 5 - a estrutura afeta formalmente a ação, por meio de um determinismo fraco – estruturas altamente homogêneas induzem certas práticas, por causa do tipo de contatos que elas favorecem; 6 - a estrutura afeta a percepção do próprio interesse – por exemplo, qualquer pessoa que quer casar perceberá um cônjuge elegível do próprio status social, como a escolha mais econômica; 7 - os indivíduos racionais tomam decisões de acordo com próprio interesse, isto é, com base numa escala de preferências – racionalidade relativa; O autor destaca também, a importância de reconhecer que a unidade de análise, no campo das redes sociais, não é o ator individual, mas uma entidade, que consiste no conjunto de atores e nas ligações/laços entre eles. Segundo Meneghelli (2009), essa ferramenta baseia-se nos fundamentos teóricos das redes sociais, correlacionando conceitos sociológicos e matemáticos para criar grafos e possibilitar a análise dos dados, criando diversas medidas estruturais (coesão, densidade, centralidade e outros). Esse instrumento pode ser combinado com softwares que materializam, no mundo real, as relações sociais, um olhar além do manifesto e das aparências. Para Neto (2009), a técnica de análise de redes é considerada interdisciplinar por propiciar uma leitura dinâmica das interações sociais, sendo uma alternativa à interpretação “estática” (no momento da leitura) do papel social do indivíduo ou do grupo dentro de um contexto. A representação gráfica de uma rede é semelhante a um circuito de comunicação, sua representação gráfica demonstra que algumas pessoas estão conectadas a outras, mas não diz nada sobre como essas pessoas se relacionam, que tipo de mensagem está circulando nesses caminhos. 38 Figura 04 – Representação gráfica de Rede. Fonte: Site http://googlediscovery.com A análise visual das redes sociais ocorre por meio de grafos, onde os nodos representam entidades sociais (pessoas, instituições, grupos, etc.) e as setas representam os relacionamentos existentes, permitindo uma visualização da rede como um todo (FREITAS, 2008). Os critérios estruturais para análise de redes sociais podem ser realizados sob duas perspectivas: a primeira diz respeito às características estruturais relacionadas no Quadro 02 e Quadro 03 que seguem abaixo: Características estruturais das Redes Ator Ligações ou Laço Relacional Subgrupos É cada indivíduo, setor ou departamentos que interligado à rede. São representações gráficas de linhas que conectam os pontos (atores). São os subconjuntos de atores de uma determinada rede. A formação desses subconjuntos pode estar relacionada com posição hierárquica, localização, afinidade, idade, escolaridade, sexo. 39 Quando envolvem ligações entre dois atores são denominados díades e quando as ligações envolvem três atores são denominados tríades. Relação É um tipo específico de ligações de um determinado grupo Tamanho É a quantidade de conexões existentes entre os atores de uma rede. 1 Densidade É o quociente entre o número de ligações existentes pelo número de ligações possíveis em uma determinada rede. Essa retrata a potencialidade da rede em termos de fluxo de informações, ou seja, quanto maior a densidade mais intensa é a troca de informações na referida rede e vice-versa. Distância Geodésica Diâmetro É o caminho mais curto entre dois atores de uma rede É a maior distância geodésica entre quaisquer pares de atores de uma rede. Quadro 02 – Perspectiva abordando características estruturais da rede. Fonte: Lago Júnior (2005). Características estruturais das Redes Coesão Trata-se do forte relacionamento entre atores de uma rede, formando subgrupos em virtude de vínculos estabelecidos por afinidades. Esse campo de estudo possui um forte apelo na correlação entre a coesão e padrões de comportamento desses subgrupos. Clique Definição herdada da teoria dos grafos, onde três ou mais atores escolhem a todos do subgrupo como pares em suas ligações. É o que informalmente denominamos de “grupinhos” ou “panelinhas” dentro das organizações. Alguns sociólogos por julgarem muito restrita a definição de clique, uma vez que pressupõe que todas as ligações sejam recíprocas para considerar a existência do clique, criaram outros conceitos, não baseados na reciprocidade, e sim no quão um determinado ator é acessível e na capacidade de conectividade (adjacência). O primeiro conceito baseia-se nas distâncias geodésicas (n-clique) e diâmetro (n-clã), e o segundo baseia-se na capacidade de conectividade (k-plex). Reciprocidade As ligações entre os atores podem ser analisadas quanto ao sentido (representadas por setas). Nesses casos, a ligação é recíproca quando flui nos dois sentidos. Por exemplo, Pedro confia em João e 1 O tamanho é o mais importante critério estrutural da rede pessoal de um ator ou grupo, pois todos os demais critérios são calculados a partir do número total de ligações. Redes com presença de todos os laços possíveis são empiricamente raras (HANNEMAN, 2005) 40 esse, também, confia em Pedro. N-Clique São considerados atores coesos aqueles que apresentam uma distância geodésica entre quaisquer dois atores nunca superior a “n”, onde “n“ é o valor de corte da distância geodésica máxima. Contudo, permitiu-se que alguns atores que não faziam parte do clique em questão fossem inserido na análise, o que deu origem ao conceito de n-clã. N-Clã São considerados os subgrupos cujo diâmetro não pode ser superior a “n”, onde “n” é o valor de corte do diâmetro máximo. K-Plex Considera-se ator de um subgrupo aquele que é adjacente a quase todos os outros, sendo K o número de exceções, eliminando a necessidade de existência de ligações entre todos os atores de um subgrupo, ou seja, baseia-se na capacidade de conectividade, como comentado acima. Quadro 03 – Perspectiva abordando características estruturais da rede, analisando também coesão e mapeamento de grupos. Fonte: Lago Júnior (2005). A segunda perspectiva é centrada em egos, analisa os atores, suas ligações e os papéis que esses desempenham nas redes sociais, conforme Quadro 04 que segue abaixo: Perspectiva centrada em egos Posição Diz respeito aos indivíduos que estão, de forma semelhante, envolvidos em redes de relação, logo, potencialmente, intercambiáveis sob a ótica da análise sociológica. Papel Diz respeito aos padrões de relações obtidas entre atores ou posições. Centralidade Calcular a centralidade de um indivíduo da rede significa analisar a posição em que esse se encontra em relação aos outros. A centralidade considera como medida a quantidade de elos que se colocam entre eles. Essa não é uma posição fixa, nem hierárquica, mas, em se tratando de redes, a centralidade de um ator pode significar poder. A posição centralizada de um indivíduo na rede favorecerá o recebimento e troca de comunicação ao mesmo. Entretanto, o fato de um indivíduo não estar em posição central na rede não significa necessariamente que esse não esteja bem posicionado 41 na rede. Centralidade de entrada É a medida do número de ligações que um ator recebe de outros atores, denotando popularidade ou receptividade. Centralidade de saída É a medida do número de ligações que um ator estabelece com outros atores dessa rede, denotando expansividade. 2 Centralidade de Essa medida caracteriza a independência de um ator em relação ao proximidade controle dos outros. Na centralidade de proximidade, considera-se que um nó é tão mais central quanto o menor caminho que esse necessita percorrer para alcançar outros indivíduos da rede. Centralidade de Bonacich É uma medida qualitativa de centralidade, pois leva em consideração não apenas o número de referências que um ator recebe de outros atores, mas o prestígio desses primeiros, denotando, também, o aspecto de prestígio em relação ao ator analisado. Centralidade da Em uma rede pode-se analisar a centralidade da informação, onde é informação considerado se um indivíduo é central em relação à informação. Nesse caso seu posicionamento estratégico, mesmo que não seja centralizado, lhe proporciona conexões com atores distribuídos pela maior parte do ambiente da rede. Os atores com alto índice de centralidade da informação tornam-se referências dentro do ambiente da rede. Centralidade da Essa calcula o potencial dos elos que servem de intermediários, intermediação “ponte” na rede. Esses indivíduos “ponte” são facilitadores do fluxo da informação entre os elos da rede. Um indivíduo pode não estar em posição central, nem mesmo possuir contatos fortes, mas pode ser importante mediador no fluxo, e direção das informações. “A intermediação de um ponto em presença de dois outros atores se define por sua faculdade de se situar sobre o caminho ou os caminhos geodésicos, isto é, de menor distância, ligando esses dois pontos.” (Degenne & Forsé, 1994: p. 158). Quadro 04 – Perspectiva centrada em egos. Fonte: Lago Júnior (2005). As possibilidades de mapeamentos das relações entre indivíduos que formam as redes sociais são ilimitadas, deverão ser formuladas conforme as necessidades 2 Em análise de redes sociais, a centralidade de grau de saída mede a expansividade de um ator e a centralidade de grau de entrada mede o seu prestígio ou sua receptividade ou popularidade (Wasserman; Faust, 1999). 42 de cada organização. Cross e Prusak (2002) identificam quatro papéis importantes desempenhados pelos atores das redes: • Conector Central: esses indivíduos fazem a ligação da maioria dos atores uns com os outros; esses são facilmente identificados pelos colegas de rede, normalmente sabem como conseguir informações e recursos necessários para que o trabalho seja realizado, e podem gastar horas ajudando outros atores da rede. Seu papel é muito importante na rede, mas esses podem significar “gargalos” na rede, prejudicando o desempenho da rede informal. • Expansor de Fronteiras: são atores ligados a atores de outras organizações, ou de outras redes, tal papel é fundamental quando pessoas necessitam compartilhar de habilidades e necessitam estabelecer alianças, é um ator fundamental em virtude da possibilidade de conectividade com importantes redes. • Corretor de Informação: são atores que fazem a ligação entre diferentes subgrupos da rede. Esses evitam que o fluxo das informações seja interrompido devido à fragmentação da rede; esses atores desempenham papel tão importante quanto o conector central, pois possuem o mesmo poder sem possuir a quantidade de ligações diretas que caracteriza esse último. • Especialista Periférico: são atores com algum tipo de conhecimento especializado, a quem outros atores recorrem quando necessitam de informação ou conhecimento técnico. Os relacionamentos formados pelas conexões entre os atores de uma rede social podem ser analisados a partir de várias dimensões: estrutural, cognitiva e relacional (REGIS, 2005). 43 Figura 05 – Dimensões estrutural e relacional das redes sociais. Fonte: Regis (2005). 2.1.3.1 Perspectiva Estrutural A análise da dimensão estrutural, quando se considera a configuração da rede, se faz pela determinação do padrão de ligações dentre os seus membros. Tais elementos de configuração, como centralidade, densidade, conectividade e hierarquia afetam a flexibilidade e a facilidade das trocas nas redes pela acessibilidade e extensão dos contatos dos seus membros (SCOTT, 2000; WASSERMAN; FAUST, 2008). 44 A dimensão estrutural das redes está baseada na ativação das interações locais entre os atores. É possível analisar a estrutura de uma rede social mediante cálculo da densidade e centralidade da rede. A densidade representa a relação entre o número de ligações existentes em uma determinada rede e o número de ligações possíveis ou potenciais, mas que não necessariamente estejam sendo utilizadas (SCOTT, 2000). A centralidade é a medida de quão acessível um determinado ator está para os demais atores da rede e depende do padrão de distribuição, ou da maneira como os diversos atores estão interligados. A centralidade, além de medir a acessibilidade de uma pessoa, mede o número de caminhos de comunicação que passam por ela. Quanto maior for o número de ligações entre os indivíduos de uma rede, menor a probabilidade de indivíduos centrais deterem o controle sobre o fluxo de informações. A relação de poder de um ator dentro da rede está relacionada com o grau de monopolização do fluxo de informações que esse detem. A análise das formas de interações entre os atores, as formas de conexões é útil para a compreensão dos comportamentos dos mesmos. A princípio, muitas conexões significam indivíduos expostos a uma diversidade maior de informações (HANNEMAN, 2001). 2.1.3.2 Perspectiva Relacional A perspectiva da análise da dimensão relacional das redes, focaliza o papel dos laços diretos entre os atores, com relação aos conteúdos transacionados nas interações e suas diversidades. Esses critérios possibilitam mapear as diversas transações existentes nas redes, como a amizade, o trabalho, a informação, o respeito, a confiança, a mentoria, dentre outras. Segundo Kuipers (1999) há três abordagens das redes: amizade, informação e confiança. Para ela, o conteúdo transacionado em cada um desses tipos de rede é específico. A autora as define como: Rede de informação: é uma rede informal, em que o conteúdo transacionado diz respeito ao que está acontecendo na organização como um todo, em relação a oportunidades de ascensão, processos decisórios e (ou) sucesso organizacional. Tais informações normalmente afetam todos os membros da organização. 45 Rede de amizade: é uma rede informal, baseada na troca de amizade e socialização, que fornece apoio e melhora a auto-estima, além de encorajar certos comportamentos que aumentam a aceitação junto a grupos dentro da organização. Rede de confiança: é uma rede de laços informais, em que um ator corre riscos ao abrir mão do controle dos resultados, por aceitar a dependência em relação a outro ator, sem força ou coação da relação, seja contratual, estrutural ou legal. Nahapiet e Ghoshal (1998) exemplificam que dois atores podem ocupar posições equivalentes em uma determinada configuração estrutural de rede, mas suas ligações pessoais e emocionais com outros indivíduos podem fazer com que eles tenham comportamentos totalmente diferentes na troca de informações e recursos. Na análise posicional de uma rede de confiança, informação ou amizade, foram identificados atores com grau de importância diferenciado e fundamental para a transição da informação dentro da rede. Esse ator é conhecido como conector central. Sua importância é oriunda de sua capacidade de ligação da maioria dos demais atores uns com os outros. Normalmente, esses atores sabem com quem conseguir informações e recursos necessários para que o trabalho seja realizado, como também, gastam horas ajudando outros atores do grupo. Entretanto, alguns conectores centrais podem atuar conscientemente ou inconscientemente como “gargalos”, prejudicando o desempenho da rede. 2.1.3.3 Perspectiva centrada em Ego O objetivo central dessa abordagem é diagnosticar o papel que os indivíduos desempenham na rede e analisar o impacto do movimento dos nós no fluxo das informações na rede. Para Castro (2005) e Regis (2006), a abordagem egocêntrica olha para cada ator (ego) da rede, para os atores que se relacionam diretamente com ele e medidas de ligação entre o ego, seus vizinhos e entre eles. Essa modalidade de análise tem como objetivo identificar a influência do grupo sobre o indivíduo, e como a forma de inserção e as conexões de um indivíduo na rede podem influenciar em suas oportunidades e restrições na mesma. A análise de redes sociais centrada em egos baseia-se em algumas medidas de centralidades, tais como: 46 Centralidade de grau de entrada: essa é medida através do número de ligações que um ator recebe de outros atores, significando popularidade. Centralidade de grau de saída : essa é medida através do número de ligações que um ator estabelece com outros atores denotando expansividade. Centralidade de intermediação: é o potencial daqueles atores que servem de intermediários. Essa representa o quanto um ator atua como “ponte”, facilitando o fluxo de informação em uma determinada rede. Marteleto (2001) afirma que um indivíduo pode ter poucos contatos diretos na rede, estar conectado basicamente por ligações fracas, mas exercer um importante papel intermediando informações. Centralidade de Bonacich (Power Bonacich) : essa é definida como uma medida qualitativa, pois leva em consideração além do número de ligações que um ator recebe de outros atores, mas também o prestígio desses primeiros, denotando, também, o aspecto de prestígio e poder em relação ao ator analisado. 2.1.3.4 Softwares para Análise de Redes Sociais Atualmente, as redes sociais podem ser formadas por milhares de indivíduos, organizações, instituições, conectados por diferentes vínculos e situações. Para uma aplicação do estudo de redes sociais, de forma ampla, analisando toda a estrutura da rede, é necessário utilizar ferramentas de TI desenvolvidas especificamente para o auxílio do mapeamento, controle e análise desses dados. Essas ferramentas são os softwares ARS. Esses são softwares específicos, que desenham as redes e possuem diferentes métricas utilizadas na análise quantitativa. Na maioria dos softwares os dados são guardados, descritos e manipulados por meio de matrizes. O uso de matrizes para denotar relações em grupos sociais cresceu a partir do ano 1940 e as operações matriciais passaram a ser amplamente usadas para definições e cálculos em análise de redes sociais, sendo a representação primária para a maioria dos softwares de análise de redes sociais (SILVA, 2003). 47 Figura 06 – Exemplo de uma rede mapeada pelo Software Visone. Fonte: Site http//visone.info/ Existem centenas de softwares de ARS, o que torna a escolha da ferramenta mais adequada uma tarefa complexa. Para facilitar essa tarefa, é necessário um estudo minucioso das necessidades da organização aliada às funcionalidades e custo benefício de cada software. Alguns dos softwares disponíveis no mercado são: Software Cfinder Características Software livre utilizado para encontrar e visualizar sobreposição, grupos densos de nós em redes. ( Fonte: http//cfinder.org, 13/06/2010) GraphViz Software open source de visualização gráfica. Possui vários programas de layout gráfico, com interface gráfica para web. Esse utiliza uma linguagem simples de texto, e seus diagramas podem ser gerados em vários formatos úteis como imagens, SVG para páginas web, Postscript para inclusão em PDF ou outros documentos, ou exibição em um browser gráfico interativo. Graphviz também suporta GXL, um dialeto XML.). (Fonte: http//www.graphviz.org, 02/06/2010) Guess Software que utiliza ferramenta de análise exploratória de dados, de visualização de gráficos e redes. O sistema contém uma linguagem de 48 domínio específico chamada Gython embutido. (Fonte: http//graphexploration.cond.org/, 04/06/2010) InFlow Software de análise de redes capaz de executar análise e visualização de rede em um único produto integrado - não há arquivos de passagem ida e volta entre os diferentes programas como outras ferramentas. O que é mapeado em uma janela é medido em outra janela. ( Fonte: http//www.orgnet.com/inflow3.html, 02/06/2010) JUNG (Java Universal Network) Software formado por uma biblioteca de software que fornece uma linguagem comum e extensível para a modelagem, análise e visualização de dados que pode ser representado como um gráfico ou rede. É escrito em Java, o que permite usar JUNG em aplicações baseadas em fazer uso das extensas capacidades embutidas da API Java, bem como os de outras bibliotecas existentes. A arquitetura JUNG é projetada para suportar uma variedade de representações de entidades e suas relações, como gráficos dirigido e sem direção, gráficos multi-modais, gráficos com bordas paralelas e hipergrafos. Ele fornece um mecanismo para anotar gráficos, entidades e relações com os metadados. Isso facilita a criação de ferramentas analíticas para conjuntos de dados complexos que podem analisar as relações entre as entidades, bem como os metadados ligado a cada entidade e relação. A atual distribuição de Jung inclui implementações de uma série de algoritmos em teoria dos grafos, mineração de dados e análise de redes sociais, tais como rotinas de agrupamento, decomposição, otimização, geração de grafos aleatórios, análise estatística e cálculo de distâncias de rede, fluxos e medidas de importância (centralidade, PageRank, hits, etc.). Esse possui uma biblioteca de código aberto. ( Fonte: http//jung.sourceforge.net/, 05/06/2010) MultiNet Software de análise de dados que pode ser usado para dados normais (no qual você tem um arquivo que tem uma linha de dados para cada caso) e para a rede de dados (em que existem dois arquivos - o "nó" descreve o arquivo indivíduos e no link "arquivo", descreve as conexões entre os indivíduos). ( Fonte: http//www.sfu.ca/personal/archives/richards/Multinet, 10/06/2010) NetDraw Software livre, escrito por Steve Borgatti pra visualização de dados de redes sociais. Nele as imagens podem ser gravadas em metalife, JPG, GIF e bitmap. O programa lê arquivos do sistema UCINET, arquivos UCINET DL, arquivos Pajek, e seu formato próprio VNA (que permite a poupança de rede e dados de atributos em conjunto, juntamente com 49 informações como coordenadas espaciais layout, cores, etc.) ( Fonte: http//www.analytictech.com/netdraw/netdraw.htm, 05/06/2010) Netminer Software desenvolvido para análise e visualização de dados de rede. Esse permite explorar os dados da uma rede visual e interativa, e permite detectar padrões subjacentes e estruturas da rede. Há cinco diferentes níveis de licença, estas estão relacionadas ao tamanho dos dados a serem tratados pelo software. Possui módulo que pode ser usado para desenhar mapa da rede em grande escala 2D, separando o processo de visualização em duas etapas: apresentação e desenho. Esse funciona com as plataformas: Windows 2000, XP, Windows Vista 32 bits para o O / S- Windows Server 2000 x64, Windows Server 2003 x64, Windows XP x64, Windows Vista x64 de 64 bits O / S é necessário a configuração mínima de hardware: Memória- 512 MB e HD de 300 MB de espaço disponível para instalação do software. ( Fonte: http//www.netminer.com/NetMiner/home_01.jsp, 13/06/2010) SocNetV (Social Networks Visualizer) Software para a análise e visualização de redes sociais. Esse permite a construção e exploração de redes de vários formatos (GraphViz, GraphML, adjacência, Pajek, UCINET, etc.). Esse software permite ao usuário, calcular as propriedades básicas de rede, tais como densidade, diâmetro e distâncias (comprimentos de caminho mais curto),centralidades, coeficientes de agrupamento, entre outros. SocNetV foi desenvolvido em C + + e é um software open-source. O programa é um software livre, licenciado sob a GNU - General Public License 3 (GPL3). ( Fonte: http//socnetv.sourceforge.net, 02/06/2010) UCINET Software de análise de redes sociais desenvolvidos por Steve Borgatti, Everett e Martin Freeman Lin. O programa é distribuído pela Analytic Technologies. Esse trabalha em conjunto com o programa freeware chamado NETDRAW para desenhar e visualizar diagramas de redes sociais. NETDRAW é instalado automaticamente com UCINET. UCINET é um pacote completo para a análise dos dados da rede social, pode ler e gravar uma infinidade de arquivos de texto formatado de forma diferente, bem como arquivos de Excel. Inclui medidas de centralidade, o subgrupo de identificação, análise de papel, a teoria dos grafos elementares, e permutação baseada em análise estatística. Além disso, o pacote tem forte rotinas de análise da matriz, como a álgebra matricial e estatística multivariada. UCINET pode ser baixado e usado gratuitamente por 60 dias. 50 ( Fonte: http//www.analytictech.com/ucinet, 10/06/2010) VISONE Software que propõe o desenvolvimento de modelos e algoritmos para integrar e promover a análise e visualização de redes sociais. Esse está disponível em Java para Windows e Linux, além de suportar importação e exportação de formatos tradicionais (JPEG, PDF, SVG, Metafile) para dados de rede social. ( Fonte: http//visone.info, 05/06/2010) Software utiliza um editor gráfico que pode ser usado para gerar Yed desenhos e aplicar layouts para uma variedade de esquemas diferentes e redes. Esse software é gratuito e possui uma biblioteca de classes Java que permite a visualização, edição, otimização, desenho e animação de uma vasta gama de diagramas, redes e outras estruturas. Esse trabalha com arquivos de diversos formatos, tais como: PDF, SWF, SVG, JPG, GIF, HTML, BMP além de suportar a incorporação URLs e sugestões descritivas para ambos os nós e arestas. ( Fonte: http//www.yworks.com/em/products_yed_about.html, 02/06/2010) Quadro 05 – Características dos Softwares ARS. A análise de redes pressupõe o mapeamento e mensuração das relações, nessas os pontos nodais são as pessoas e as ligações desvendam as relações existentes. Baseado nas informações dos vários tipos de relacionamentos é possível visualizar as respostas e cruzar vários dados que delineiam as redes, fornecendo uma análise visual e matemática das relações constituídas informalmente nas redes. Os vários softwares que auxiliam esse mapeamento e análise desenham as redes e possuem diferentes métricas utilizadas na análise quantitativa na maioria desses softwares, os dados são guardados, descritos e manipulados por meio de matrizes (MENEGHELLI, 2009). 51 Figura 07 – Exemplo de mapeamento de rede. Fonte: Site http://theyrule.net (18/08/2010) Nesse exemplo de mapeamento de rede, as linhas indicam a interligação de diretores e empresas, podendo ou não apresentar reciprocidade. Nesse exemplo pode-se perceber que cada ator é apresentado de forma diferente, simbolizando o seu grau de influência na rede (os mais gordos são os mais “influentes”). Outros softwares possuem a capacidade de modificar a cor e forma dos nós das redes conforme características específicas de cada grupo. 52 2.2 MINERAÇÃO DE DADOS – DATA MINING 2.2.1 Dado, Informação, Conhecimento O dado é um elemento quantificável, puro, sobre um determinado evento ele representa fatos que podem ser gravados e que possuem um significado implícito. São exemplos de dados: números, texto ou qualquer mídia que possa ser processada pelo computador. Atualmente, as organizações estão acumulando vastas e crescentes quantidades de dados em diferentes formatos e em diferentes tipos de repositórios, para processar esses dados, temos a tecnologia de banco de dados. Elmarsi; Navathe (2006) definem banco de dados como uma coleção de dados relacionados que possuem as seguintes propriedades implícitas: “-Um banco de dados representa alguns aspectos do mundo real, sendo chamado, às vezes, de minimundo ou de universo de discurso. As mudanças no minimundo são refletidas em um banco de dados.” “-Um banco de dados é uma coleção lógica e coerente de dados com algum significado inerente. [...]” “-Um banco de dados é projetado, construído e povoado por dados, atendendo a uma proposta específica. Possui um grupo de usuários definido e algumas aplicações preconcebidas, de acordo com o interesse desse grupo de usuários.” Elmarsi; Navathe (2006, p.4). É importante ressaltar, que o dado, por si só, não oferece embasamento para o entendimento da situação. Queyroi (2007) classifica os dados como: • dados operacionais ou transacionais como custos, vendas, inventários, folhas de pagamento ou contas correntes; • dados não operacionais como previsões de mercado, vendas ao nível industrial, e dados macro-econômicos; • metadados, ou dados descrevendo a estrutura dos dados armazenados, tais como projetos lógicos de Bancos de Dados ou dicionários de dados; • mídia contendo imagens, sons ou uma combinatória de ambos, que além de ser armazenada, pode ser catalogada eletronicamente. 53 Atualmente, as corporações utilizam seus bancos de dados não apenas para armazenar as informações processadas pelos seus diversos sistemas administrativos e operacionais, eles geram uma fonte infindável de informações que geram possibilidades que podem enriquecer e até conduzir decisões mais corretas dos dirigentes. Essa informação gerada, nada mais é, que o dado analisado e em determinado contexto. A criação desse conhecimento, embasado no conjunto dos dados armazenados ao longo do tempo, envolve a interpretação desses dados, ou seja, a informação é constituída por padrões, associações ou relações que todos aqueles dados acumulados podem proporcionar. O estudo das informações contidas nas variáveis envolvidas na análise pode gerar conhecimento que ajude na criação e análise de padrões históricos para conseguir uma previsão dos fatos futuros. Segundo Souza (2008), o conhecimento encontrado nos dados vem fascinando o mundo. As informações e o conhecimento descobertos têm sido aplicados no gerenciamento dos negócios, no controle da produção, nas análises de marketing, nas áreas de engenharia, na exploração científica etc.. A extração de conhecimento em extensas bases de dados é vista como um processo interativo e iterativo, e não como um sistema de análise automática, sendo centrado na interação entre usuários, especialistas do domínio e responsáveis pela aplicação. Dessa maneira, não se pode esperar que a extração de conhecimento seja útil simplesmente submetendo um conjunto de dados a uma “caixa preta” (MANNILA, 1997). O principal objetivo do processo de extração e análise de bases de dados é encontrar conhecimento a partir de um conjunto de dados para ser utilizado em um processo de tomada de decisão. Dessa forma, um requisito importante é que esse conhecimento descoberto seja compreensível aos humanos, além de útil e interessante para os usuários finais e especialistas do processo e que ainda forneça um suporte ao processo decisório (FAYYAD et al, 1996). Queyroi (2007) destaca que, enquanto que a informação é descritiva, o conhecimento é utilizado fundamentalmente para fornecer uma base de previsão com um determinado grau de certeza. O conhecimento refere-se à habilidade de 54 criar um modelo mental que descreva o objeto e indique as ações a implementar e as decisões a tomar. Para que haja compreensão e segurança nas informações de forma que essas realmente auxiliem na tomada de decisões, é fundamental que se mantenha a coerência dos dados que estão armazenados nos diferentes repositórios e das informações nos diferentes níveis. 2.2.2 Data Warehouse Nas últimas décadas, o volume de dados armazenados nos bancos de dados, se transformou em grandes massas de dados, novos processos foram criados para resgate desses dados e concatenação das informações, como o processo de data warehousing. A criação de um Data Warehouse (DW) é considerada como um dos primeiros passos para viabilizar a análise de grandes massas de dados (REZENDE, 2003). Os DW, ou armazéns de dados, são implementações de bancos de dados relacionais que seguem uma filosofia cujo norte é permitir a construção de um ambiente para análise de dados, e diferentes maneiras de vê-los e organizá-los. Segundo um dos pais do conceito, Bill Inmon, reconhecido como o idealizador do processo de data warehousing, o DW é considerado um conjunto de dados baseado em assuntos, integrado, não-volátil e variável em relação ao tempo, de apoio às decisões gerenciais (INMON, 2002). Os data warehousing proporcionam acesso aos dados para análise complexa, descoberta de conhecimento e tomada de decisão. Eles dão suporte às demandas de alto desempenho por dados e informações de uma organização. Harrisson (1998) ampliando a definição de Inmon define que um data warehouse deve também conter dados precisos e completos. Deve ser capaz de apoiar todas as necessidades analíticas do usuário. Tendo como princípio dar condições ao usuário para lidar com os aspectos críticos do gerenciamento do negócio, essas condições são baseadas nos assuntos necessários ao sucesso do negócio, em vez de se prender a aspectos operacionais. 55 Dodge e Gormam (2000) declaram que DW não é um projeto, pois um projeto tem um início, um cronograma que determina o fim do projeto; o projeto tem definido os resultados esperados e as restrições do projeto; um projeto tem orçamento e tem designado os recursos necessários. O mais importante, o projeto tem definido um prazo de finalização. O data warehouse é implementado em uma série de miniprojetos, cada qual deve ter todas as características assim descritas. Outro autor importante sobre o assunto, o americano Ralph Kimball, define o DW como uma fonte de dados que possui a capacidade de consultar as informações da organização. O data warehouse é na realidade uma união de todas as bases de dados constituintes da organização. O DW é alimentado por uma área especial que prepara os dados para serem utilizados. O gerenciamento do DW é responsável tanto pela busca das informações desejadas quanto pela preparação dessas informações (KIMBALL, 2002) Assim, ainda que de maneira simplista, podemos ver o DW como um banco de dados construído a partir de diversas fontes de dados, baseado em uma analogia com um armazém da vida real, idealizado como uma grande escala de coleção e armazenagem, organizando áreas de dados legados. Rezende (2003) acrescenta que é necessário também que eles contenham dados limpos, agregados e consolidados que possam ser analisados por ferramentas OLAP (On-Line Analytical Processing). 56 Figura 08 – Relação entre Base de Dados, Data Warehouse e Mineração de Dados. Fonte: Sistemas Inteligentes Fundamentos e Aplicações (Rezende, 2003) 2.2.3 Mineração de Dados (MD) 2.2.3.1 Conceitos A ênfase principal da mineração de dados é a capacidade de extração do conhecimento contido em um grande volume de dados. A Mineração de Dados (MD), do termo inglês Data Mining, é o processo de vasculhar de maneira metódica, e orientada, um conjunto grande de dados à procura de padrões, seqüências temporais e regras de associação que explicitem de alguma maneira a relação entre dados (ou variáveis). Com isso o resultado tende a ser a geração de uma nova coleção de dados, que represente uma sentença estabelecida pela regra ou padrão (SOUZA, 2008). Ela surgiu do Knowledge Discovery on Databases – KDD, que visa à obtenção de conhecimento a partir de grande massa de dados. Esse é um processo que engloba as áreas de análise de base de dados, aprendizado de máquina, sistemas especialistas e visualização de dados além de 57 estatística e matemática. Podemos dizer que a MD é uma etapa da KDD. Entretanto, também podemos dizer que a linha divisória entre os processos é tênue, tendo em vista o objetivo comum de descoberta do conhecimento. A descoberta do conhecimento em bancos de dados (KDD – Knowledge Discovery in Database) é um processo que engloba fases como: seleção de dados; limpeza; enriquecimento, transformação ou codificação; data mining; construção de relatórios e apresentação da informação descoberta. Somente depois desse préprocessamento que as técnicas de mineração de dados são utilizadas para extrair diferentes regras e padrões. Para que esse processo gere informação significativa que influencie na tomada de decisões, a data mining precisa ser precedida por significativa preparação de dados. A mineração de dados envolve um conjunto de técnicas para recuperação de dados e busca por informações “ocultas” numa grande massa de dados, fazendo uso de técnicas sofisticadas que vão da estatística à inteligência computacional. Figura 09 – Recursos envolvidos na Mineração de Dados. Fonte: Queyroi (2007) 58 A primeira, e talvez a mais importante, etapa do processo de mineração de dados é compreender de que forma as técnicas de mineração de dados poderão auxiliar na busca pelo conhecimento implícito nos dados, visto que essas técnicas são agrupadas em diferentes categorias e que suas utilizações dependem exclusivamente do tipo de conhecimento a ser extraído. Han e Kamber (2001) propõem as seguintes etapas num processo de mineração de dados: 1. Data cleaning: remoção de ruídos e dados inconsistentes; 2. Data integration: onde as múltiplas fontes dos dados podem ser combinadas; 3. Data selection: onde os dados relevantes à tarefa da análise são recuperados da base de dados; 4. Data transformation: onde os dados são transformados ou consolidados nos formulários apropriados para mineração; 5. Data mining: um processo essencial onde os métodos inteligentes são aplicados a fim de se extrair padrões dos dados; 6. Pattern evaluation: para identificar os padrões mais interessantes para a representação do conhecimento, baseado em algumas medidas de interessabilidade; 7. Knowledge apresentation: onde as técnicas de representação e de visualização do conhecimento conhecimento minerado. são usadas para apresentar o 59 Figura 10 – Etapas do processo de mineração. Fonte: Data Mining Concepts and Techniques (Han; Kamber, 2001) 60 Para a implementação de um projeto de mineração de dados é fundamental desenvolver três etapas distintas: 1- a definição do problema, 2- a aquisição e avaliação dos dados, 3- a extração de características e destaques. As tarefas de mineração de dados são divididas em duas categorias principais: tarefas de previsão e tarefas descritivas. “Tarefas de previsão: o objetivo dessas tarefas é prever o valor de um determinado atributo baseado nos valores de outros atributos. [...]”; “Tarefas descritivas: o objetivo é derivar padrões ( correlações, tendências, grupos, trajetórias e anomalias) que resumam os relacionamentos subjacentes nos dados. [...].” (TAN; STEINBACH; KUMAR; 2009). 2.2.3.2 Técnicas de Mineração de Dados Existe uma progressão do dado para a informação e para o conhecimento à medida que evoluímos com o processamento. Para descobrir o conhecimento em imensas bases de dados, a técnica de mineração de dados, utiliza alguns métodos: regras de associação, classificação, agrupamento (clustering) descoberta de padrões. Essas técnicas dividem-se em atividades preditivas e descritivas, conforme figura 11. A Mineração de Dados Preditiva consiste na generalização de exemplos ou experiências passadas com respostas ou regras já conhecidas. Já a Mineração de Dados Descritiva consiste na identificação de comportamentos intrínsecos do conjunto de dados. 61 Figura 11 - Taxonomia de Tarefas de Mineração de Dados. Essas técnicas de mineração de dados devem ser utilizadas de acordo com o tipo de conhecimento a ser obtido. 2.2.3.2.1 Regras de Associação A técnica consiste na descoberta de regras que mostram condições nos valores dos atributos que sugerem padrões de associação dos mesmos. Essas regras buscam satisfazer uma condição encontrada em mais de um atributo. Para a composição das regras de associação são consideradas duas métricas: o suporte (support), e a freqüência com que os dados aparecem no conjunto de dados, e a confiança (confidence), que indica a probabilidade de associação entre os dados selecionados. Essas regras relacionam a presença de determinados “valores” de um conjunto, com outros “valores” de outro conjunto de variáveis. Exemplo: Um aluno com nota abaixo da média na matéria X, provavelmente exibirá também uma característica de conceito abaixo da média na matéria Y. Outro tipo de regra de associação, são as associações multidimensionais, suas dimensões representam atributos de um arquivo e podem ser categóricas ou quantitativas. Os categóricos têm um conjunto finito de valores que não apresentam 62 nenhum valor ordenado, atributos quantitativos são numéricos e seus valores apresentam um relacionamento ordenado, esses podem ser divididos em intervalos não sobrepostos com rótulos específicos (ex.: salário >3000,00, salário < 3000). Figura 12 - Taxonomia de itens em um supermercado. Fonte: Sistemas de Banco de Dados (2005). 2.2.3.2.2 Classificação A técnica consiste no processo de busca de um modelo ou função que identifique e descreva classes diferentes de dados. Essas classes são predeterminadas. Exemplo: Aplicações bancárias podem ser classificadas como risco baixo, risco alto, risco médio. Esse tipo de atividade é também chamada de aprendizado supervisionado. . Na primeira etapa, um modelo é construído descrevendo um conjunto pré- determinado de classes e conceitos. Na segunda etapa, o modelo é usado para classificação dos dados. Primeiramente é estimado o nível de precisão do modelo, para fins de predição (accuracy). Se o modelo for considerado aceitável, pode ser usado para predição, ou seja, para classificar dados futuros nos quais a classe não for conhecida. 63 2.2.3.2.3 Agrupamento (Clustering) As técnicas anteriores tratam com divisão de dados baseadas no uso de amostras pré-classificadas. No agrupamento os dados são divididos sem uma amostra de treinamento, chamado aprendizado não supervisionado. O objetivo do agrupamento é colocar os registros em grupos, de tal forma que os registros de um grupo sejam similares aos demais do mesmo grupo e diferentes daqueles dos demais grupos. Esses grupos são disjuntos. Exemplo: Grupos de clientes que tenham padrões parecidos de compras, pacientes que tem reações parecidas a determinado medicamento, etc.. 2.2.3.2.4 Padronização A técnica de extração de padrões consiste na aplicação dos algoritmos de mineração selecionados com o fim de extrair padrões embutidos nos dados. Carvalho (2009) descreve a capacidade de reconhecimento e classificação de padrões é uma das mais fundamentais características da inteligência humana. De um modo geral, o reconhecimento de padrões pode ser definido como um processo que procura por estruturas nos dados e os classificam de acordo com o grau de relação entre eles. A mineração de dados preditiva consiste na generalização de exemplos ou experiências passadas com respostas conhecidas ou regras estabelecidas. Os dois principais tipos de tarefas para predição são classificação e regressão. • A classificação consiste na predição de um valor categórico como, por exemplo, predizer se vai chover ou não, se o cliente provavelmente vai pagar em dia ou não. • A regressão, estabelece que o atributo a ser predito consiste em um valor não discreto ou contínuo como, por exemplo, predizer o lucro ou a perda em um empréstimo (WEISS e INDURKHYA, 1998). 64 3 METODOLOGIA Esse capítulo descreve os aspectos metodológicos envolvidos nesse projeto de pesquisa, como: classificação, abordagem, delimitação, amostra, etapas e limitações da pesquisa. 3.1 DEFINIÇÃO DE PESQUISA Segundo Gil (1999, p.42): “Pode-se definir pesquisa como o processo formal e sistemático de desenvolvimento do método científico. O objetivo fundamental da pesquisa é descobrir respostas para problemas, mediante o emprego de procedimentos científicos.” Para Yin (1989), o Projeto de Pesquisa pode ser definido como (...) ”a sequência lógica que conecta os dados empíricos às questões iniciais de estudo da pesquisa e, por fim, às suas conclusões". Para Marconi e Lakatos (2001): “A pesquisa pode ser considerada um procedimento formal com método de pensamento reflexivo que requer um tratamento cientifico e se constitui no caminho para se conhecer a realidade ou para descobrir verdades parciais. Significa muito mais do que apenas a verdade: é encontrar respostas para questões propostas, utilizando modelos científicos.” Dessa forma, essa pesquisa visa beneficiar o processo de análise de redes sociais com o auxílio das técnicas de data mining. 3.2 ESTUDO DE CASO Para a elaboração dessa pesquisa, será adota a estratégia denominada estudo de caso, segundo Yin (2005), essa estratégia é comumente utilizada na psicologia, sociologia, ciência política, trabalho social, administração e planejamento social e até mesmo na economia. Essa estratégia engloba vários métodos que, tratados dentro de uma lógica com base em um planejamento estruturado e com técnicas de coletas de dados, provem o entendimento dos fenômenos empíricos, levando o pesquisador a contribuir com o conhecimento. 65 Segundo Mantovani (2004), o estudo de caso se caracteriza pelo estudo profundo e exaustivo de um ou poucos objetos, de maneira a permitir conhecimento amplo e detalhado do mesmo. Na visão de Stoeckicht (2005) o estudo de caso permite a investigação de um fenômeno contemporâneo dentro do seu contexto na vida real, especialmente quando os limites entre o fenômeno e o contexto não se encontram claramente definidos. De acordo com Gil (1999, p.72): “O estudo de caso é caracterizado pelo estudo profundo e exaustivo de um ou de poucos objetos, de maneira a permitir o seu conhecimento amplo e detalhado, tarefa praticamente impossível mediante os outros tipos de delineamentos considerados.” Dentro do contexto dessa pesquisa, a melhor opção parece ser o estudo de caso. Com ele, pretende-se entender as principais características dos conectores centrais das redes sociais informais. A pesquisa será executada através de questionários estruturados, investigando os indivíduos das redes para verificar e analisar as principais características comportamentais dos mesmos. Através da utilização do estudo de caso como estratégia de pesquisa, podese efetuar uma ampla coleta de dados e uma investigação objetiva das análises dos mesmos. 3.3 CLASSIFICAÇÃO DA PESQUISA A qualidade do estudo está relacionada com a atenção do autor a alguns aspectos e classificações das pesquisas. Segundo SÁ (2008), as pesquisas podem ser classificadas quanto aos fins e aos meios: “Quanto aos fins, à pesquisa pode ser: exploratória, descritiva, explicativa, metodológica, aplicada e intervencionista.” “Quanto aos meios de investigação, pode ser: pesquisa de campo, pesquisa de laboratório, documental, bibliográfica, experimental, expost facto, participante, pesquisa-ação e estudo de caso.” 66 Segundo Silva (2007) a pesquisa aplicada tem como objetivo gerar conhecimentos para a aplicação prática. Gil (1999) descreve que a forma de abordagem da pesquisa é considerada descritiva à medida que expõe as características de determinada população ou fenômeno específico, suas expectativas e percepções estabelecendo correlações entre variáveis. Uma pesquisa é considerada explicativa quando a mesma visa identificar os fatores que contribuem ou determinam para a ocorrência do fenômeno e aprofunda o conhecimento da realidade explicando o “porque” das coisas. Seguindo os critérios de classificação de Silva (2007), Gil (1999) e Vergara (1998), esse trabalho se caracteriza quanto aos fins: como uma pesquisa aplicada, descritiva-explicativa. Quanto aos meios de investigação: será utilizada uma pesquisa bibliográfica e um estudo de caso. Essa pesquisa bibliográfica envolve livros, dissertações, artigos, revistas especializadas e sites na internet. 3.4 ABORDAGEM DA PESQUISA Acerca da abordagem do problema da pesquisa, podemos classificá-la como quantitativa ou qualitativa. “Quantitativa – essa abordagem parte de hipóteses dedutivas sobre teorias utilizadas e as converte em variáveis possíveis de serem mensuradas. [...] Os dados são coletados de forma que hipóteses sejam testadas por inferência estatística;” “Qualitativa – enfatiza a captação de perspectivas e interpretações dos indivíduos estudados, focando no entendimento de determinado fenômeno, produto da interpretação e dos significados a ele atribuídos pelo pesquisador, e não na freqüência com que ocorre tal fenômeno.” Guedes (2008). De acordo com Neves (1996), a pesquisa quantitativa tem sido largamente presente na pesquisa social para explicar e descrever os fenômenos. Esse método trata as questões estatísticas mediante as hipóteses estabelecidas. Porém, hoje está cada vez mais promissora a pesquisa qualitativa, que surgiu na Antropologia e na Sociologia, e que, nos últimos 30 anos vem ganhando espaço nas áreas da Psicologia, Administração e Educação. 67 Segundo Minayo (1993) a pesquisa qualitativa responde a questões muito particulares. Ela se preocupa, nas ciências sociais, com um nível de realidade que não pode ser quantificado, ou seja, ela trabalha com o universo de significados, motivos, aspirações, crenças, valores e atitudes, o que corresponde a um espaço mais profundo das relações dos processos e dos fenômenos que não podem ser reduzidos à operacionalização de variáveis. Para Demo (2000), as metodologias qualitativas são geralmente consideradas como pesquisa participante, pesquisa ação, levantamento feitos através de questionários abertos ou diretamente gravados, história oral, análises de grupo. Nessa pesquisa, adotou-se o método de pesquisa qualitativo, por se tratar de um estudo de caso, onde o entrevistador irá interagir com os entrevistados, para a aplicação dos questionários na busca da compreensão das características de cada indivíduo da rede. Figura 13 - Tipologia da pesquisa. Há várias abordagens de estudo das redes sociais: tecnológica (foco na tecnologia da informação), metafórica (explicação de conceitos e origens); e analítica. 68 Nesse estudo será utilizada a abordagem analítica, centrada na metodologia de análise de redes, com maior detalhamento na dimensão posicional, visto que analisaremos as características dos atores posicionados de forma central na rede. 3.5 POPULAÇÃO ALVO As três redes estudadas são formadas por discentes de instituições e cursos diferentes, a fim de buscar uma amostra de redes diversificada. A primeira rede é composta por alunos do oitavo período do curso de graduação em Serviço Social de uma faculdade particular, UNIPAC. A segunda rede é composta por alunos do sétimo período do curso de graduação em Engenharia de Controle e Automação de uma faculdade pública, CEFET. E a terceira é composta por alunos do oitavo período do curso de graduação em Biomedicina de uma faculdade particular, UNIPAC. Ambas as faculdades localizadas na cidade de Leopoldina, Minas Gerais. Gráfico 01 – Tempo de formação das redes estudadas 69 Gráfico 02 – Tamanho das redes estudadas. 3.6 ETAPAS DA PESQUISA Esse estudo será desenvolvido em quatro etapas: Figura 14 – Etapas da pesquisa. 70 3.6.1 Pesquisa bibliográfica A pesquisa bibliográfica envolveu livros, dissertações, artigos, periódicos, internet. de Dados Fonte deFontes Dados Bibliográficos 23% Testes e Dissertações Seminários e Congressos Científicos 44% 5% Sites Periódicos Especializados 14% Livros Técnicos 14% Gráfico 03 – Fontes de Dados Bibliográficos. 3.6.2 Coleta de dados Nessa etapa o fator crucial é a elaboração de um questionário bem estruturado, que consiga investigar os questionamentos que a pesquisadora busca responder com essa pesquisa. Esse terá questões abertas e fechadas, contendo perguntas relativas aos tipos de relacionamento que serão mapeados e informações sobre os principais atributos individuais dos entrevistados conectados nas respectivas redes sociais. Minayo (1993) diz que, tendo por base a forma como se estrutura uma entrevista, pode-se classificá-la em diversos tipos, tais como: sondagem de opinião, entrevista aberta, entrevista não-diretiva centrada ou entrevista focalizada e entrevista semi-estruturada. Nesse estudo, será utilizada a entrevista semiestruturada, que combina perguntas fechadas e abertas, pois é a que melhor atende aos objetivos propostos. Segundo Guimarães e Melo (2005), uma vez coletada as informações através da metodologia de redes sociais, é possível ter uma visão abrangente de como 71 ocorre à transferência de conhecimento dentro da organização, ainda segundo os mesmos: [...] a técnica também pode ser utilizada para identificar as dificuldades de comunicação entre as pessoas de um mesmo processo chave ou grupo. Para a aplicação do questionário, é de suma importância uma boa apresentação do projeto de pesquisa aos entrevistados a fim de gerar credibilidade e garantia de que esses estarão participando de um projeto sério e confiável. Segundo Silva (2003) um ponto relevante é a questão da confiança a ser conquistada pelo entrevistador para a obtenção de respostas honestas às questões. 3.6.3 Tratamento e análise dos dados Essa etapa terá duas fases distintas: • mapeamento das redes e análise posicional dos indivíduos a elas conectados; • criação de uma base de dados com os atributos dos atores de destaque das redes e aplicação de data mining para identificação de padrões. Na primeira fase, será utilizado o software UCINET 6.0, para tabulação, análise das redes, e identificação dos atores principais e os papéis que esses desempenham nas redes analisadas. Na segunda fase, será utilizado o software WEKA para tabulação dos atributos dos indivíduos identificados na fase anterior como conectores centrais das redes na busca de reconhecimento de padrões comportamentais. 3.7 LIMITAÇÃO DA PESQUISA Essa pesquisa limita-se ao processo de conhecimento das características que envolvem os atores de destaque com base nas perspectivas estruturais e relacionais de redes informais do meio acadêmico de cursos de graduação em instituições públicas e privadas da cidade de Leopoldina-MG. Há de se considerar que há uma tendência dos entrevistados omitirem ou distorcerem algumas informações em virtude de considerá-las pessoais, estratégicas ou mesmo sigilosas. 72 Outro critério a ser considerado como dificultador, é o próprio método escolhido pela pesquisadora. Por se tratar de um estudo de caso de apenas três redes de alunos não se pode generalizar as evidencias encontradas nessas redes para toda e qualquer turma de graduação. 73 4 ESTUDO DE CASO 4.1 ETAPAS DO ESTUDO Nesse estudo de caso, serão apresentadas as análises e diagnósticos das dimensões posicionais e relacionais, ou seja, das formas de construção, de redes sociais de discentes de graduação de distintas turmas e instituições de ensino públicas e privadas da cidade de Leopoldina-MG. Foram analisados os tipos e padrões básicos das relações envolvidas nessas redes caracterizadas por padrões de conteúdos específicos nelas transacionados. Na pesquisa serão consideradas na análise final as redes de trabalho, confiança e amizade. Não farão parte desse estudo análises estatísticas e matemáticas da dimensão estrutural das redes sociais apresentadas. Para tal, foram entrevistados todos os alunos de três turmas (redes) de graduação através de um questionário qualitativo aplicado nos integrantes das redes. Para o mapeamento das três redes em questão, foram inseridas no contexto das entrevistas as seguintes perguntas: Trabalho - “De modo geral, quais as pessoas da turma a quem você recorre quando está com dúvidas em relação a alguma matéria do curso?” “Se você precisar tirar nota máxima em um trabalho final, quais pessoas da turma você gostaria que fossem da sua equipe?” Confiança - “Se você fosse o líder de uma empresa, no ramo de seu curso, quais alunos da turma você convidaria para trabalhar em sua equipe?” “A quais pessoas da turma você delegaria um projeto na confiança de que esse seja executado com qualidade e dentro do prazo?” Amizade - “Com quais pessoas da turma você convive fora da sala de aula? “ Através das respostas obtidas nos questionários, foi elaborado o mapeamento e análise das redes com a utilização do software UCINET 6.0. Essa análise relacional das redes informais de trabalho, confiança e amizade diagnosticadas entre os grupos de alunos, teve por objetivo identificar os atores que atuam como conectores centrais (entrada e Bonacich) e corretores de informação, nas mesmas. 74 Na etapa seguinte, foi criada uma base de dados com os atributos que contêm informações comportamentais de cada um dos indivíduos diagnosticados na etapa anterior como conectores centrais. Com a utilização do software de data mining WEKA, os atributos dos conectores centrais foram analisados através de algoritmos de atividades descritivas e preditivas na busca de uma análise mais aprimorada do perfil desses indivíduos que exercem posição central e de grande importância na fluência da informação na rede social de sua atuação. 4.2 ANÁLISE DAS REDES SOCIAIS ATRAVÉS DE SOFTWARE ARS Nesse estudo, foram analisadas três redes sociais informais, de pequenas dimensões, formadas por turmas de graduação de distintos cursos e instituições de ensino. Para o desenvolvimento desse estudo, foi utilizado o software de Análise de Redes Sociais UCINET. Esse é um software freeware, distribuído pela Analytic Technologies. Esse inclui medidas de centralidade, identificação de subgrupos, teoria de grafos e análises estatísticas. O software trabalha em conjunto com o NETDRAW, utilizado para desenhar e visualizar diagramas de redes sociais. Esse estudo foi centrado nos atores principais (altos índices de Bonacich, de centralidade de entrada, e de intermediação) de cada uma das redes, objetivando analisar a importância desses indivíduos em suas respectivas redes. Segundo Castro (2005), as formas como os indivíduos estão conectados afetam seu comportamento. Indivíduos mais conectados influenciam mais e são mais influenciados, além de possuir maior mobilidade e maiores perspectivas de resolução de problemas. Durante a análise foram considerados como primeiro indicador o tamanho da rede e sua densidade, a fim de conhecer o padrão de conectividade geral da rede. Posteriormente foram calculados os índices de centralidade das redes, onde foram considerados como fatores importantes para essa análise os atores com altos índices de entrada (InDegree). Através desse índice, pôde-se diagnosticar a popularidade dos atores com relação aos demais participantes da rede. Após essa análise foram calculadas a centralidade de intermediação dos nós, que revela a possibilidade que um ator tem para intermediar as comunicações entre pares de nós 75 e a centralidade de Bonacich que é um indicador do poder de influência dos atores sobre os demais nós da rede. Nessa análise não foi feita a simetrização das redes, pois para o desenvolvimento desse estudo não era necessário tomar conhecimento da reciprocidade nas relações dos alunos considerados centrais por seus parceiros de rede. Podendo então desconsiderar a existência, ou não, dessa reciprocidade dessas relações de trabalho, confiança ou amizade. É importante ressaltar, que a medida que os primeiros números e gráficos foram sendo analisados, foi possível perceber o grande potencial das ferramentas de análise de redes sociais, mais especificamente do software UCINET. A cada nova matriz de adjacência analisada, novas visões foram sendo construídas. Visões essas que passavam despercebidas aos olhos da pesquisadora antes da aplicação da técnica de análise de redes sociais, mesmo após longos anos de convivência com os referidos alunos. Gradativamente novas visões foram sendo construídas, repleta de detalhes, e descobertas sobre os prováveis aspectos influenciadores no desempenho, nas atitudes e na formação das redes dos alunos analisados esclarecendo muitos dos questionamentos sobre o desempenho e a postura dos atores das redes. 76 4.2.1 Turma 1 A população dessa rede é composta por 28 atores, alunos do oitavo período do curso de Serviço Social da UNIPAC campus Leopoldina. Esses atores foram analisados a partir de uma matriz idêntica onde foram encontrados os seguintes indicadores: Rede de Trabalho Rede de Confiança Tamanho da rede = 28 Densidade = 11,77 % Densidade =13,76 % Nº de Ligações = 89 Nº de Ligações= 104 Rede de Amizade Densidade = 23,94 % Nº de Ligações = 181 Grau de Centralidade da Rede Entrada = 33,88 % Saída = 14,67 % Entrada = 39,50 % Saída = 12,62 % Entrada = 28,94 % Saída = 78,87 % Tabela 01 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 1 4.2.1.1 Análise da Rede de Trabalho A rede informal de trabalho possui 28 atores. Essa rede possui 756 relações potenciais, das quais apenas 89 são relações efetivas, alcançando uma densidade de 0,1177. Com esse valor analisado de forma absoluta, pode-se inferir que essa é uma rede de baixa densidade, pois apenas 11,77 % do potencial da rede está sendo utilizado. 77 Quadro 06 – Densidade da Rede de Trabalho – Turma 1. Segundo Martinho, quanto mais conexões existirem na rede mais produtiva ela será em seu conjunto e quanto maior o inter-relacionamento maior a união entre os atores. O baixo nível de conexões apresentado nessa rede, indica uma rede pouco coesa, portanto fraca. 78 Quadro 07 – Centralidades de Entrada e Saída dos atores da Rede de Trabalho – Turma 1 Esta tela de saída do UCINET apresenta os valores dos índices de centralidade de entrada, InDegree e os valores dos índices de centralidade de saída, OutDegree de cada um dos alunos dessa rede. Através da análise dos índices de centralidade de entrada da rede percebe-se a importância de 3 atores, que desempenham o papel de conectores centrais, com índices de centralidade de entrada acima da média geral de centralidade de entrada da rede de 33,88%. São eles: Aline, Maria Célia e Beatriz. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. 79 Fluxo informal de ligações entre indivíduos de uma mesma turma para o desempenho de trabalhos avaliativos. Figura 15 – Análise Estrutural da Rede de Trabalho – Turma 1. Ao analisar a figura 15, podemos perceber que essa é uma rede com conectores centrais bem definidos, com alguns atores nas periferias da rede. O quadro 08 apresenta tela gerada pelo UCINET com a representação dos indivíduos que exercem função de corretores de informação, Betweennewss. Nesta rede, esta função é desempenhada coincidentemente por 3 atores: Aline, Maria Célia e Cíntia. Percebe-se nessa análise que o ator Beatriz que apresentava alto índice de centralidade de entrada não atua na rede como intermediador ou corretor de informação. 80 Quadro 08 – Centralidade de Intermediação dos atores da Rede de Trabalho – Turma 1 Através da classificação de Bonacich, foi constatado que com exceção do ator Aline, os atores considerados os melhores alunos da Turma 1, Cíntia e Maria Célia, não são os que detêm o poder na rede. Nessa análise assumiram posição de destaque os atores Camilla, Maria Aparecida e Patrícia, que apresentam participação insignificante no que diz respeito à centralidade de entrada. Quadro 09 – Centralidade de Bonacich dos atores da Rede de Trabalho – Turma 1 81 Através das análises descritas anteriormente, é possível inferir que nessa rede não é característica dos melhores alunos, com exceção de Aline, serem os alunos de maior poder dentro da rede. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Maria Célia Aline Beatriz Intermediação (Corretor de Informação) Aline Maria Célia Cíntia Bonacich (Poder) Aline Maria Aparecida Patricia Camilla Tabela 02 – Atores em destaque da Rede de Trabalho – Turma 1 82 4.2.1.2 Análise da Rede de Confiança A rede informal de confiança possui 28 atores. Essa rede possui 756 relações potenciais, das quais 104 são relações efetivas, alcançando uma densidade de 0,1376. Com esse valor analisado de forma absoluta, pode-se inferir que essa é uma rede de baixa densidade, pois apenas 13,76 % do potencial da rede está sendo utilizado. Entretanto comparando com a rede de trabalho analisada anteriormente, essa é uma rede com maior número de ligações e mais coesa. Quadro 10 – Densidade da Rede de Confiança – Turma 1. 83 Quadro 11 – Centralidades de Entrada e Saída dos atores da Rede de Confiança – Turma 1 Ao efetuar a análise das centralidades da rede, pode-se observar que 2 atores desempenham o papel de conector central com índices de centralidade de entrada, NrmInDeg acima da média geral de centralidade de entrada da rede de 39,50%. São eles: Maria Célia e Beatriz que aparecem com forte influência, com base na quantidade de citações por outros atores. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. 84 Figura 16 – Análise Estrutural da Rede de Confiança – Turma 1. Fluxo informal de ligações assimétricas de confiança entre indivíduos de uma mesma turma . Já os papéis de corretores de informação - Betweenness, representados no quadro 12, são desempenhados por 2 atores: Aline e Maria Célia, percebe-se nessa análise que da mesma forma que ocorreu na rede de trabalho, o ator Beatriz que apresentava alto índice de centralidade de entrada não atua na rede como corretor de informação.. Quadro 12 – Centralidade de Intermediação dos atores da Rede de Confiança – Turma 1 85 Outro nó de destaque é Aline que não apareceu como ponto central nessa rede de confiança, apresenta um papel importante com alto nível de intermediação entre os demais nós da rede. Através da classificação de Bonacich, representada no quadro13, verifica-se que nenhum dos atores considerados os melhores alunos da Turma 1 e portanto nós centrais da rede, são os que detêm o poder na rede. Nessa análise assumiram posição de destaque os atores: Aline, Josiane e Leandro, que apresentam participação insignificante no que diz respeito a centralidade de entrada e que exceto Aline, não tiveram nenhum destaque na rede de trabalho analisada no item 4.3.1.1. Quadro 13 – Centralidade de Bonacich dos atores da Rede de Confiança – Turma 1 Segundo Degenne e Forsé (1994, p.162) um ator central ligado a outros atores centrais pode ser considerado com detentor de um poder importante. Em uma situação de negociação, esse ator ocupa uma posição dominante, que é bem traduzida pelo índice de centralidade de Bonacich. 86 Através dessas análises é possível inferir que nessa rede os atores que atuam como corretores de informação e que detêm o poder sobre os respectivos nós da rede não são os nós centrais, ou os melhores alunos da Turma 1. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Maria Célia Beatriz Intermediação (Corretor de Informação) Aline Maria Célia Bonacich (Poder) Aline Josiane Leandro Tabela 03 – Atores em destaque da Rede de Confiança – Turma 1 87 4.2.1.3 Análise da Rede de Amizade A rede informal de amizade possui 28 atores. Essa rede possui 756 relações potenciais, das quais 181 são relações efetivas, alcançando uma densidade de 0,2394. Com esse valor analisado de forma absoluta, pode-se afirmar que essa é uma rede de baixa densidade, pois apenas 23,94 % do potencial da rede está sendo utilizado. Entretanto comparando com as rede de trabalho e de confiança, que apresentaram respectivamente densidades de 11,77% e 13,76%, pode-se considerar a rede de amizade a rede de mais alta densidade e com maior número de conexões da Turma 1. Quadro 14 – Densidade da Rede de Amizade – Turma 1. 88 Quadro 15 – Centralidades de Entrada e Saída dos atores da Rede de Amizade – Turma 1 Pode-se evidenciar, através da análise das centralidades da rede, mais especificamente do índice de centralidade de entrada, Indegree apresentado no quadro 15, que 4 atores desempenham o papel de conector central com índices de centralidade de entrada acima da média geral de centralidade de entrada da rede de 28,94%.São eles: Beatriz, Tatiana, Maria Célia e Lucélia. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. Numa análise mais detalhada, pode-se diagnosticar que na rede de amizade, vários nós apresentam índices de centralidade de entrada acima da média, apesar de não apresentarem valores tão elevados quanto os citados acima. O que demonstra várias relações espontâneas de amizade entre os indivíduos da rede. 89 Fluxo informal de ligações entre indivíduos de uma mesma turma que mantêm uma relação espontânea de amizade Figura 17 – Análise Estrutural da Rede de Amizade – Turma 1. Com base na figura 17, podemos identificar uma rede com grande número de conexões, o que facilita o tráfego de informações na rede. Nessa rede percebemos também que todos os atores, sem exceção estão conectados à rede. Quadro 16 – Centralidade de Intermediação dos atores da Rede de Amizade – Turma 1 90 O quadro 16, gerado pelo software UCINET demonstra que nessa rede, os papéis de intermediadores ou corretores de informação são desempenhados por 3 atores: Aline, Leandro e Camilla. Ao fazer um comparativo com os índices de centralidade percebe-se que nenhum desses atores que desempenham papel de grande importância nas ligações entre os demais atores da rede têm índices de centralidade de entrada, Indegree elevado. Através da classificação de Bonacich, apresentada no quadro 17, destacamse dois nós com valores muito elevados de poder sobre a rede em relação aos demais. Esses são os nós: Camilla e Leandro que também apresentaram altos índices de intermediação, nBetweenness, o que leva a uma conclusão de que sua facilidade de intermediar as comunicações entre vários nós da rede pode estar ligada com seu alto poder dentro da mesma. Quadro 17 – Centralidade de Bonacich dos atores da Rede de Amizade – Turma 1 91 Para Castells (2003) e Castro (2005), o poder é propriedade fundamental das redes sociais, e é conseqüência dos padrões de relacionamentos e de posicionamento na rede. Através dessas análises pode-se inferir que nessa rede, como na rede de confiança, alguns dos atores que atuam como corretores de informação são os que detêm o poder sobre os respectivos nós da rede, apesar desses não apresentarem papel de destaque como nós centrais. O que traz à tona a idéia de que os melhores alunos da Turma 1 não podem ser caracterizados como os mais importantes da rede de amizade. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Beatriz Tatiana Maria Célia Lucélia Intermediação (Corretor de Informação) Aline Leandro Camilla Bonacich (Poder) Camilla Leandro Tabela 04 – Atores em destaque da Rede de Amizade – Turma 1 92 4.2.2 Turma 2 A população dessa rede é composta por 17 atores, alunos do sétimo período do curso de Engenharia de Controle e Automação do CEFET campus Leopoldina. Esses atores foram analisados a partir de uma matriz idêntica onde foram encontrados os seguintes indicadores: Rede de Trabalho Rede de Confiança Tamanho da rede = 17 Densidade = 20,96 % Densidade =31,99 % Nº de Ligações = 57 Nº de Ligações= 87 Rede de Amizade Densidade = 40,44 % Nº de Ligações = 110 Grau de Centralidade da Rede Entrada = 31,64 % Saída = 78,12 % Entrada = 25,78 % Saída = 72,26 % Entrada = 16,79 % Saída = 63,28 % Tabela 05 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 2 4.2.2.1 Análise da Rede de Trabalho A rede informal de trabalho possui 17 atores. Essa rede possui 272 relações potenciais, das quais apenas 57 são relações efetivas, alcançando uma densidade de 0,2096. Com esse valor analisado de forma absoluta, é possível inferir que essa é uma rede de baixa densidade, pois apenas 20,96 % do potencial da rede está sendo utilizado. Quadro 18 – Densidade da Rede de Trabalho – Turma 2. 93 Quadro 19 – Centralidades de Entrada e Saída dos atores da Rede de Trabalho – Turma 2 Ao se analisar as centralidades de entrada NrmInDeg, da rede, apresentadas no quadro 19 gerado pelo UCINET. Pode-se observar que 5 atores desempenham o papel de conector central com índices de centralidade de entrada acima da média geral de centralidade de entrada da rede de 31,64%. São eles: Fabio, Amanda, Fabio Taroco, Karina e Rafael. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. Cabe ressaltar que o nó Fabio possui índices de centralidade muito acima dos demais. 94 Rede informal de alunos de uma mesma turma que se relacionam para o desempenho de trabalhos cotidianos do curso. Figura 18 – Análise Estrutural da Rede de Trabalho – Turma 2. A figura 18, desenvolvida no software NETDRAW, com base na matriz assimétrica da rede de trabalho da Turma 2, apresenta uma rede pouca coesa, com alguns atores em posições periféricas e um ator completamente desconectado da rede. Nessa rede os papéis de corretores de informação são desempenhados por apenas 2 atores: Amanda e Fabio Taroco, quadro 20. Percebe-se nessa análise que os atores Fabio, Karina e Rafael que apresentavam alto índice de centralidade de entrada não atuam na rede como intermediadores, nBetweenness. Quadro 20 – Centralidade de Intermediação dos atores da Rede de Trabalho – Turma 2 95 Através da classificação de Bonacich, gerada pelo UCINET e apresentada no quadro 21, foi diagnosticado que o grande poder na rede está apenas com um nó Karina. Que apesar de não atuar como corretor de informação, pela análise de centralidade de entrada, está entre os nós considerados melhores alunos da Turma 2. Quadro 21 – Centralidade de Bonacich dos atores da Rede de Trabalho – Turma 2 96 Através dessas análises pode-se afirmar que nessa rede apesar da existência de muitos alunos com altos índices de centralidade de entrada, há também outros com baixa conectividade e curiosamente, essa rede apresenta também o poder centralizado em apenas um nó. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Fabio Amanda Fabio Taroco Karina Rafael Intermediação (Corretor de Informação) Amanda Fabio Taroco Bonacich (Poder) Karina Tabela 06 – Atores em destaque da Rede de Trabalho – Turma 2 97 4.2.2.2 Análise da Rede de Confiança A rede informal de confiança possui 17 atores. Essa rede possui 272 relações potenciais, das quais 71 são relações efetivas, alcançando uma densidade de 0,2610. Com esse valor analisado de forma absoluta, pode-se afirmar que essa é uma rede de baixa densidade, pois apenas 26,10 % do potencial da rede está sendo utilizado. Entretanto comparando com a rede de trabalho analisada anteriormente, essa é uma rede com número um pouco maior de ligações e um pouco mais coesa. Quadro 22 – Densidade da Rede de Confiança – Turma 2. 98 Quadro 23 – Centralidades de Entrada e Saída dos atores da Rede de Confiança – Turma 2 Ao desenvolver a análise das centralidades da rede, pode-se observar que 6 atores apresentam índices de centralidade de entrada, NrmInDeg, acima da média geral de centralidade de entrada da rede de 39,50%. São eles: Fabio, Amanda, Laura, Tamyres, Diogo, Julio César. É uma quantidade relativamente grande já que trata-se de uma rede pequena de apenas 17 atores. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. 99 Indivíduos conectam-se espontaneamente por perceberem grau de responsabilidade e valores em comum. Figura 19 – Análise Estrutural da Rede de Confiança – Turma 2. Nessa rede, os papéis de corretores de informação, nBetweenness, são desempenhados por 2 atores: Fabio e Amanda. Analisando o quadro 24, percebe-se que os atores em destaque como corretores de informação também atuam como alunos centrais da Turma 2, considerados dentre o grupo dos melhores alunos. Quadro 24 – Centralidade de Intermediação dos atores da Rede de Confiança – Turma 2 100 Através da classificação de Bonacich, quadro 25, é possível diagnosticar que o grande poder na rede está apenas com um nó Fabio. Que nessa rede apresentou os mais altos índices de centralidade de entrada, de intermediação e de Bonacich, demonstrando que esse ator exerce papel fundamental para a troca e disseminação de informação na rede de confiança dos alunos da Turma 2. Quadro 25 – Centralidade de Bonacich dos atores da Rede de Confiança – Turma 2 Segundo Kuipers (1999), as relações de amizade e suporte social desenvolvem-se rapidamente durante curto período de tempo, enquanto que o desenvolvimento de laços de confiança requer mais tempo e dura mais tempo. 101 Através dessas análises pode-se inferir que nessa rede há como na rede de trabalho a centralização do poder em um único nó. Entretanto nessa rede a importância do nó Fabio ficou ainda mais explícita, pois ele também é considerado o melhor aluno e o aluno com maior poder de intermediar os demais nós da rede. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Fabio Amanda Laura Tamyres Diogo Julio Cesar Intermediação (Corretor de Informação) Fabio Amanda Bonacich (Poder) Fabio Tabela 07 – Atores em destaque da Rede de Confiança – Turma 2 102 4.2.2.3 Análise da Rede de Amizade A rede informal de amizade possui 17 atores. Essa rede possui 272 relações potenciais, das quais 75 são relações efetivas, alcançando uma densidade de 0,2757. Com esse valor analisado de forma absoluta, pode-se afirmar que essa é uma rede de baixa densidade, pois apenas 27,57 % do potencial da rede está sendo utilizado. Entretanto comparando com as rede de trabalho e de confiança, que apresentaram respectivamente densidades de 20,96% e 26,10%, pode-se considerar que as três redes têm uma coerência no que diz respeito a densidade e número de ligações. Quadro 26 – Densidade da Rede de Amizade – Turma 2. 103 Quadro 27 – Centralidades de Entrada e Saída dos atores da Rede de Amizade – Turma 2 Ao se analisar as centralidades da rede geradas pelo UCINET, é possível observar uma rede com diversos atores com índices de centralidade de entrada, NrmInDeg, acima da média geral de centralidade de entrada da rede de 10,547. Pode-se considerar que nessa rede de amizades não há nós centrais, pois praticamente todos os nós apresentam altos índices de centralidade de entrada. Cabe ressaltar que a lição trazida pela densidade é de quanto maior for o número de conexões da rede, mais compacta, integrada e coesa será essa rede. 104 Rede informal de amizade coesa, sem atores de destaque. Figura 20– Análise Estrutural da Rede de Amizade – Turma 2 Quadro 28 – Centralidade de Intermediação dos atores da Rede de Amizade – Turma 2 105 Nessa rede, os papéis de corretores de informação ou intermediadores apresentados no quadro 28, são desempenhados por 2 atores: Karina e Fabio, que também apresentam papéis importantes nas redes de trabalho e confiança. Quadro 29 – Centralidade de Bonacich dos atores da Rede de Amizade – Turma 2 Através dessas análises pode-se inferir que nessa rede há uma forte ligação entre praticamente todos os nós, não havendo indivíduos em destaque, praticamente todos se relacionam com os outros nós da rede. Apesar disso, apenas dois indivíduos têm maior poder de intermediação e três atores apresentam maior poder sobre a rede como um todo. 106 Atores em destaque na Rede Centralidade de Entrada (Popularidade) Karina Fabio Gustavo Mateus Alexandre Diogo Julio César Intermediação (Corretor de Informação) Karina Fabio Bonacich (Poder) Amanda Karina Laura Tabela 08 – Atores em destaque da Rede de Amizade – Turma 2 107 4.2.3 Turma 3 A população dessa rede é composta por 28 atores, alunos do oitavo período do curso de Biomedicina da UNIPAC campus Leopoldina. Esse atores foram analisados a partir de uma matriz idêntica onde foram encontrados os seguintes indicadores: Rede de Trabalho Rede de Confiança Rede de Amizade Tamanho da rede = 28 Densidade = 7,41 % Densidade = 8,20 % Nº de Ligações = 56 Nº de Ligações= 62 Densidade = 6,22 % Nº de Ligações = 47 Grau de Centralidade da Rede Entrada = 15,36 % Saída = 15,36 % Entrada = 14,54 % Saída = 18,38 % Entrada = 16,59 % Saída = 16,59 % Tabela 09 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 3. 4.2.3.1 Análise da Rede de Trabalho A rede informal de trabalho possui 28 atores. Essa rede possui 756 relações potenciais, das quais apenas 56 são relações efetivas, alcançando uma densidade muito baixa de 0,0741. Com esse valor analisado de forma absoluta, pode-se inferir que essa é uma rede de baixa densidade, pois apenas 7,41 % do potencial da rede está sendo utilizado. Quadro 30 – Densidade da Rede de Trabalho – Turma 3. 108 Quadro 31 – Centralidades de Entrada e Saída dos atores da Rede de Trabalho – Turma 3 Ao se analisar as centralidades da rede, pode-se observar que diferentemente de todas as outras redes analisadas anteriormente, o software UCINET apresentou apenas 1 ator com índice NrminDeg elevado, desempenhando o papel de conector central, ou seja, na rede de trabalho dessa Turma 3 pode-se considerar que o nó Alexei é o aluno com maior popularidade da Turma 3. Com índices de centralidade de entrada acima da média geral de centralidade de entrada da rede de 15,36%. 109 Rede informal de trabalho, com presença de cliques e com indivíduos isolados da rede. Figura 21 – Análise Estrutural da Rede de Trabalho – Turma 3 Com base na figura 21, pode-se identificar alguns elementos ainda não encontrados nas outras turmas, como a separação clara de alguns elementos da rede formando pequenos subgrupos, cliques3, e a presença de atores completamente desconectados do restante da rede, o que denota que alguns atores não têm nenhum envolvimento com a rede. Esses atores periféricos podem estar temporariamente deslocados, ou possuírem pouco tempo de rede, que ocorreria no caso de transferência ou repetência. Já os papéis de corretores de informação apresentados no quadro 32, são desempenhados por apenas 2 atores: Monique e Liliane. Essa análise está claramente representada na figura 21, onde Monique e Liliane fazem a ligação entre dois grupos de alunos. Para Marteleto (2001), o papel do mediador traz em si a marca do poder de controlar as informações que circulam na rede e o trajeto que elas podem percorrer. 3 Definição herdada da teoria de grafos, onde alguns atores escolhem a todos do grupo como pares em suas ligações. 110 Quadro 32 – Centralidade de Intermediação dos atores da Rede de Trabalho – Turma 3 Através da classificação de Bonacich gerada pelo UCINET, foram diagnosticados índices elevados para os nós Thiago e Monique, ambos, detêm poder na rede, apesar de não serem considerados os melhores alunos da Turma 3 pela análise de centralidade de entrada. 111 Quadro 33 – Centralidade de Bonacich dos atores da Rede de Trabalho – Turma 3 Com base nessas análises, pode-se inferir que nessa rede há formação de alguns cliques, isolados dos demais participantes da rede, e outros, porém onde alguns nós mantêm alguma relação através dos corretores de informação, que devido à tipologia dessa rede, passam a ter uma importância muito grande para o fluxo de informação. Outra característica interessante nessa rede, foi a presença forte de um único nó desempenhando o papel de conector central. 112 Atores em destaque na Rede Centralidade de Entrada (Popularidade) Alexei Intermediação (Corretor de Informação) Monique Liliane Bonacich (Poder) Thiago Monique Tabela 10 – Atores em destaque da Rede de Trabalho – Turma 3 113 4.2.3.2 Análise da Rede de Confiança A rede informal de confiança possui 28 atores. Essa rede possui 756 relações potenciais, das quais 62 são relações efetivas, alcançando uma densidade de 0,0820. Com esse valor analisado de forma absoluta, é possível afirmar que essa é uma rede de baixa densidade, pois apenas 8,20 % do potencial da rede está sendo utilizado. Entretanto comparando com a rede de trabalho analisada anteriormente, essa é uma rede com número um pouco maior de ligações e um pouco mais coesa. Quadro 34 – Densidade da Rede de Confiança – Turma 3. 114 Quadro 35 – Centralidades de Entrada e Saída dos atores da Rede de Confiança – Turma 3 Ao se analisar as centralidades da rede, quadro 35, observa-se que 5 atores desempenham o papel de conector central com índices de centralidade de entrada, NrmInDeg, acima da média geral de centralidade de entrada da rede de 14,54%. São eles: Ariana, Annee, Alexei, Rodrigo, Liliane. É uma quantidade relativamente grande já que essa é uma rede pequena de apenas 28 atores. Esses índices caracterizam o papel de destaque desses nós quanto à popularidade em relação aos outros integrantes da rede. Segundo Crosse Prusak (2002), esses conectores ligam colegas aumentando a produtividade e em alguns casos podem criar gargalos e sobrecarregar a rede. 115 Rede de confiança com vários atores com altos índices de centralidade de entrada. Figura 22 – Análise Estrutural da Rede de Confiança – Turma 3. É importante ressaltar que na rede de confiança da Turma 3 também estão presentes alguns cliques interligados por atores importantes e a presença de atores completamente desconectados do restante da rede. Nessa rede, os papéis de intermediadores, apresentados no quadro 36, são desempenhados por 2 atores: Liliane e Monique, percebe-se nessa análise que os atores que atuam como alunos centrais da Turma 3 não tem representatividade de destaque na intermediação, com exceção de Liliane. 116 Quadro 36 – Centralidade de Intermediação dos atores da Rede de Confiança – Turma 3 Através da classificação de Bonacich, quadro 37, foi diagnosticado que o grande poder na rede está principalmente com Monique, mas outros nós como Thiago, Talita e Isabella tem poder de influência sobre a rede de confiança da Turma 3. Quadro 37 – Centralidade de Bonacich dos atores da Rede de Confiança – Turma 3 117 Com base nessas análises, pode-se inferir que nessa rede apesar de muitos alunos apresentarem altos índices de centralidade de entrada, dois nós tem um papel fundamental de intermediação, pois por ser uma rede subdividida a função do corretor de informação toma um proporção maior do que nas outras redes analisadas. Atores em destaque na Rede Centralidade de Entrada (Popularidade) Ariana Annee Alexei Rodrigo Liliane Intermediação (Corretor de Informação) Liliane Monique Bonacich (Poder) Monique Thiago Talita Izabella Tabela11 – Atores em destaque da Rede de Confiança – Turma 3 118 4.2.3.3 Análise da Rede de Amizade A rede informal de amizade possui 28 atores. Essa rede possui 756 relações potenciais, das quais apenas 47 são relações efetivas, alcançando uma densidade de 0,0622. Com esse valor analisado de forma absoluta, pode-se inferir que essa é uma rede de densidade muito baixa, pois apenas 6,22 % do potencial da rede está sendo utilizado. Entretanto comparando com as redes de trabalho e de confiança, percebe-se que essa turma não apresenta fortes ligações em nenhuma das três redes analisadas, Cabe ainda ressaltar, a percepção de que a turma não se relaciona bem como um todo e outro aspecto a ser destacado é o descolamento total de dois atores que pode ser um indício de falta de sincronismo com a turma, ou até mesmo com o próprio curso em questão. Quadro 38 – Densidade da Rede de Amizade – Turma 3. 119 Quadro 39 – Centralidades de Entrada e Saída dos atores da Rede de Amizade – Turma 3 Ao se analisar as centralidades da rede, geradas pelo UCINET, pode-se observar através do quadro 39, que diferentemente da maioria das outras redes analisadas anteriormente, há apenas 1 ator desempenhando o papel de conector central, ou seja, na rede de amizade dessa turma pode-se considerar que o nó Rodrigo é o “melhor amigo” da Turma 3. Com índices de centralidade de entrada acima da média geral de centralidade de entrada da rede de 16,59%. Para Wasserman e Faust (1999), o volume de conexões que um indivíduo possui na rede lhe impõe limites e/ou oportunidades; delibera sua autonomia em relação aos outros e, conseqüentemente, amplia o seu poder. 120 Rede de amizade formada por pequenos grupos isolados dos demais. Figura 23– Análise Estrutural da Rede de Amizade – Turma 3 Fica evidente, com base na figura 23, que essa não é uma turma unida, uma turma amiga. Os grupos se isolam, alguns atores não têm amizade com nenhum indivíduo da turma, é preciso levar em consideração que esses alunos já convivem por 8 períodos, o que caracteriza ainda mais um grande problema de relacionamento interpessoal. O que torna o papel do único corretor de informação Rodrigo, importantíssimo. 121 Quadro 40 Centralidade de Intermediação dos atores da Rede de Amizade – Turma 3 Nessa rede, onde o corretor de informação é tão importante, é curioso encontrar apenas um indivíduo atuando nesse papel. Segundo Cross e Prusak (2002), os corretores de informação ligam subgrupos na rede, evitando que o fluxo das informações seja interrompido através da fragmentação da rede. 122 Quadro 41 – Centralidade de Bonacich dos atores da Rede de Amizade – Turma 3 Através dessas análises pode-se inferir que nessa rede a densidade e a interconectividade entre os nós são baixíssimas. Poucos atores destacam-se na centralidade de entrada das redes de trabalho e de amizade. Muitos atores estão completamente isolados na rede, eles preferem trabalhar sozinhos, e o que é ainda pior, mantêm relação de amizades com pouquíssimos colegas de turma ou até mesmo com ninguém. Cabe ainda ressaltar, que nessa tipologia de rede de grupos isolados dentro de uma mesma rede o intermediador exerce uma função importantíssima. Com base nesse dado, é importante reforçar ainda mais a posição de destaque referida ao nó Rodrigo, que sob minha perspectiva é o principal ator dessa rede. 123 Atores em destaque na Rede Centralidade de Entrada (Popularidade) Rodrigo Intermediação (Corretor de Informação) Rodrigo Bonacich (Poder) Natalia Thiago Monique Rodrigo Tabela 12 – Atores em destaque da Rede de Amizade – Turma 3 124 4.2.4 SÍNTESE DA ANÁLISE DAS TRÊS REDES Rede de Trabalho Rede de Confiança Tamanho da rede = 28 Densidade = 11,77 % Densidade =13,76 % Nº de Ligações = 89 Nº de Ligações= 104 Rede de Amizade Densidade = 23,94 % Nº de Ligações = 181 Grau de Centralidade da Rede Entrada = 33,88 % Saída = 14,67 % Entrada = 39,50 % Saída = 12,62 % Entrada = 28,94 % Saída = 78,87 % Tabela 13 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 1 Rede de Trabalho Rede de Confiança Tamanho da rede = 17 Densidade = 20,96 % Densidade =31,99 % Nº de Ligações = 57 Nº de Ligações= 87 Rede de Amizade Densidade = 40,44 % Nº de Ligações = 110 Grau de Centralidade da Rede Entrada = 31,64 % Saída = 78,12 % Entrada = 25,78 % Saída = 72,26 % Entrada = 16,79 % Saída = 63,28 % Tabela 14 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 2 Rede de Trabalho Rede de Confiança Rede de Amizade Tamanho da rede = 28 Densidade = 7,41 % Densidade = 8,20 % Nº de Ligações = 56 Nº de Ligações= 62 Densidade = 6,22 % Nº de Ligações = 47 Grau de Centralidade da Rede Entrada = 15,36 % Saída = 15,36 % Entrada = 14,54 % Saída = 18,38 % Entrada = 16,59 % Saída = 16,59 % Tabela 15 – Análise das Redes de Trabalho, Confiança e Amizade – Turma 3. 125 4.3 ANÁLISE DAS REDES SOCIAIS ATRAVÉS DE DATA MINING Com base no vasto leque de opções possíveis para análises dos resultados obtidos através da aplicação do software UCINET das referidas redes estudadas, surgiu o questionamento da influência de alguns atributos na padronização de um perfil característico dos indivíduos em destaque no universo pesquisado. Segundo Marteleto (2004), a análise de redes não pode ser desvinculada do contexto, assim foi desenvolvida uma análise dos perfis dos conectores centrais dessas redes, a fim de encontrar alguma similaridade de perfil que os caracterizem. Para tal foi utilizada uma ferramenta de data mining capaz de associar, classificar, agrupar e padronizar atributos de uma base de dados. FAYYAD ( 1996) estabeleceu a primeira definição de Mineração de Dados aceita por diversos pesquisadores como sendo: “Extração do Conhecimento de Base de Dados é o processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis embutidos nos dados”. Para fazer o link entre a análise das redes e a identificação dos conectores centrais com esse outro pilar da pesquisa, foi inserido no questionário perguntas que permitiram retratar dados comportamentais dos indivíduos conectados às redes. Esses dados foram transformados em atributos e analisados através do software de data mining WEKA (Waikato Environment for Knowledge Analysis). O WEKA é um software de domínio público, criado na Universidade de Waikato – Nova Zelândia, implementado na linguagem JAVA formado por um conjunto de algoritmos de diversas técnicas de Mineração de Dados. Para carregar a base de dados no WEKA, foi necessário converter os dados para o formato de Arquivo de Atributo-Relação (ARRF), onde é possível definir o tipo de dados que estão sendo carregados e carregar os próprios dados. O arquivo ARRF usado nesse trabalho é exibido abaixo no quadro 42. 126 Quadro 42 – Arquivo de entrada no WEKA. Esse arquivo, apresentado no quadro 42 foi o objeto de análise utilizado nessa etapa do estudo de caso. Ele contém atributos relacionados às características pessoais que refletem o perfil de cada um dos quinze alunos considerados conectores centrais nas três redes analisadas. Ao carregar esse arquivo no WEKA foi possível fazer algumas análises no pré-processamento dos dados trabalhados. Tais como: quantidade de instâncias, quantidade de atributos, além de uma descrição de todos os atributos com algumas estatísticas, médias, máximos, mínimos, apresentadas de forma numérica e de forma gráfica. 127 Figura 24– Pré-processamento dos dados. Através do gráfico de projeção de todos os atributos apresentado na figura 25, pode-se ter uma visão ampla dos mesmos. Entretanto para inferir e concluir algo sobre esses dados, é necessário analisar cada atributo separadamente. Figura 25 – Gráfico de projeção dos atributos do conjunto de dados analisados, classificados por Satisfação. 128 Nessa etapa então, deu início ao processo de conhecimento das características estatísticas de cada um dos atributos trabalhados. O que trouxe a tona visões interessantes sobre o posicionamento dos conectores centrais estudados com relação às suas características comportamentais descritas no questionário aplicado às turmas. Figura 26 – Atributos do Arquivo Conectores, que será estudado. 129 4.3.1 Interpretação dos resultados referentes à cada atributo Ao selecionar o atributo Idade, é apresentado o seguinte resultado, figura 27. Figura 27– Estatísticas do atributo Idade. Através dessa tela podemos inferir que as idades dos conectores centrais apresentam uma média de 30,33 anos e um desvio padrão de 12,76 anos, sendo que o aluno mais novo tem 21 anos e o mais velho 64 anos. O que pode ser observado em valores numéricos ou em forma gráfica. 130 Analisando os conectores centrais pelo atributo Sexo, o software gerou o resultado apresentado na figura 28. Figura 28– Estatísticas do atributo Sexo. Através da análise dessas informações, percebe-se que dentre os 15 alunos que atuam como conectores centrais nas redes analisadas, 10 são mulheres e 5 são homens. Cabe ressaltar que a afirmação de que a maioria dos conectores centrais são do sexo feminino torna-se perigosa nessa análise, pois essa diferença pode estar sofrendo grande influência da turma de Serviço Social que apresenta apenas um aluno do sexo masculino. 131 Ao selecionar o atributo Timidez, o software gerou o resultado apresentado na figura 29. Figura 29– Estatísticas do atributo Timidez. Os alunos foram questionados sobre sua timidez e dentre os 15 alunos, 6 não se consideram tímidos e 9 se consideram tímidos apesar de sua clara posição de destaque na turma, que vai contra à característica de ser uma pessoa tímida. 132 Analisando os conectores centrais pelo atributo Liderança, o software gerou o resultado apresentado na figura 30. Figura 30– Estatísticas do atributo Liderança. Ao inserir a pergunta “Você se considera um líder?” no questionário aplicado nas redes, pareceu ser uma pergunta retórica, visto que o universo de análise nesse ponto do estudo é formado apenas por indivíduos que se destacaram exatamente por sua posição de centralidade. Essa posição pode ser confundida sob uma perspectiva superficial com Liderança. Entretanto, após essa análise foi possível constatar que 46,66% desses conectores não se consideram líderes. 133 Analisando os conectores centrais pelo atributo Trabalho Equipe, o software gerou o resultado apresentado na figura 31. Figura 31 – Estatísticas do atributo Trabalho Equipe. Essa pergunta foi apresentada no questionário com três opções, nas quais o aluno poderia dizer se prefere desenvolver os trabalhos do curso sozinho, em dupla ou em grupo. Através dessa tela constata-se que 2 alunos preferem desenvolver seus trabalhos de aula sozinhos, 7 preferem desenvolve-los em dupla e 5 preferem desenvolve-los em grupo. Essas informações trouxeram a tona um questionamento sobre o perfil e o desempenho desses indivíduos que preferem desenvolver seus trabalhos sozinhos. Esse questionamento será respondido posteriormente através de uma análise cruzada dos dados. 134 Analisando os conectores centrais pelo atributo Notas, o software gerou o resultado apresentado na figura 32. Figura 32– Estatísticas do atributo Nota. Para essa questão foram disponibilizadas três opções de resposta: notas acima da média da turma, mediana, abaixo da média. Nos resultados apresentados, 8 alunos têm notas altas, acima da média da turma e outros 7 alunos têm notas dentro da média da turma. Cabe ressaltar que nenhum dos alunos analisados apresentou notas abaixo da média da turma. Através dessa análise podemos inferir que para essas três redes analisadas nenhum indivíduo que se destaca como conector central apresenta notas baixas. 135 Analisando os conectores centrais pelo atributo Frequência, o software gerou o resultado apresentado na figura 33. Figura 33 – Estatísticas do atributo Frequência. Através da análise dos resultados apresentados para esse atributo percebe-se que a freqüência em sala de aula pode representar um fator importante para a centralidade de um aluno, visto que 13 alunos apresentam freqüência alta, enquanto 2 desses apresentam freqüência média e nenhum conector central apresentou freqüência baixa. O que nos permite afirmar que nas três redes analisadas nesse estudo de caso, 86,66% dos alunos de destaque nas redes são muito assíduos nas aulas. 136 Analisando os conectores centrais pelo atributo Pontualidade, o software gerou o resultado apresentado na figura 34. Figura 34 – Estatísticas do atributo Pontualidade. Essa questão Pontualidade refere-se ao desenvolvimento dos trabalhos solicitados no curso dentro dos prazos determinados. As opções de resposta eram: antes do prazo, no prazo, após o prazo. Nessa análise de pontualidade, que pode ser considerada como a responsabilidade do aluno quanto aos prazos estabelecidos pelos professores para a entrega dos trabalhos, percebe-se que 6 alunos terminam as tarefas antes do prazo estabelecido, os demais desenvolvem dentro do prazo estabelecido e nenhum deles entrega as tarefas após o prazo estabelecido pelo professor. Por intermédio dessa análise podemos inferir que 100% dos indivíduos posicionados nas redes de forma central são responsáveis e atentos aos prazos estabelecidos para o desenvolvimento de tarefas. 137 Analisando os conectores centrais pelo atributo Satisfação, o software gerou o resultado apresentado na figura 35. Figura 35 – Estatísticas do atributo Satisfação. Os resultados apresentados para o grau de satisfação dos alunos, demonstra que 4 alunos estão muito satisfeitos, 10 alunos estão satisfeitos e 1 único aluno está insatisfeito com seu curso. 138 Analisando os conectores centrais pelo atributo Livros, o software gerou o resultado apresentado na figura 36. Figura 36 – Estatísticas do atributo Livros. Essa figura demonstra que dos 15 conectores centrais dessas redes 8 leem de 0 a 3 livros em um ano. Essa informação trouxe a tona um questionamento: existe alguma relação entre o tipo de escola, pública ou privada, em que o aluno cursou o ensino médio e o seu hábito de leitura? Esse questionamento será respondido posteriormente através de uma análise cruzada dos dados. 139 Analisando os conectores centrais pelo atributo Tipo Escola, o software gerou o resultado apresentado na figura 37. Figura 37 – Estatísticas do atributo Tipo Escola. Através desses resultados percebe-se que 60% dos conectores centrais estudavam em escolas públicas antes de cursar a graduação. 140 Para responder os questionamentos que surgiram na análise dos atributos Trabalho em Equipe e Livros foi utilizada uma outra forma de análise que permite a visualização de um esboço 2D dos atributos analisados e as correlações gráficas de cada um dos atributos em relação a si próprio e a todos os outros atributos, conforme figura 38. Figura 38 – Atributos correlacionados. Ao cruzar as informações dos atributos nota e trabalho em equipe, foi apresentado o seguinte gráfico 04. 141 Gráfico 04 - Relação dos atributos Nota e Trabalho em Equipe. Através do gráfico 04 pode-se inferir que 100% dos alunos que disseram preferir fazer trabalhos sozinhos tem notas acima da média da turma. Ao cruzar as informações dos atributos quantidade de livros lida com tipo de escola onde concluiu o ensino médio, foi apresentado o seguinte gráfico 05. Gráfico 05 - Relação dos atributos Tipo de Escola e Livros. 142 Através do gráfico 05, pode-se inferir que dos conectores centrais analisados nas três redes analisadas, nenhum dos formados em escola particular lê menos de 3,5 livros por ano. E que 50% dos alunos restantes, de escolas públicas e privadas lêem aproximadamente 7 livros ao ano e os outros 50% lêem aproximadamente 3 livros ao ano. 143 4.3.2 Interpretação dos resultados através do processo de Clusterização O processo de Clusterização também conhecido por Agrupamento, é usado na descoberta de grupos (clusters), padrões, dentro dos dados. Membros de um mesmo cluster são similares, são mais próximos deles mesmos do que de outros clusters. O armazenamento em cluster tem suas vantagens quando o conjunto de dados for definido e um padrão geral necessitar ser determinado a partir dos dados. Através da clusterização, é possível criar um número específico de grupos, dependendo de suas necessidades de análise. Ela pode ser usada como uma etapa de pré-processamento dos dados para identificar grupos homogêneos ou para construir modelos preditivos. Uma dificuldade do processo de clustering é que esse requisita ao usuário a definição prévia de qual será o número de agrupamentos a ser considerado (valor de K), e a partir da definição desse número, separam-se os registros de dados por critérios de similaridade entre si, de forma a maximizar a similaridade intracluster e minimizar a similaridade intercluster. Uma facilidade é que esse processo é capaz de rapidamente analisar todo seu conjunto de dados e transformá-lo em grupos, a partir dos quais é possível tirar algumas conclusões rapidamente. A matemática por trás desse método é relativamente complexa e confusa. Para desenvolver esse processo de agrupamento dos dados o software WEKA utiliza o algoritmo K-Means introduzido inicialmente pó McQueen em 1967. 144 Figura 39– Aplicação do algoritmo K-means. O algoritmo K-means é um método não hierárquico que tem por objetivo particionar um conjunto de dados em K grupos, onde K será definido pelo usuário. É considerado um método simples e de baixo custo computacional, isto permite que seja executado de forma eficiente em grandes volumes de dados. Entretanto, esse método não traz nenhuma garantia quanto ao melhor resultado a ser obtido, já que a quantidade de centros (K) a serem trabalhados pelo modelo deve ser definida pelo usuário. Sua execução é realizada através de um processo iterativo que trabalha baseado na minimização do erro de uma função de critério. Nesse método, um determinado dado só poderá pertencer a um único cluster de cada vez. A idéia principal é feita a partir da minimização da soma dos quadrados das distâncias entre os dados e os centróides de cada subgrupo, o que normalmente é feito a partir da distância Euclidiana. 145 Inicialmente, o algoritmo seleciona de forma randômica a posição de cada centro de agrupamento, para logo depois particionar os dados e agrupá-los com base nos seus atributos e características a partir de um critério que é dividido em duas etapas: Primeiro, associa-se cada dado a um único grupo de acordo com a mensuração de uma função de distância entre os dados e os centros dos clusters; em seguida, atualizam-se os centróides de cada grupo baseado nas atribuições da primeira etapa. O algoritmo repete esses dois procedimentos de forma iterativa, até que seja interrompido quando um critério de erro específico for acionado, ou após um determinado número de iterações ser alcançado, ou até que os centróides de cada cluster e os dados utilizados na análise não necessitem de mais atualizações (Carvalho, 2009). Para a aplicação do modelo de clusterização na base de dados que está sendo analisada nesse estudo de caso, foi necessário ignorar o atributo Nome, para que esse não atrapalhasse o processo. A princípio foi utilizado dois agrupamentos, entretanto o resultado obtido apresentou uma margem de erro muito elevada, o que levou a utilização de três cluesteres na busca de grupos que emergem nessa pequena massa de dados. Figura 40– Aplicação do algoritmo K-means com valor de K = 3. 146 Quadro 43 – Arquivo de saída – utilizando 3 clusters Para interpretar essa saída de dados que teve margem de erro de 30,9%, foi importante saber que os números apresentados para cada atributo, são valores médios de todos as instâncias armazenadas no cluster. Cada cluster apresenta um tipo de comportamento dos conectores centrais, do qual é possível fazer algumas afirmações: Cluster 0 – esse grupo representa 20% do grupo. O perfil desses alunos é caracterizado por mulheres, com idade média de 28 anos, que tem o melhor hábito de leitura dentre todos os demais grupos. Essas mulheres não se consideram tímidas e tem consciência de sua posição de líder dentro da equipe. Elas estão muito satisfeitas com o curso, entregam seus trabalhos acadêmicos no prazo 147 estipulado e preferem desenvolve-los em grupo, entretanto suas notas são medianas. Cluster 1 – esse grupo representa 47% do grupo. O perfil desses alunos é caracterizado por mulheres, com idade média de 26 anos, que tem o pior hábito de leitura dentre todos os demais grupos. Essas mulheres se consideram tímidas e formam o único grupo de alunos que não se consideram líderes. Elas fazem parte do único grupo que não está muito satisfeito com o curso. Para a execução dos trabalhos acadêmicos, esses são os únicos conectores que tem preferência por faze-lo em dupla, entregando esses trabalhos no prazo estipulado e com notas altas. Cluster 2 – esse grupo representa 33% do grupo. O perfil desses alunos é caracterizado por homens, com a maior faixa etária média encontrada, 37,8 anos. Esses tem hábito de leitura médio. São os únicos que apesar de se considerarem tímidos, tem consciência de sua posição de liderança dentro da equipe. Esses estão muito satisfeitas com o curso, são os únicos que preferem desenvolver seus trabalhos acadêmicos sozinhos e os entregam antes do prazo e tem notas altas. Sob essa perspectiva, esse poderia ser considerado o grupo dos alunos que obtem o melhor resultado na turma. 148 Figura 41– Gráfico de 3 clusters, com eixo X Trabalho Equipe e eixo Y Notas. Ao analisar o gráfico desses 3 clusters, cruzando os atributos nota e trabalho em equipe, podemos confirmar a análise feita da saída de dados numérica, que apresentou que os alunos do cluster verde, que preferem desenvolver seus trabalhos acadêmicos sozinhos, obtiveram notas altas. Foram feitas outras clusterizações com k=2 e K=4, conforme quadros 44 e 45, entretanto o resultado que melhor satisfez as análises realizadas, foi com K=3, ou seja com três clusters foram encontradas as melhores conclusões baseando-se nas tendências vistas nesse grupo. 149 Quadro 44 – Arquivo de saída – utilizando 2 clusters 150 Quadro 45 – Arquivo de saída – utilizando 4 clusters 4.3.3 Análise dos resultados Interpretando os resultados obtidos na análise das três redes envolvidas nessa pesquisa, pode-se inferir que essas são redes pequenas, duas formadas por 28 atores e uma por 17 atores, apresentam padrão de conectividade geral baixo. A rede de Amizade da Turma 3, por exemplo, apresentou 47 ligações efetivas, quando o número de relações potenciais era de 756. Enfim, todas as três redes apresentaram densidades baixas, utilizando muito pouco do potencial das mesmas. Através da análise das centralidades das redes de trabalho, amizade e confiança das redes sociais envolvidas nessa pesquisa, foi possível perceber que os conectores centrais, considerados nessa pesquisa como os alunos mais influentes e em determinadas situações os melhores alunos da turma, nem sempre são os detentores do poder na rede. Muitas vezes, os atores com alto índice de intermediação possuem mais poder do que os conectores centrais. Através da análise dos resultados do mapeamento dessas redes, pode-se perceber também que algumas delas apresentam atores completamente isolados, 151 desconectados da rede, em se tratando de turmas de jovens “colegas” de faculdade, isso pode representar algum problema grave que deveria ser melhor analisado pela equipe de orientadores e psicólogos da instituição. Na rede de amizade da Turma 1 foi possível perceber, através dos indicadores quantitativos e da configuração da rede, que não há atores periféricos. Praticamente todos os nós se relacionam, o que facilita o tráfego de informações na rede. Esse equilíbrio na intensidade dos papéis, através da multiplicidade de ligações, traz o benefício de permitir aos atores diferentes perspectivas, enriquecendo o conhecimento e prevenindo a sustentação de versões únicas. Essa é a representação de uma rede coesa, forte. Algumas características importantes foram encontradas nas redes da Turma 2. Nela foram detectados vários atores com altos índices de centralidade de entrada, alguns nós periféricos, e apenas um indivíduo com poder dentro da rede (alto índice de Bonacich). Segundo Lago Junior (2005), cada ator manipula e modifica os conteúdos transacionais de acordo com seus mapas cognitivos e interesses pessoais. A dependência a um único ator ou em poucos atores enfraquece as redes informais, tornando-as vulneráveis a interferência desses. Na análise das redes da Turma 3, percebe-se claramente a existência de cliques (panelas) conectados a outros cliques ou completamente desconectados da rede. Em alguns casos, há uma ligação entre cliques ou entre um clique e alguns nós. Nesse tipo de rede, fica clara a importância do corretor de informação para criar a ligação entre os cliques diversos. Esses corretores são fundamentais para manter o fluxo da informação dentro da rede. Essa pode ser considerada uma rede fraca. Ao longo da aplicação do UCINET foi possível perceber o potencial desse software, mas principalmente a força da técnica de análise de redes sociais. Nesse ponto nossos atores principais estavam devidamente identificados, restava agora buscar compreender melhor as características desses personagens. Foi criada então uma pequena base de dados, com apenas quinze instâncias, contendo os atributos relacionados ao perfil desses indivíduos. Através da mineração de dados, foi possível identificar algumas características dos personagens. Pode-se afirmar, por exemplo, que dentre os atores principais identificados nessas três redes analisadas, a idade média é de 30 152 anos, todos apresentam notas na média ou acima da média, 86,66% desses são muito freqüentes nas aulas, a maioria está satisfeita com o curso, a maioria prefere fazer trabalhos em dupla ou em grupo, nem todos se consideram líderes e alguns se consideram tímidos. Através do cruzamento de algumas informações pode-se afirmar, que todos os alunos que preferem fazer seus trabalhos acadêmicos sozinhos apresentam notas acima da média da turma. Nessa etapa da pesquisa foi possível compreender a potencialidade do software WEKA e das ferramentas de mineração de dados. Através das análises individuais, do cruzamento de dados, das análises gráficas e outras, as possibilidades de transformação de dados em conhecimento sobre os atores da rede são inúmeras. Entretanto, faltava identificar um conjunto de características que identificassem o perfil desses indivíduos. Então, o estudo segmentou a base de dados a tal ponto que foi possível diagnosticar as características que formam os distintos tipos de alunos. Para tal, foi utilizado o processo de clusterização. Após algumas análises foi definido que esse modelo deveria ser trabalhado, aplicando três centróides à base de dados em questão. Como resultado, obtivemos três clusters distintos, descritos anteriormente. Desses, o maior índice de representatividade foi encontrado no cluster 1, que segue abaixo: Cluster 0 – esse grupo representa 20% do grupo. O perfil desses alunos é caracterizado por mulheres, com idade média de 28 anos, que tem o melhor hábito de leitura dentre todos os demais grupos. Essas mulheres não se consideram tímidas e tem consciência de sua posição de líder dentro da equipe. Elas estão muito satisfeitas com o curso, entregam seus trabalhos acadêmicos no prazo estipulado e preferem desenvolve-los em grupo, entretanto suas notas são medianas. Cluster 1 – esse grupo representa 47% do grupo. O perfil desses alunos é caracterizado por mulheres, com idade média de 26 anos, que tem o pior hábito de leitura dentre todos os demais grupos. Essas mulheres se consideram tímidas e formam o único grupo de alunos que não se consideram líderes. Elas fazem parte do único grupo que não está muito satisfeito com o curso. Para a execução dos trabalhos acadêmicos, esses são os únicos 153 conectores que tem preferência por fazê-lo em dupla, entregando esses trabalhos no prazo estipulado e com notas altas. Cluster 2 – esse grupo representa 33% do grupo. O perfil desses alunos é caracterizado por homens, com a maior faixa etária média encontrada, 37,8 anos. Esses têm hábito de leitura médio. São os únicos que apesar de se considerarem tímidos, têm consciência de sua posição de liderança dentro da equipe. Esses estão muito satisfeitas com o curso, são os únicos que preferem desenvolver seus trabalhos acadêmicos sozinhos e os entregam antes do prazo e tem notas altas. Sob essa perspectiva, esse poderia ser considerado o grupo dos alunos que obtem o melhor resultado na turma. Esses então são os três grupos de características padrão de perfil diagnosticado nos conectores centrais das redes sociais informais analisadas nesse estudo. É importante ressaltar que algumas falhas foram encontradas na estratégia de realização da entrevista: 1 – Seria melhor se cada questão tivesse as opções dos nomes dos alunos da turma para agilizar o preenchimento do questionário. 2 – As perguntas que solicitavam os nomes das pessoas com as quais o entrevistado se relaciona, deveriam ter a quantidade de nomes que deveria ser descrito, visando captar relações mais significativas. A falta dessa especificação gerou respostas como vários, todos do meu grupo, a turma inteira, etc..O que inviabilizou a participação desses no estudo. 3 – O período de aplicação da pesquisa coincidiu com semana de provas, os alunos não tinham muita disponibilidade de tempo para responder o questionário. Cabe ainda ressaltar que a pesquisa foi aplicada em oito turmas. Entretanto apenas três redes foram mapeadas. Isso devido ao índice de reprovação nas turmas de engenharia, tornando-as dispersas. A solução seria analisar os alunos da engenharia de todos os períodos em conjunto. Essa redução de dados analisados 154 foi um agravante para a aplicação de data mining, pois contávamos com dados de apenas quinze indivíduos para análise. O interessante seria se tivéssemos pelo menos cem indivíduos para podermos fazer inferências mais precisas. Esses itens devem ser observados na aplicação de trabalhos futuros, que podem ser inúmeros, visto que, dentro desses dois contextos: análise de redes sociais e mineração de dados, há um leque de aplicações muito vasto. 155 5 CONCLUSÕES E TRABALHOS FUTUROS Ao término desse trabalho, que tinha por objetivo mapear e identificar os atores principais de três redes de alunos de graduação e reconhecer nos conectores centrais características padrão, podemos considerar que o estudo obteve êxito na sua execução. Pois ao longo de seu desenvolvimento, foi possível extrair um conhecimento sobre os papéis exercidos por esses alunos em suas redes e sobre seus perfis comportamentais que até então eram ocultos. Esse conhecimento sobre esses alunos de graduação possibilitou um maior entendimento de seu comportamento e desempenho acadêmico. Kuipers (1999) destaca que as ligações informais podem facilitar a transferência de recursos e informações entre os atores ou participantes para realização de objetivos. O recurso pode ser: uma recomendação que flui entre colegas de trabalho; confiança trocada entre colegas localizados em posições vulneráveis e do apoio social trocado entre eles. Através da análise das três redes estudadas foi possível identificar a eficácia da metodologia de análise de redes sociais e como essa pode ser implementada como potente instrumento de compreensão do funcionamento das conexões, do fluxo das informações, dos caminhos utilizados para troca de informação nas relações existentes nas redes sociais informais. Com o mapeamento das redes, foi possível ter uma visão das turmas em vários níveis e camadas. Visão da rede como um todo, de um único grupo ou de um único individuo da rede. Esse mapeamento trouxe a tona elementos que influem ativamente nesse processo de conhecimento, mas que muitas vezes passavam despercebidos aos nossos olhos. Conforme o elemento aglutinador selecionado, trabalho, confiança ou amizade, e consequentemente, o tipo de conteúdo transacionado na rede, as formações das relações interpessoais foram tomando novas configurações. A cada novo desenho de rede, novas conexões e novos atores tomaram posição de destaque, reforçando atores ou mesmo revelando atores até então “invisíveis”. O princípio de que o sujeito humano é um ator ativo na construção da realidade e que ele constrói o próprio ambiente em que se 156 movimentam, adicionalmente, apontam os limites de quaisquer ações ou intervenções que os tomem como passivos seguidores de regras e princípios definidos externamente. LAGO JUNIOR (2005). Meneghelli (2009) destaca que a força da teoria e da metodologia de análise de redes vem da capacidade de tornar visível a estrutura social dos atores a partir de uma perspectiva relacional. Entretanto, a análise qualitativa das características do perfil dos entrevistados desta pesquisa, gerou a necessidade de se categorizar os dados com o auxílio de uma ferramenta para uma análise com certa complexidade na busca da identificação de algum padrão no perfil desses indivíduos. Diante dessa necessidade, surgiu à razão da escolha do processo de mineração de dados, capaz de extrair padrões de forma automática e adaptativa de uma base de dados. Esse processo foi conduzido utilizando-se Clustering, considerando a necessidade de se estabelecer grupos de indivíduos com características de perfil semelhantes. Silberschatz & Tuzhilin (1995), afirmam que é importante desenvolver algumas técnicas no sentido de apoiar os usuários e especialistas munindo-os dos padrões mais interessantes. Após o reconhecimento dos indivíduos de destaque nas redes, foi aplicada a técnica de data mining, na base de dados criada com as informações pessoais dos atores envolvidos na pesquisa. Esse processo gerou informações numéricas e gráficas que, após análise, produziram uma vasta gama de informações que possibilitaram a geração do conhecimento necessário para se identificar o perfil desses indivíduos que exercem papel importante para a disseminação da informação dentro de suas redes. Após a implementação desse estudo de caso, é possível afirmar que através da utilização das técnicas de análise de redes sociais e das técnicas de mineração de dados pode-se identificar os atores com papéis importantes nas redes sociais e caracterizar o perfil desses indivíduos. 157 Cabe ressaltar que o aspecto dinâmico das redes pode gerar novos estudos comparativos, considerando outras formas de consolidação das redes, outros ambientes, que podem gerar novas conclusões. E as bases de dados geradas com tais informações podem ser analisadas com vários enfoques diferentes. Diante dessa perspectiva, vários trabalhos podem ser desenvolvidos futuramente, tais como: Análise de toda a turma além dos rubs; Aplicação de textmining em twiters; Análise de características entre turmas em função dos horários; Aplicação de datamining em todos os alunos da turma; Uma questão não pode deixar de ser mencionada ao final desse estudo: a constatação de que a análise dessas três redes sociais tornou-se consideravelmente mais rica com a implementação de processos de data mining em conjunto com os métodos tradicionais de ARS. 158 6 REFERÊNCIAS BIBLIOGRÁFICAS BOHM, David. On Dialogue. Londres: Routledge, 1996. BOOTH, Wayne C.; COLOMB, Gregory G.; WILLIAMS, Joseph M.. A arte da pesquisa. São Paulo: Martins Fontes, 2005. CAPRA, Fritjof. O ponto de mutação. São Paulo: Cultrix, 1995. ______________. A teia da vida: uma nova compreensão científica dos sistemas vivos. São Paulo: Cultrix, 2001. ______________. As conexões ocultas: ciência para uma vida sustentável. São Paulo: Cultrix, 2005. CARVALHO, Leandro da Silva. Mineração de dados aplicada ao entendimento do comportamento do consumidor para dar suporte ao processo de tomada de decisões. Rio de Janeiro, 2009. f.123. Dissertação (Mestrado em Engenharia Civil) – COOPE - Universidade Federal do Rio de Janeiro, 2009. CASTELLS, Manuel. La era de la informacion: economia, sociedade y cultura. Madrid: Alianza Editorial, 1998. ______________. A sociedade em rede. São Paulo: Paz e Terra, 2003. CFINDER. Disponível em http://cfinder.org/. Acesso em 13/06/2010. CROSS, Rob; PRUSAK, Laurence. The people who make organizations go or stop. Harward Business Review. Boston, Massachuts. v. 80, n.6, p. 104 -112, jun 2002. DEMO, P. Metodologia do Conhecimento Científico, São Paulo: Atlas, 2000. DIAS, Donaldo de Souza; MARIANO, Sandra; MAYER, Verônica. Metodologia Aplicada à Gestão. In: Seminário de Metodologia Aplicada à Gestão, 1. Rio de Janeiro: LATEC UFF, 2007. DODGE, G.; GORMAM, T.. Essencial Oracle 8i datawarehousing. New York, John Wiley & Sons Inc, 2000. 159 ELMASRI, Ramez; NAVATHE, Shamkant B.. Sistemas de banco de dados. São Paulo: Pearson Addison Wesley, 2005. EMIRBAYER, Mustafa, GOODWIN, Jeff. Network analysis, culture and the problem of agency. American Journal of Sociology, v.99, n.6, p.1411-1454, 1994. FAYYAD, U. M., PIATESKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery: An Overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press, 1996. FLEURY, Maria Tereza Lima e OLIVEIRA JUNIOR, Moacir de Miranda. Gestão Estratégica do Conhecimento: Integrando Aprendizado, conhecimento e competências. São Paulo: Atlas, 2001. FREITAS, Carla. M.D.S, et al. Extração de Conhecimento e Análise Visual de Redes Sociais. In: Congresso da SBC, 28: Seminário Integrado de Software e Hardware, 2008. Belém do Pará. Anais… Belém do Pará: SBC, 2008. GIL, Antonio Carlos. Como elaborar projetos de pesquisa. 3.ed. São Paulo: Atlas, 1996. 159 p. ______________. Métodos e técnicas de pesquisa social. São Paulo: Atlas, 1999. GRAPHVIZ. Disponível em http://www.graphviz.org/. Acesso em 02/06/2010. GUEDES, André Luis Azevedo. A ocorrência da co-geração do conhecimento no desenvolvimento de produtos e serviços. UFF, Niterói, 2008. f.133. Dissertação (Mestrado em Sistemas de Gestão), Universidade Federal Fluminense, 2008. GUESS. Disponível em http://graphexploration.cond.org/. Acesso em 04/06/2010. GUIMARÃES, Francisco José Zamith Melo.; SOUSA, Elisete. Diagnóstico Utilizando Análise de Redes Sociais. 2005.v. VIII, 51p. Dissertação (Mestrado em Engenharia de Produção) Universidade Federal do Rio de Janeiro, Rio de Janeiro. 2005. 160 HAN, J., KAMBER, M.. Data Mining concepts and techniques. San Diego, Morgan Kaufmann, 2001. HANNEMAN, Robert A. Introducción a los métodos de análisis de redes sociales. Departamento de Sociología de la Universidad de California Riverside. 2001. HARRISON, T.. Intranet Data Warehouse. São Paulo, Berkeley, 1998. INMON, W.. Building the Data Warehouse. 4 ed. New York, John Wiley & Sons, 2002. INFLOW. Disponível em http://www.orgnet.com/inflow3.html. Acesso em 02/06/2010. JUNG. Disponível em http://jung.sourceforge.net/. Acesso em 05/06/2010. JUNQUEIRA, Luciano. Descentralización, y red en la gestión de la ciudad. Reforma y Democracia. Venezuela: Revista del CLAD, 1998. KANTER, Rosabeth Mossç KAO, Johnç WIERSEMA, Fred. Inovação pensamento inovador na 3M, DuPont, GE, Pfizer e Rubbermaid. São Paulo Negócio, 1998. KAPLAN, Robert e Norton, David. Estratégia em Ação. Rio de Janeiro: Editora Campus, 1998. KILDUFF, M.; Tsai, W . Social networks and organizations. Sage publications, 2003. KILDUFF, M.; Krackhardt, D. Bringing the individual back in : a structural analysis of the internal market for reputation in organizations. Academy of Management Journal 37 (1), p. 87-108,1994. KISHORE, Angeli. Redes sociais de desenvolvimento: um estudo quantitativo sobre alunos de MBA. 2006. 127f. Dissertação (Mestrado em Administração) – Departamento de Administração, Universidade de São Paulo, São Paulo. 2006. 161 KRACKHARDT, David; HANSON, Jeffrey R. Informal Netowrks: the company behind the chart. Harvard Business Review, Boston, v.71, n.4, p.104-111, jul – ago. 1993. KUIPERS, Kathy J. Formal and informal networks in the workplace. 1999 117 p. Tese (Doutorado em Filosofia) – Stanford University, Stanford, Calif., 1999. LAGO JÚNIOR, Mário Wilson do. Redes sociais informais intraorganizacionais e os processos e mudanças organizacionais: estudo em uma empresa de tecnologia da informação. Salvador, 2005. f.251. Dissertação (Mestrado em Administração), Universidade Federal da Bahia, 2005. LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Fundamentos de metodologia científica. 6.ed. São Paulo: Atlas, 2007.315p. ______________. Metodologia do Trabalho Científico. São Paulo: Atlas, 2001. LIMA, Karina K., AMARAL, Daniel. Práticas de gestão do conhecimento em grupos de pesquisa da rede Instituto Fábrica Milênio. Gest. Prod., São Carlos, 2008. LOIOLA, E.; MOURA, S. Análise de redes: uma contribuição aos estudos organizacionais. In: FISCHER, T. (Org.). Gestão Contemporânea: cidades estratégicas e organizações locais. Rio de Janeiro: Fundação Getúlio Vargas, 1997. LOZARES COLINA, Carlos . La teoría de las redes sociales . Papers, nº 48, Universidad Autónoma de Barcelona.1996. LOZARES COLINA, Carlos. Bases metodológicas para el Análisis de Redes Sociales, Revista de Metodología de Ciencias Sociales. n.10, julio-diciembre, 2005, pp. 9-35. MANNILA, H..Data mining: Machine learning, statistic and databases. In Proceedingsof the 8th International Conference on Scientific and Statistical Database Management, pp. 1–8, 1997. 162 MANTOVANI, Heloisa Helena Rosmaninho. Contribuição para a implantação de um sistema de informação com base na gestão do conhecimento no programa interdisciplinar de geriatria e gerontologia da Universidade Federal Fluminense. Niterói, 2004. f.176. Dissertação (Mestrado em Engenharia de Produção), Universidade Federal Fluminense, 2004. MARTELETO, Regina Maria . Análise de redes sociais : aplicação nos estudos de transferência da informação. Ciência da Informação. Brasília, v.30, n.1, p. 71-81, Instituto Brasileiro de Informação em Ciência e Tecnologia, 2001. ______________.Análise de redes sociais - aplicação nos estudos de transferência da informação. RITS – Organizações em Rede. Tema do mês de março, 2005. MARTELO. “Análise de Redes Sociais – Aplicação nos Estudos de Transferência da Informação” – Programa de Pós-Graduação em Ciência da Informação, MCT/IBICT – UFRJ/ECO, 2005. MARTINHO, C. Redes: uma introdução às dinâmicas da conectividade e da auto-organização. Brasília: WWF, 2003. MENEGHELLI, Regina Buzetti. Redes sociais informais nas organizações e satisfação no trabalho: estudo de caso numa empresa de energia. Niterói, 2009. f.186. Dissertação (Mestrado em Sistemas de Gestão), Universidade Federal Fluminense, 2009. MINAYO, Maria Cecília de Souza. O desafio do conhecimento. São Paulo: Hucitec,1993. MONTEIRO, Samuel, CARDOSO, Leonor. “Impacto(s) da gestão de recursos humanos na gestão do conhecimento em organizações industriais”. Comportamento Organizacional e Gestão, 2008. MULTINET. Disponível em http://www.sfu.ca/personal/archives/richards/Multinet /Pages/multinet.htm. Acesso em 10/06/2010. NETDRAW. Disponível Acesso em 05/06/2010. em http://www.analytictech.com/netdraw/netdraw.htm. 163 NETMINER. Disponível em http://www.netminer.com/NetMiner/home_01.jsp. Acesso em 13/06/2010. NETO, Ruy Alcides de Carvalho.Modelo de análise de redes sociais aplicado à cadeia logística do agronegócio de base econômica familiar. Brasília, 2009. Dissertação (Mestrado em Gestão do Conhecimento e Tecnologia da Informação), Universidade Católica de Brasília, 2009. NEVES, Jose Luis. Pesquisa Qualitativa : características, usos e possibilidades. Caderno de pesquisas em administração. São Paulo, v.01, n.3, 1996. NOHRIA, Nitin.; ECCLE, Robert G (Ed). Networks and organizations: structures, form, and action. Boston: Harward Business School Press, v.192, p.1- 22, 1998. QUEYROI, Roberto. Aplicação de modelo de mineração de dados em um sistema de apoio a decisão para empresas de saneamento. Rio de Janeiro, 2007. f.112. Dissertação (Mestrado em Sistemas Computacionais em Engenharia Civil), Universidade Federal do Rio de Janeiro, 2007. REGIS, Helder P. Construção social de uma rede informal de mentoria nas incubadoras de base tecnológica do Recife. Tese de Doutorado. PROPAD Programa de Pós-Graduação em Administração. UFPE, Recife, 2005. REZENDE, S. O., PUGLIESI, J. B., MELANDA, E. A., PAULA M. F.. Mineração de Dados, Sistemas Inteligentes – Fundamentos e Aplicações. Manole, 2003. RODRIGUEZ, Martius V. Rodriguez. Gestão Empresarial em Organizações Aprendizes. Rio de Janeiro: QualityMark Editora, 2006. ROSSETI, Adroaldo Guimarães, MORALES, Aran B.T.. “O papel da tecnologia da informação na gestão do conhecimento”. Ci. Inf., Brasília, v.36, n.1, p. 124-135, 2007. SÁ, Manoel Franklin de. A influência da gestão do conhecimento no desenvolvimento de projetos modalidade EPC. Niterói, f.194. Dissertação (Mestrado em Sistemas de Gestão) – Universidade Federal Fluminense, 2008. 164 SANTOS, M. V. Redes sociais informais e compartilhamento de significados sobre mudança In: organizacional. Congresso Brasileiro de Psicologia Organizacional e do Trabalho, 2004, Salvador. Anais do Congresso Brasileiro de psicologia organizacional e do trabalho, v. 1. 2004. SCOTT, John. Social network analysis: a handbook. Londres, Reino Unido, 2000. SCOTT, J. Social Network analysis. Califórnia: Sage Publications, 2000. SENGE, Peter, M.. A Quinta Disciplina. São Paulo: Best Seller, 1998. SOCNETV. Disponível em http://socnetv.sourceforge.net/. Acesso em 02/06/2010. SOUZA, Solange Lima. Evasão no ensino superior: um estudo utilizando a mineração de dados como ferramenta de gestão do conhecimento em um banco de dados referente à graduação de engenharia. Rio de Janeiro, 2009. f.75. Dissertação (Mestrado em Engenharia Civil), Universidade Federal Fluminense, 2009. SILBERSCHATZ, A., TUZHILIN, A., 1995, On subjective measures of interestingness in knowledge discovery. Proceedings of the First International Conference on Knowledge Discovery and Data Mining 1, 275–281. SILVA, Marcus César Marinho da. Redes Sociais intraorganizacionais informais e gestão: um estudo nas áreas de manutenção e operação da planta HYCO-8. 2003. 223f. Dissertação (Mestrado em Administração),Universidade Federal da Bahia, Salvador. 2003. SILVA, Sergio, ROZENFELD, Henrique. Proposição de um modelo para avaliar a gestão do conhecimento no processo de desenvolvimento de produtos. Ci. Inf., Brasília, v.36, n.1, p. 147-157, 2007. SOARES, Weber. Da metáfora à substância: redes sociais, redes migratórias e migração nacional e internacional em Valadares e Ipatinga.. Tese de Doutorado, UFMG/Cedeplar, Belo Horizonte, 2002. 165 STOECKICHT, Ingrid Paula. Gestão Estratégica do Capital Humano – Avaliando o potencial de inovação de uma empresa: Estudo de Caso. Niterói, 2005. f.199. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal Fluminense, 2005. STOECKICHT, Ingrid Paula. Gestão Estratégica do Capital Humano – Avaliando o potencial de inovação de uma empresa: Estudo de Caso. Niterói, 2005. f.199. Dissertação (Mestrado em Engenharia de Produção) – Universidade Federal Fluminense, 2005. SVEIBY, Karl Eril. A nova riqueza das organizações: gerenciando e avaliando patrimônios de conhecimento. Rio de Janeiro: Campus, 1998. TAKEUCHI, Hirotaka e NONAKA Ikujiro. Gestão do Conhecimento. Porto Alegre: Bookman, 2008. TAKEUCHI, Hirotaka e NONAKA Ikujiro. Criação do Conhecimento na Empresa. Rio de Janeiro: Campus, 1997. TAKEUCHI, Hirotaka; NONAKA, Ikujiro. Criação de conhecimento na empresa: como as empresas Japonesas geram a dinâmica da inovação. Rio de Janeiro: Elsevier, 1995. TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introdução ao Data Mining. Rio de Janeiro: Editora Ciência Moderna Ltda, 2009. TEIXEIRA, Maria E. P.; BRASIL, Andréa Rocha. Guia de formatação de monografias, dissertações e teses. Baseado nas normas da ABNT. Niterói, 2009. TOMAEL, Maria Inês et al. Das redes sociais à inovação. Ciência da Informação, Brasília, vol.34, n. 2, p.93-104, maio/ago. 2005. UCINET. Disponível em http://www.analytictech.com/ucinet/. Sylvia Constant. Acesso em pesquisa em 10/06/2010. VERGARA, Projetos administração. São Paulo: Atlas, 1998. e relatórios de 166 VISONE. Disponível em http://visone.info/. Acesso em 05/06/2010. WASSERMAN, Stanley; FAUST, Katherine. Social Network Analysis: methods and applications. 17 th pr. Cambridge: Cambridge University Press, 2008. WASSERMAN, Stanley.; GALASKIEWICZ, Joseph. Advances in social network analysis: research In the social and behavioral sciences. Thousand Oaks, Calif.: Sage Publications, 1993. YED. Disponível em http://www.yworks.com/en/products_yed_about.html. Acesso em 02/06/2010. YIN, Robert K. Case Study Research: design and Methods. Sage Publications Inc: USA, 1989. ______________. Estudo de caso: planejamento e métodos. Tradução: Daniel Grassi. 3. ed. Porto Alegre: Bookman, 2005. 212 p. 167 ANEXO 1 FORMULÁRIO DA PESQUISA – ANÁLISE DE REDES SOCIAIS INFORMAIS ANÁLISE DE REDES SOCIAIS INFORMAIS DE ALUNOS DE GRADUAÇÃO P Peessqquuiissaa ddeesseennvvoollvviiddaa ppoorr TTaattiiaannaa B Baarrbboossaa ddee A Azzeevveeddoo C CE EFFE ETT -- M MG G // U UFFFF -- R RJJ 168 Questionário para Análise de Rede Social Informal de Alunos de Graduação As informações coletadas neste questionário serão utilizadas pela pesquisadora Tatiana Azevedo em sua dissertação de Mestrado. Os nomes dos alunos não serão divulgados. Por favor, preencha os dados abaixo. DADOS PESSOAIS Nome: Sexo: Idade: Quantidade de Filhos: Estado Civil: Quantidade de irmãos: Recebe alguma ajuda financeira para estudar? Sim Não De quem ou de qual instituição? ESCOLARIDADE Nome da escola onde terminou o ensino médio: Esta escola é: Pública Privada Cidade onde ela está localizada: DADOS PROFISSIONAIS Não trabalha Func. Público Prof. Liberal/Autônomo CLT Local (empresa) de trabalho: Cidade: Cargo / Função: Tempo de empresa: Quantidade de subordinados: CARACTERÍSTICAS PESSOAIS / ESCOLARES Você se considera tímido? Sim Não Você tem facilidade para falar em público? Sim Não Você se considera um líder? Sim Não Você participa de algum projeto de pesquisa? Sim Não Você prefere desenvolver os trabalhos de aula: Sozinho Em dupla Em grupo Comparando suas notas com as notas da turma, você as considera: Acima da média Medianas Abaixo da média Comparando sua freqüência em aula com a da turma, você se considera: Informações sobre o entrevistado Naturalidade: 169 Muito frequente Mediano Pouco frequente Normalmente você termina os trabalhos solicitados pelos professores: Antes do prazo No prazo Depois do prazo Normalmente você estuda para as provas com: Muita antecedência Pouca antecedência Em cima da hora Em relação à sua satisfação / motivação com o curso você está: Muito satisfeito Satisfeito Insatisfeito Durante as disciplinas mais difíceis, normalmente você: Ajuda os colegas Pede ajuda aos colegas Estuda sozinho Caso sua resposta anterior for: Ajuda os colegas, você o faz: Porque gosta Para não dizer não Para se destacar Quantos livros você normalmente lê em um ano? 0 1a3 4a7 Mais de 7 De modo geral, quais as pessoas da turma a quem você recorre quando está com dúvidas em relação a alguma matéria do curso? Com quais pessoas da turma você convive fora da sala de aula? Se você precisar tirar nota máxima em um trabalho final, quais pessoas da turma você gostaria que fossem da sua equipe? Se você fosse o líder de uma empresa, no ramo de seu curso, quais alunos da turma você convidaria para trabalhar em sua equipe? A quais pessoas da turma você delegaria um projeto na confiança de que este seja executado com qualidade e dentro do prazo? Características das pessoas de sua Rede Social e de Conhecimento CARACTERÍSTICAS DE SUA REDE SOCIAL 170 Se você fosse comemorar seu aniversário com 10 amigos da turma, quem você convidaria? Muito obrigada por sua colaboração. Tatiana Barbosa de Azevedo – [email protected] 171 ANEXO 2 INDICADORES QUANTITATIVOS DA ANÁLISE DE REDES SOCIAIS 172 ANEXO 3 INSTITUIÇÕES PARTICIPANTES DA PESQUISA Faculdades FUPAC e UNIPAC Breve Histórico A história das Faculdades da Fundação Presidente Antônio Carlos, FUPAC, e da Universidade Presidente Antônio Carlos, UNIPAC, teve início em 1963, quando o deputado e professor Bonifácio Andrada apresentou um projeto de lei que aprovado deu origem à Fundação Universitária da Mantiqueira, em Barbacena, Minas Gerais. A instituição, por lembrança do deputado Hilo Andrade, passaria a se chamar Fundação Presidente Antônio Carlos. Era o nascimento da FUPAC, que mais tarde tornar-se-ia uma das maiores instituições universitárias do país. O deputado Bonifácio Andrada transformou em realidade o seu intento em 1965. Coube a ele presidir a instalação das duas primeiras instituições universitárias em Barbacena. Assim, em 1966, foram instaladas as duas primeiras faculdades: a Faculdade de Filosofia com os cursos de Letras, Pedagogia e História e a Faculdade de Ciências Econômicas, Contábeis e Administrativas com o curso de Ciências Contábeis. O início desses cursos refletia a preocupação da Fundação Presidente Antônio Carlos em responder às expectativas na formação de professores e no setor da gerência empresarial, pois, desde aquela época, eram solicitados profissionais qualificados para essas áreas. 173 Sempre atenta às necessidades da comunidade, a FUPAC inicia, em 1968 o curso de Matemática. Em 1971, é criada a Faculdade de Medicina, hoje procurada por estudantes do Brasil inteiro. Três anos mais tarde, em 1974, a FUPAC cria a Faculdade de Ciências Jurídicas e Sociais com o curso de Direito, e em 1975, a Faculdade de Ciências Econômicas e Administrativas, com a graduação em Administração de Empresas, todas na cidade de Barbacena. Em uma contínua expansão, a Fundação Presidente Antônio Carlos passa a estar presente na cidade de Ubá, em 1970; e em Visconde do Rio Branco, em 1975. A FUPAC chega também a Leopoldina no ano de 1991; a Ipatinga, em 1993; e a Juiz de Fora, em 1996. Em 1997, a Fundação instala-se ainda em Conselheiro Lafaiete; no ano seguinte (1998), em Bom Despacho; e em 2001, em Araguari. Hoje, estas cidades formam um conjunto de 9 campi , incluindo Barbacena. Ao longo daqueles anos a FUPAC instalou também unidades em outras cidades de Minas Gerais, como Andrelândia, Campo Belo, Cataguases, Congonhas, Conselheiro Pena, Itabirito e Muriaé. Aos 31 anos de atividade, em 1997, em reconhecimento à qualidade do ensino oferecido, os campi da Fundação Presidente Antônio Carlos transformam-se em Universidade Presidente Antônio Carlos (UNIPAC), autorizada pelo Conselho Estadual de Educação, homologada pela Secretaria de Estado da Educação de Minas Gerais e Portaria do MEC nº 366, de 12 de março de 1997. A partir de 2002, o Reitor licenciado, professor Bonifácio Andrada, visando a melhoria da qualidade da educação de base no Estado e consciente da necessidade de capacitação do profissional pedagógico, criou a Rede de Ensino Normal Superior com as Faculdades de Educação e Estudos Sociais em mais de 100 cidades espalhadas por Minas Gerais, o que promoveu uma grande revolução educacional no interior mineiro. Tal iniciativa atendeu às necessidades de cada região e à exigência instituída na Lei de Diretrizes e Bases da Educação, que determina que, a partir de 2006, a formação superior seja imprescindível para atuação dos professores em sala de aula. Hoje, portanto, a FUPAC/UNIPAC, com seus 31 anos como Faculdade e 12 como Universidade, está presente em mais de 100 cidades de Minas Gerais, subdivida em campi e Rede de Faculdades Isoladas de Educação e Estudos 174 Sociais, com mais de 57 mil universitários, oferecendo mais de 200 cursos de graduação, e contando ainda com o Ensino Fundamental, Médio, pós graduação lato sensu , nas diversas áreas do conhecimento e stricto sensu, em Administração, Comunicação e Tecnologia, Direito e Educação e Sociedade. (Texto obtido no site oficial da UNIPAC www.unipac.br em 08-03-2011) 175 Centro Federal de Educação Tecnológica de Minas Gerais Breve Histórico Em 23 de setembro de 1909, o Presidente Nilo Peçanha, através do Decreto nº 7.566, criava a Escola de Aprendizes Artífices de Minas Gerais, hoje Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG). Instalada na av. Afonso Pena, em Belo Horizonte, onde funciona atualmente o Conservatório de Música da UFMG, a Escola oferecia ensino primário profissionalizante para crianças carentes de 12 a 16 anos. Naquela época, Belo Horizonte ainda não apresentava demanda para a área industrial e, por isso, os alunos eram formados para o artesanato manufatureiro. Havia cursos de serralheria, sapataria, ourivesaria, marcenaria e carpintaria. Somente em 1942, com a industrialização, é que a escola se tornou técnica, primeiro com o nome de Escola Técnica de Belo Horizonte e, em 1959, com a denominação de Escola Técnica Federal de Minas Gerais. Em 30 de junho de 1978, a instituição se transformou em CEFET-MG, a partir da aprovação de uma lei pelo Congresso Nacional. Essa mudança representou um grande avanço institucional, uma vez que ampliou as possibilidades de oferta de educação tecnológica em nível superior, incluindo graduação, pós-graduação lato sensu e licenciatura, além dos cursos técnicos, de educação continuada e das atividades de pesquisa. 176 O CEFET-MG é uma autarquia federal brasileira, vinculada ao Ministério da Educação, possui cerca de 1009 docentes e cerca de 13623 discentes, dos quais aproximadamente 5300 são estudadntes da graduação. Em Minas Gerais, o CEFET possui dez campi. Este estudo foi aplicado no campus III fundado em 1987, na cidade de Leopoldina, interior de Minas. Segundo o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP), em 2011, o CEFET ocupou o segundo e terceiro lugar do ranking nacional de instituições de ensino superior entre as 10 mais concorridas do Brasil no Sistema de Seleção Unificada (Sisu)[13], sendo que, neste mesmo ano o Sisu apresentou 2.020 milhões de inscrições (Texto obtido no site www.100anos.cefetmg.br em 08-03-2011)