10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil DATA MINING THE IDENTIFICATION OF THE CHARACTERISTICS OF THE BOARD OF THAT VALUE THE CORPORATE PERFORMANCE Fernanda Kreuzberg (Universidade Regional de Blumenau – FURB, SC, Brasil) – [email protected] Franciele Beck (Universidade Regional de Blumenau – FURB, SC, Brasil) – [email protected] Moacir Manoel Rodrigues Júnior (Universidade Federal do Paraná – UFPR, PR, Brasil) – [email protected] Nelson Hein (Universidade Regional de Blumenau – FURB, SC, Brasil) – [email protected] The Board of Directors is an important instrument of corporate governance where stand out practices that mitigate the conflict of interest between shareholders and managers of companies, so that it can influence the performance of organizations. In this way we sought from the techniques of rough sets and discriminant analysis, to identify the characteristics of the board who value the performance of family firms listed on the BM & FBovespa. Was delimited study sample of 130 companies with characteristics of family ownership. The tools used for data mining techniques were the Rough Sets Theory and Discriminant Analysis. The results indicated that the main practices of the board with the greatest positive influence on performance, are the total number of board members and the number substitute of board. In turn, the technique of discriminant analysis highlighted only the variable of the number substitute of board as significant for prediction with a hit percentage of approximately 34%. By TCA all variables were confirmed, however the percentage of information quality was 30% which can be considered low. Key-words: Data mining. Rough Sets. Discriminant Analyse. Corporte Governance. DATA MINING NA IDENTIFICAÇÃO DAS CARACTERÍSTICAS DO CONSELHO DE ADMINISTRAÇÃO QUE VALORIZAM O DESEMPENHO DAS EMPRESAS O Conselho de Administração é um importante instrumento de governança corporativa onde se destacam práticas que mitigam o conflito de interesse entre acionistas e gestão das empresas, de modo que possa influenciar no desempenho das organizações. Desta maneira buscou-se a partir das técnicas de conjuntos aproximativos e análise discriminante, identificar as características do conselho de administração que valorizam o desempenho de empresas familiares listadas na BM&FBovespa. Delimitou-se amostra do estudo em 130 empresas com características de propriedade familiar. As ferramentas utilizadas para a mineração de dados foram às técnicas de Teoria dos Conjuntos Aproximativos e a Análise Discriminante. Os resultados apontaram que as principais práticas do conselho de administração com a maior influência positiva sobre o desempenho, são o número total de conselheiros bem como o número de conselheiros suplentes. Por sua vez a técnica de análise discriminante destacou apenas a variável do número de conselheiros suplentes como significativa para a previsão, com um percentual de acerto de aproximadamente 34%. Pela a TCA todas as variáveis foram confirmadas, entretanto o percentual de qualidade da informação foi de 30% o que se pode considerar baixo. Palavras-chave: Corporativa. Data mining. Rough Sets. Análise Discriminante. Governança 0167 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil 1 INTRODUÇÃO A configuração do mercado acionário e características inerentes das empresas revelam pontos importantes a respeito da forma e ênfase com que as práticas de governança são adotadas e seus reflexos no desempenho econômico. Silveira (2004, p. 31) exemplifica este aspecto, por meio do problema de agência, que nas empresas com a propriedade pulverizada é caracterizado pela expropriação de riqueza dos acionistas por parte dos gestores, enquanto que nas empresas de propriedade concentrada, característico em empresas familiares, configura-se na expropriação dos acionistas minoritários pelos acionistas controladores. Neste sentido, reforça a necessidade do conhecimento e aperfeiçoamento das práticas da governança corporativa nas organizações. A governança corporativa é apresentada na literatura como elemento chave no processo de alcance de eficiência e desenvolvimento econômico, adicionalmente à característica de proteção aos investidores (Vintila & Gherghina, 2012). Sendo que o conselho de administração é elencado como o principal mecanismo do sistema de governança, pois intermédia a relação entre os diversos interessados na organização (Silveira, 2004; Mendes-da-Silva & Grzybovski, 2006). O Código de Melhores Práticas de Governança Corporativa do Instituto Brasileiro de Governança Corporativa [IBGC] (2009) elenca as principais características requeridas por um conselho de administração que prima pelas boas práticas de governança. Sendo elencadas a segregação de funções entre o Chief Executive Officer (CEO) e o Presidente do Conselho de Administração, a composição do conselho voltada preferencialmente à conselheiros independentes e externos, o resguardo na prática de conselheiros suplentes e o tamanho do conselho (IBGC, 2009). Estas informações relativas às características do conselho de administração estão disponíveis no formulário de referências das empresas listadas na BM&FBovespa. Neste sentido, configura-se como rica base de dados, da qual podem ser extraídos novos conhecimentos, prever e explicar tendências de acordo com os padrões de dados estabelecidos, aplicando-se os conceitos base da Teoria de Mineração dos Dados – Data Mining. Conforme Goebel e Gruenwald (1999), a mineração de dados se vale de um conjunto de técnicas, que permitem a obtenção de informações úteis a partir dos dados disponíveis, por sua vez cada método apresenta as suas vantagens e desvantagens. Dentre as técnicas abordadas nos estudos de Goebel e Gruenwald (1999) e Carbureanu (2012), destacam-se para o presente estudo a Teoria dos Conjuntos Aproximativos (Rough Sets) e a Análise Discriminante (Discriminant Analyse). Neste sentido, estabelece-se a questão problema norteadora do estudo: Quais as características do conselho de administração que valorizam o desempenho de empresas familiares listadas na BM&FBovespa? Busca-se desta forma, a partir das técnicas de conjuntos aproximativos e análise discriminante, identificar as características do conselho de administração que valorizam o desempenho de empresas familiares listadas na BM&FBovespa. Muitos estudos vêm sendo desenvolvidos no intuito de relacionar as boas práticas de governança com a performance das empresas (Silveira, Barros & Famá, 2003; Vintila & Gherghina, 2012), ou com o ambiente de divulgação de informações (Ienciu, 2012). Identificam-se ainda estudos que caracterizam as boas práticas de governança e os mecanismos utilizados pelas empresas (Dutra & Saito, 2002; Silveira & Barros, 2008; Silva, 2009; Moura & Beuren, 2011). 0168 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Quanto as técnicas utilizadas no presente estudo para a mineração dos dados, verifica-se na literatura uma gama de trabalhos que reafirmam a capacidade explicativa de seus resultados. Em relação à Teoria dos Conjuntos Aproximativos (TCA) destacam-se os estudos desenvolvidos por Mckee (2000), Ramos, Machado e Costa (2003), Pinto, (2008), Pereira, Gómez e López (2008), e Hein, Pinto e Boneli (2008). Já no que se refere à Análise Discriminante, destacam-se Samanez e Menezes, (1999), Castro Junior, (2003), Gallon, Beuren e Hein (2007), e Birolo, Cittadin e Ritta, (2011). Neste sentido, os estudos reforçam a importância da discussão da mineração de dados no ambiente acadêmico e empresarial, a partir das técnicas de conjuntos aproximativos e análise discriminante, no intuito de prever e explicar o padrão das características que valorizam o desempenho de empresas. 2 REFERENCIAL TEÓRICO Neste tópico apresenta-se o marco teórico do estudo, destacando inicialmente os aspectos relativos à mineração de dados na governança corporativa. Na sequência, é apresentada a Teoria dos Conjuntos Aproximativos no intuito explicar e vislumbrar padrões para o conjunto de dados analisados. E por fim, apresenta-se a técnica de Análise Descriminante, circunscrevendo ao objetivo de prever tendências em um conjunto de dados. 2.1 Mineração de Dados na Governança Corporativa A governança corporativa é tratada na literatura como um importante mecanismo de minimização de conflitos e redução dos custos resultantes destes conflitos, caracterizados pelo problema de agência. Shleifer e Vishny (1997) no estudo “A Survey of Corporate Governance” elucidam importantes aspectos relacionados a governança corporativa sob enfoque da teoria da agência. Segundo os autores, a governança corporativa concerne às formas pelas quais os fornecedores de recursos garantem obtenção de retorno sobre seu investimento, o alcance de lucros, evita a expropriação de recursos (Shleifer & Vishny, 1997). No Brasil, as diretrizes que proclamam e orientam as boas práticas de governança corporativas das organizações são apresentadas no Código das melhores práticas de Governança Corporativa (IBGC, 2009: 19), que define governança corporativa como “o sistema pelo qual as organizações são dirigidas, monitoradas e incentivadas, envolvendo os relacionamentos entre proprietários, conselho de administração, diretoria e órgãos de controle”. O conselho de administração recebe destaque na literatura, como o principal mecanismo do sistema de governança, pois interliga a gestão aos investidores e aos interessados na organização (Silveira, 2004; Mendes-da-Silva & Grzybovski, 2006; IBGC, 2009; Moura & Beuren, 2011). Para atender à sua importância na boa governança corporativa, os conselhos de administração das empresas brasileiras devem apresentar algumas características como: (a) ser composto preferencialmente por membros externos e independentes, (b) apresentar segregação das funções do presidente e do diretor presidente, (c) evitar a prática de conselheiros suplentes, (d) observar o número de membros do conselho, e (e) divulgação da remuneração do conselho (IBGC, 2009). Desta forma, estas características correspondem e viabilizam o atendimento aos pilares das boas práticas de governança, por meio da transparência (divulgação de informações, além dos aspectos legais), equidade (tratamento justo a todos os sócios e stakeholders), accountability (prestação de contas) e a responsabilidade corporativa (sustentabilidade da organização) (IBGC, 2009). 0169 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil A exigência de informações por parte do próprio mercado, em função de melhores práticas de governança corporativa levou a necessidade de criação do Formulário de Referencia através da Instrução Normativa nº 480/09 da Comissão de Valores Mobiliários [CVM] (2009). Este instrumento, passa a constituir a principal fonte de informações das entidades, incluindo os aspectos relacionados a governança corporativa como: estrutura de propriedade, composição do conselho de administração, comitês, políticas de relacionamento com acionistas, e demais interessados na organização. Desta forma, constitui-se um importante banco de dados voltados aos aspectos organizacionais das empresas, e que por fim, permite extrair padrões e tendências utilizadas pelas empresas, em específico no que se refere à governança corporativa. Goebel e Gruenwald (1999) apontam para a crescente informatização de dados sobre as mais diversas características, operações, atividades, e desempenho, implicando em informações valiosas de modo a exprimir padrões e tendências, e fornecer auxílio na melhoria da tomada de decisões, otimização e sucesso empresarial. O processo em que se eleva o nível de conhecimento de determinado conjunto de dados disponíveis em uma base é denominado na literatura de Knowledge Discovery in Databases (KDD). Uma etapa importante deste processo de descoberta de conhecimento é a mineração de dados (Goebel & Gruenwald, 1999; Dias, 2002). A teoria de mineração de dados apresenta uma ampla aplicabilidade em muitos campos do conhecimento, pois permite extrair de um conjunto de dados, padrões e modelos que a partir da aplicação de técnicas, otimizam a análise, sem que acarrete em perda de informações (Goebel & Gruenwald, 1999; Dias, 2002; Carbureanu, 2012). As informações utilizadas nesse processo se encontram em grande volume de dados e, por meio da mineração, é possível se obter um resumo compacto das informações (Pinto, 2008). Conforme apontado, a mineração de dados não se vale de uma única técnica, mas sim da aplicação de um conjunto de técnicas. Neste sentido Goebel e Gruenwald (1999: 23) apontam que “qualquer método que ajudar a obter mais informações a partir dos dados, é útil. Diferentes métodos servem a propósitos diferentes, cada método oferece suas próprias vantagens e desvantagens”. Identifica-se nos estudos de Goebel e Gruenwald (1999) e Carbureanu (2012), algumas técnicas associadas à mineração de dados como: métodos estatísticos, raciocínio baseado em casos, redes neurais, árvore de decisão, redes bayesianas, algoritmos genéticos/programação evolutiva, regras de indução, regressão, agrupamentos (clustering), conjunto aproximativo (rough sets), análise de componentes principais (PCA), análise discriminante (discriminant analyse). Para o presente estudo, delimita-se a utilização das técnicas dos conjuntos aproximativos (rough sets) e análise discriminante (discriminant analyse), aplicados ao conjunto de informações que caracterizam a governança corporativa de empresas familiares de capital aberto no Brasil. 2.2 Teoria dos Conjuntos Aproximativos A aplicação da Teoria dos Conjuntos Aproximativos (TCA) ou Rough Sets Theory, na mineração de dados foi proposta inicialmente pelo matemático polonês Zadislaw Pawlak em 1982, tendo por objetivo principal abordar a questão da granulosidade. Conforme Pereira et al. (2008) o surgimento dessa teoria envolve a necessidade de dispor de um marco para se tratar os conhecimentos imprecisos, incertos e também incompletos que estão expressos no formato de dados que foram adquiridos experimentalmente. Dessa forma a TCA tem por finalidade primordial transformar um determinado conjunto de dados em conhecimento. Sobre a importância da granularidade do 0170 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil conhecimento Hein e Kroenke (2010) corroboram sobre a sua utilização na definição dos conceitos chave dessa teoria que permeiam pela aproximação, dependência e redução. De maneira similar Gomes e Gomes (2012: 267) corroboram que “a TCA é caracterizada por um conjunto de elementos que não pode ser precisamente definido no que concerne a seus atributos”. Dessa forma discute-se o conceito de indiscernibilidade. Ao encontro Hein e Kroenke (2010: 13) afirmam que o termo indiscernir possui como significado “[...] não conseguir distinguir uma coisa de outra por meio dos sentidos ou da inteligência humana, o que busca a TCA é encontrar todos os objetos que produzem um mesmo tipo de informação, ou seja, que são indiscerníveis”. Para Gomes e Gomes (2009: 268) a indiscernibilidade pode advir da: “a) determinação da quantidade de atributos e/ou critérios; b) dúvidas geradas pelos descritores; c) perda de informação de um ou mais descritores; d) divergência entre os múltiplos descritores”. Logo esta relação estabelecida pela indiscernibilidade constitui-se a base matemática da TCA. O funcionamento do processo de mineração de dados está delineado no estudo de Pawlak (1982). Nesse sentido, o autor apresenta uma proposta de matriz de informação, conforme a Tabela 01. Tabela 01 – Matriz de informação Atributo 1 Objeto 1 Objeto 2 Atributo 2 Atributo Objeto Fonte: Adaptado de Pawlak e Slowinski (1994). A matriz de informação apresentada na Tabela 01 dispõem nas linhas os experimentos (objetos da pesquisa, observações) e nas colunas as variáveis coletadas (atributos). No caso deste estudo, os objetos serão representados pelas empresas e os atributos pelas características da governança corporativa que remete especificamente ao conselho de administração. Logo como resultado se obtém um núcleo declaratório com as informações que melhor explicam a governança corporativa (conselho de administração) das empresas familiares. A TCA é uma ferramenta útil para a análise de situações de decisão, especificamente em se tratando da classificação de problemas multicritério (Pawlak & Slowinski, 1994). Em relação à relevância da utilização deste método Gomes e Gomes (2012) corroboram que a TCA é importante para: a) Avaliar a importância de um determinado critério em particular, de forma a determinar qual seja o mais importante para um processo de decisão, bem como para definir um conjunto minimo de critérios; b) Retirar os critérios supérfluos; c) Estabelecer regras no sentido de reduzir a tabela de decisão; d) Aferir o conflito de opiniões entre os especialistas; e) Representar um conhecimento ambíguo; f) Representar o conhecimento adquirido de maneira empírica; g) Caracterizar objetos diante de atributos que admitam a determinação de dependência entre os critérios; e h) Tratar tanto as informações qualitativas, quanto as informações quantitativas no processo de tomada de decisão. Conforme Pinto (2008: 64), a TCA por se tratar de uma ferramenta da mineração de dados “[...] possui aplicações nos mais diversos campos, destacando-se os sistemas de apoio à decisão e em sistemas gerenciais de informação”. Nesse sentido diversos estudos 0171 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil da área contábil vêm atribuindo importância a está técnica como, por exemplo, na investigação dos custos relacionados ao processo de falência de empresas (McKee, 2000), na investigação da qualidade de sistemas da informação perante a análise da qualidade dos serviços (Ramos et al., 2003), na avaliação do fracasso empresarial de empresas portuguesas (Pereira et al., 2008), na insolvência de empresas brasileira do setor têxtil (Hein et al., 2008). Dessa forma, estabelecido o objetivo do estudo, utilizou-se a Técnica da TCA como uma das maneiras para estabelecer o núcleo declaratório com as informações que melhor explicam a governança corporativa sob o aspecto do conselho de administração das empresas familiares brasileiras. 2.3 Análise Discriminante A partir de 1920 surgiram as primeira ideias associadas a análise discriminante por meio do estatístico inglês Karl Pearson. Porem foi Fisher que em 1935 apresentou a primeira solução para um problema de discriminação, em um estudo desenvolvido sobre plantas (Mário, 2007). No entanto na área de Finanças um dos trabalhos pioneiros foi desenvolvido por Edwards Altman (1968), ao efetuou inferências relacionadas a capacidade preditiva dos indicadores do desempenho de empresas. Diante deste contexto define-se a análise discriminante como “[...] um técnica estatística que auxilia a identificar quais as variáveis que diferenciam os grupos e quantas dessas variáveis são necessárias para obter a melhor classificação dos indivíduos de uma determinada população” (Mário, 2007: 234). Logo se busca um conjunto de informações representadas pelas variáveis independentes de maneira que se encontre um valor de uma variável dependente para atingir uma classificação desejável. De acordo com Hair, Anderson, Tatham e Black (2005: 209) “a análise discriminante envolve determinar uma variável estatística, a combinação linear das duas (ou mais) variáveis independentes que discriminarão melhor entre grupos definidos a priori”. A discriminação é determinada pela atribuição de pesos para as variáveis de modo a maximizar a variância entre os grupos em relação com a variância dentro dos grupos. Logo com o resultado dessa combinação linear se alcança a função discriminante que é dada da seguinte forma: Onde: escore discriminante da função discriminante intercepto peso discriminante para a variável independente variável independente para o objeto para o objeto Cabe destacar que a variável independente diretamente relacionada ao score da função discriminante deve ser em qualquer problema uma variável categórica, podendo possuir diversos grupos. Já as variáveis independentes, preditoras, devem ser de preferência numéricas, entretanto é possível utilizar de variáveis do tipo categóricas como, por exemplo, as variáveis dummy (Fávero, Belfiore, Silva & Chan, 2009). Logo, entende-se que um conjunto de variáveis pode influenciar de maneira simultânea no comportamento de um elemento. Portanto a análise discriminante assume como finalidade “[...] encontrar uma função matemática para discriminar, ou segregar elementos entre grupos preestabelecidos, identificando-se as principais características de cada grupo, bem como as diferenças significativas que possam existir entre eles” (Mário, 2007). 0172 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Conforme Gonçalves, Dias e Muniz (2008) a técnica de análise discriminante tem por objetivo: a) estabelecer as funções discriminantes que melhor discriminem as categorias de variável dependente, b) analisar se existem diferenças significativas entre os grupos, c) identificar quais as variáveis independentes que mais contribuem para as diferenças entre os grupos, d) classificar os casos em um dos grupos, levando em consideração os valores das variáveis independentes, e e) analisar com precisão a classificação estabelecida. Nesse sentido Fávero et al. (2009) inferem que a análise discriminante é uma das técnicas mais utilizadas para a previsão e classificação de observações em grupos. De modo que apresente uma vasta aplicabilidade em diversas áreas do conhecimento proporcionando um crescimento na utilização desta técnica para diversos problemas de pesquisa. Infere-se que no contexto contábil a análise discriminante vem sendo aplicada para obtenção modelos de previsão de falência, sendo o maior foco voltado as instituições financeiras (Samanez & Menezes, 1999), para analisar a relação entre o grau de evidenciação e nível de governança (Gallon et al., 2007), em modelos de previsão de insolvência para empresas (Castro Junior, 2003; Birolo et al., 2011). 3 METODOLOGIA O presente estudo delineia-se como uma pesquisa descritiva quanto ao objetivo, documental quanto aos procedimentos e quantitativa quanto à abordagem ao problema. 3.1 Amostra A amostra do estudo compreende as 130 empresas familiares listadas na BM&FBovespa em janeiro de 2013. Seguiu-se os critérios utilizados por Mazzola (2012) para a classificação das empresas familiares, que concerne na identificação do fundador e/ou um descendente, em um cargo de gestão de topo, fazer parte do conselho, ou ainda ser um dos maiores acionistas (informação disponibilizada no Formulário de Referencia). A amostra intencional por empresas familiares configura-se no fato de empresas com esta estrutura de propriedade e controle apresentarem características próprias relacionadas principalmente a cultura familiar (Mendes-Da-Silva & Grzybovski, 2006), e ao problema de agência, pautado especificamente entre acionistas minoritários e majoritários (Silveira, 2004). Neste sentido, permite inferir reflexos desta particularidade na gestão e práticas de governança corporativa das empresas. O Código das melhores práticas de Governança Corporativa (IBGC, 2009), atento a estas particularidade, orienta inclusive a implementação de um Conselho de Família, para o alinhamento de assuntos familiares e expectativas em relação a organização. Reforçando neste sentido a importância da discussão da governança corporativa para empresas de estrutura de propriedade familiar. 3.2 Variáveis do estudo, Coleta e Análise dos dados Os dados necessários à consecução do estudo foram extraídos da Base de dados da Economática® e do Formulário de Referência das empresas disponibilizado no sítio eletrônico da BM&FBovespa. No Quadro 01, apresentam-se as variáveis utilizadas no estudo, a sua descrição, os autores e a fonte utilizada para a obtenção desta informação. Quadro 01 – Descrição das variáveis e fonte de dados Variável Descrição 1, quanto o Presidente do Conselho de Administração ocupa o mesmo Presidente/Ceo cargo de Presidente da empresa, e 0, caso contrário. Nº Conselheiros (Total) Número de membros do Conselho de Administração. 0173 Autor IBGC (2009); Gana e Lajmi (2011); Vintilă e Gherghina, (2012). IBGC (2009); Gana e Lajmi (2011); Vintilă e Gherghina, Fonte de Obtenção Formulário de Referência (BM&FBovespa) Formulário de Referência (BM&FBovespa) 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil (2012). Nº de Conselheiros (Suplentes) Número de membros que atuam como suplentes no Conselho de Administração. Nº Conselheiros Independentes Número de conselheiros independentes que atuam no Conselho de Administração. Comitês do CA Remuneração dos conselheiros ROE 1, quanto a empresa possui comitês acessórios ao Conselho de Administração, e 0, caso contrário. 1, quanto a empresa divulga a remuneração do Conselho de Administração e 0, caso contrário. (%) de Retorno sobre o Patrimônio IBGC (2009). IBGC (2009); Gana e Lajmi (2011); Vintilă e Gherghina, (2012). IBGC (2009). IBGC (2009). Vintilă e Gherghina, (2012). Formulário de Referência (BM&FBovespa) Formulário de Referência (BM&FBovespa) Formulário de Referência (BM&FBovespa) Formulário de Referência (BM&FBovespa) Economática® Fonte: Dados da pesquisa. A coleta de dados foi efetuada em Janeiro de 2013, sendo tabulados em planilha de cálculo Excel. Para a análise dos dados, empregaram-se as técnicas da Teoria dos Conjuntos Aproximativos (TCA) e Análise Discriminante (AD), por meio da utilização do software SPSS versão 20. 4 ANÁLISE E INTERPRETAÇÃO DOS DADOS A Mineração de Dados consiste em reduzir o número de variáveis analisadas em um determinado problema, de modo que este perca em complexidade, entretanto se mantenha, pelo menos, em poder inferencial. A princípio muitos métodos podem ser utilizados para se fazer o processo de mineração de dados, citam-se os modelos probabilísticos, ou determinísticos, ou problemas de heurísticas que não exigem comprovação de uma relação existente. Assim, este trabalho busca identificar dentre dois modelos, Análise Discriminante (Probabilístico) e Teoria dos Conjuntos Aproximativos (Não Probabilístico), qual possui maior efetividade quando relacionado variáveis de Governança Corporativa especificamente tratando do Conselho de Administração, com o Desempenho de empresas familiares de capital aberto no Brasil. A análise também possibilita avaliar qual critério, (variável de governança corporativa no conselho de administração) pode estar tendo maior impacto no desempenho das empresas. Para tanto esta seção se dedica a explicar quais são os resultados existentes na análise das duas técnicas, possibilitando um comparativo dos resultados ao final. Assim esta seção está dividida em três momentos, sendo o primeiro direcionado aos resultados da Análise Discriminante e o segundo para a Teoria dos Conjuntos Aproximativos. Por fim serão confrontados os resultados das duas técnicas para buscar o entendimento, a luz da teoria Data Mining, bem como nas práticas de governança corporativa. 4.1 Análise Discriminante A Análise Discriminante consiste em uma técnica de classificação de observações. Este método objetiva descrever uma combinação linear que se apresente com a melhor classificação possível sobre uma variável dependente do tipo categórica. O modelo utilizado para a análise deste trabalho admitiu como variáveis independentes (preditoras), as seguintes: (1) Presidente/CEO; (2) Número Total de Conselheiros; (3) Número de Conselheiros Suplentes; (4) Número de Conselheiros Independentes; (5) Comitês do Conselho de Administração; e (6) Remuneração dos Conselheiros. Em sua maioria as variáveis são do tipo categóricas, o que pode ser aplicado segundo Fávero et al. (2009). A variável dependente é Retorno sobre Ativo Total (ROE), esta foi categorizada inicialmente 0174 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil como Grupo 1 (Empresas do ROE negativo); Grupo 2 (50 empresas do menor ROE positivo); Grupo 3 (50 empresas com maior ROE positivo). Para se obter a mineração de dados por meio da Análise Discriminante, se utilizou o método por partes, em que se insere a variável com o valor de F significativo para um intervalo de 0,05. Desta maneira a Tabela 02 apresenta o resultado deste primeiro processo de análise, bem como a variável que foi selecionada como a que melhor prediz. Tabela 02 – Seleção das variáveis independentes Variáveis Presidente/Ceo Nº Conselheiros (Total) Nº de Conselheiros (Suplentes) 0 Nº Conselheiros Independentes Comitês do CA Remuneração dos conselheiros Presidente/Ceo Nº Conselheiros (Total) 1 Nº Conselheiros Independentes Comitês do CA Remuneração dos conselheiros Fonte: resultados da pesquisa. Tolerância 1,000 1,000 1,000 1,000 1,000 1,000 0,947 0,302 0,968 1,000 1,000 Tolerância mín. 1,000 1,000 1,000 1,000 1,000 1,000 0,947 0,302 0,968 1,000 1,000 F a ser inserido 2,873 3,774 3,883 0,453 0,466 0,692 1,922 0,800 0,975 0,398 0,621 Lambda de Wilks 0,957 0,944 0,942 0,993 0,993 0,989 0,914 0,931 0,928 0,936 0,933 Os resultados descritos pela Tabela 02 apresentam como única variável significativa para a caracterização da influencia do Conselho de Administração sobre o desempenho como a variável do número de conselheiros suplentes. Este resultado foi admitido, pois em uma segunda iteração do método, nenhuma variável possuiu o F crítico necessário para a amostra. Desta maneira destaca-se esta variável selecionada do conselho de administração como a que melhor explica, ou mais influencia no desempenho das empresas familiares listadas na BM&FBovespa. A existência de conselheiros suplentes não é tida como uma boa prática de governança corporativa, em função do menor nível de familiarização dos conselheiros suplentes com os problemas e questões da organização (IBGC, 2009). Os resultados do estudo indicam, no entanto, que para as empresas familiares, essa variável configura-se de forma positiva em relação ao desempenho das organizações. Infere-se que nas empresas familiares essa variável garante maior rotatividade no conselho, minimizando possível preeminência de um grupo de pessoas, e seus reflexos. O processo seguinte descreve a relação que permeia a variável selecionada para com a variável de desempenho. A Tabela 03 destaca por sua vez que os coeficientes atrelados ao número de suplentes no conselho são diretamente proporcionais em todos os grupos. Destaca-se que a melhor relação está no Grupo 2. Isso indica que as empresas que possuem um maior número de suplentes tende a garantir um retorno sobre o ativo maior, o que indica um aumento no desempenho. Para tanto é possível associar a uma incongruência para com as práticas de governança corporativa, haja vista que as boas práticas pregam a não existência desta modalidade de conselheiros. Tal incongruência deve motivar novas investigações no âmbito de constatar a existência efetiva deste aumento no desempenho, ou seria causalidade de dados. 0175 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Tabela 03 – Coeficientes das Funções de Fischer Coeficientes para as Funções F-Fischer Nº de Conselheiros (Suplentes) (Constante) Fonte: resultados da pesquisa. 1 0,140 -1,257 ROE 2 0,273 -1,706 3 0,155 -1,294 Para se confirmar se o problema modelado até o momento é efetivamente significativo e passivo de aceitação no que tange a inferências futuras, a Tabela 04 apresenta os resultados destas estatísticas. Tabela 04 – Teste de confiança Função Valor próprio 1 0,061 Teste de funções Lambda de Wilks 1 0,942 Fonte: resultados da pesquisa. % de variação % cumulativa 100 Chi-quadrado 7,538 100 df 2 Correlação canônica 0,240 Sig. 0,023 Os resultados da Tabela 04, que apresentam a análise do Autovalor associado a matriz de variâncias e de covariâncias, bem como a análise do Lambda de Wilks, descrevem uma associação de moderada a baixa entre a expressão de predição para com a variável dependente. Entretanto por meio do teste de Wilks, constata-se que esta relação é significativa ao nível de 5%, ou seja, o modelo pode ser utilizado para prever o desempenho, entretanto o poder explicativo é baixo considerando a probabilidade de erro. Por fim, para constatar o poder de predição do modelo otimizado no intuito de verificar a relação entre governança corporativa e desempenho organizacional, apresentase na Tabela 05 a estatística desta previsão verificando para a tanto a margem cometida de erro. Tabela 05 – Estatística das previsões Análise de Valores n Grupo 1 (AD) 16 Grupo 1 (Inicial) 17 Grupo 2 (Inicial) 26 Grupo 3 (Inicial) 59 Total Análise Valores % Grupo 1 (AD) 12,3% Grupo 1 (Inicial) 13,1% Grupo 2 (Inicial) 20,0% Grupo 3 (Inicial) 45,4% % Total % Acertos 35,4% Fonte: resultados da pesquisa. Grupo 2 (AD) 7 19 13 39 Grupo 3 (AD) 7 14 11 32 Grupo 2 (AD) 5,4% 14,6% 10,0% 30,0% Grupo 3 (AD) 5,4% 10,8% 8,5% 24,6% % Erro 64,6% Total 30 50 50 130 % Total 23,1% 38,5% 38,5% 100,0% Verifica-se um percentual de acerto baixo segundo a Tabela 05. Podem-se apontar como causadores deste baixo percentual de acerto a baixa quantidade de variáveis utilizadas na previsão, ou seja, apenas a variável de conselheiros suplentes. Este fator destaca, de forma positiva, sua influência no que tange o desempenho das empresas. Percebendo que a governança corporativa vislumbra um ambiente organizacional que melhore a relação investidor–investimento, o desempenho deve ser um fator crucial para se destacar boas práticas de governança, o que destaca um fator a se levar em consideração, os conselheiros suplentes. 0176 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Assim destaca-se que a Análise Discriminante apresentou como significativa apenas uma das variáveis preditoras (número de conselheiros suplentes), que apresentou um modelo de Fischer cujos coeficientes para cada grupo possuem uma relação positiva, o que indica uma relação de proporcionalidade com o desempenho. Entretanto por possuir uma única variável de predição o modelo, apesar de significativo, possuiu um percentual de acertou baixo, o que se torna compreensível dada à alta redução na complexidade do problema analisado. 4.2 Teoria dos Conjuntos Aproximativos O principal objetivo da TCA está em considerar a redução da complexidade de uma escolha, quando isso for possível. Isso implica em testar todas as combinações possíveis dos seis atributos de decisão e ver até onde a redução da dimensão do problema não afeta na qualidade da aproximação. O principio da TCA comparada a análise discriminante é o mesmo, o processo de execução e o resultado obtido podem ser diferentes, visto que a TCA admite apenas variáveis categóricas. Desta maneira o modelo de TCA calculado neste trabalho admitiu como atributo de condição todas as variáveis independentes do modelo da análise discriminante, sendo que o atributo de previsão é o mesmo. O resultado das combinações obtidas pelo processo de análise está apresentado abaixo, bem como o conjunto chamado Núcleo da informação, que é considerado o conjunto de variáveis mais polidas pelo processo de mineração de dados. Tabela 06 – Resultados dos Conjuntos Aproximativos N Precisão Variáveis Selecionadas Variável Grupo 1 Grupo 2 Pres_Ceo, Num_Cons, Num_Supl, Num_Cind, 6 0,071 0,181 Com_CA, Rem_Cons Pres_Ceo, Num_Cons, Num_Supl, Num_Cind, 5 0,058 0,160 Com_CA 4 Pres_Ceo, Num_Cons, Num_Supl, Num_Cind 0,029 0,133 3 Num_Cons, Num_Supl, Num_Cind 0,019 0,099 2 Num_Cons, Num_Supl 0,000 0,054 1 Não Possui Variáveis Núcleo Pres_Ceo, Num_Cons, Num_Supl, Num_Cind, Com_CA, Rem_Cons Fonte: resultados da pesquisa. Qualidade da Grupo 3 Aproximação 0,160 0,300 0,147 0,277 0,080 0,060 0,008 0,208 0,162 0,062 Dos resultados apresentados pela Tabela 06 é possível destacar que o conjunto de dados completo, formado pelas seis variáveis preditoras, corresponde a uma informação total de 30%, o que pode ser considerado baixo. Destaca-se que a precisão mais elevada está na determinação do Grupo 2, seguido pelo Grupo 3, o que indica que quanto maior for a composição do Conselho de Administração maior deve ser o retorno sobre o investimento da empresa. Essa relação, no entanto, deve ponderar a recomendação do IBGC (2009) quanto ao número de conselheiros de no mínimo cinco e máximo 11 conselheiros. Nas demais iterações destaca-se que as variáveis do número total de conselheiros e o número de conselheiros suplentes é o que aparecem como os mais significativos frente à mineração de dados. Desta maneira a TCA cumpre com o objetivo da mineração de dados elencando alguns fatores dentre eles, o conjunto de dados não deve ser reduzido, haja vista que se ocorrer redução a qualidade da aproximação diminui. Também apresenta que nenhuma variável possui poder explicativo isoladamente, isso se deve em grande parte a quantidade de empresas analisadas, 130 empresas no total. E assim o modelo destaca elementos 0177 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil diferentes do que foi apresentado pela analise discriminante, exigindo assim um comparativo. 4.3 Análise Crítica dos Achados Para o entendimento da contribuição efetiva dos resultados apresentados até o presente, verificaram-se semelhanças entre os dois métodos. Primeiramente constatou-se a comum valorização da variável número de conselheiros suplentes, sendo que em ambos os métodos os resultados apontaram para a relação positiva, quanto maior uma maior a outra também. Tanto na TCA como na análise discriminante o poder explicativo total das variáveis girou em torno de 30%, este fato pode ser um indicativo que o desempenho não está apenas relacionado com as características do conselho de administração, o que seria elementar, levando então a considerar como forte influência desta prática de governança corporativa como uma forma de melhor o desempenho. Ao encontro Silveira (2004), Mendes-da-Silva e Grzybovski (2006) apontam que o conselho de administração é principal mecanismo do sistema de governança, pois efetua intermediações entre os diversos interessados na organização. No comparativo visto pelo lado da mineração de dados, os métodos foram contraditórios no que diz respeito ao núcleo da informação. A análise discriminante apresentou como significativa uma única variável que deveria ser considerada para a análise, já a TCA descreve o conjunto total de variáveis como representativas. Esta contradição gera um erro de ordem epistemológica da estrutura de concepção dos modelos, visto que a análise discriminante está interessada em variáveis significativas e a TCA está voltada a estabelecer o conjunto significativo mesmo que no contexto a variável não seja. Desta maneira cabe ressaltar que as variáveis do número total de conselheiros bem como o de suplentes foi destaque em ambas as análises, sendo possível um estudo mais aprofundado sobre estes aspectos. 5 CONSIDERAÇÕES FINAIS De acordo com o IBGC e diversos trabalhos acadêmicos, o Conselho de Administração (CA) destaca-se por ser um importante instrumento de governança corporativa quando nele se destacam práticas que mitigam o conflito de interesse entre acionistas e gestão das empresas. Estas práticas quando alinhadas com o interesse de todos tendem a proporcionar uma melhora no desempenho refletindo em maiores retornos para a empresa. O bom desempenho deve ser o objetivo primeiro de uma organização, e para tanto se faz necessária a presença de práticas que caracterizem uma gestão profissional e eficiente. Desta maneira as características da gestão, principalmente do CA tende a valorizar o desempenho das empresas. É necessário considerar que nem todas as práticas do CA afetam diretamente, desta maneira é preciso filtrar dentre todas quais as práticas que mais afetam o desempenho. Neste contexto a Mineração de Dados tende a melhorar de forma impar esta análise, reduzindo a complexidade para que a empresa se foque diretamente nas práticas que possuem os resultados mais efetivos. Dentro deste contexto esta pesquisa foi formulada admitindo-se a seguinte questão: Quais as características do conselho de administração que valorizam o desempenho de empresas familiares listadas na BM&FBovespa? Buscou-se desta forma, a partir das técnicas de conjuntos aproximativos e análise discriminante, identificar as características do conselho de administração que valorizam o desempenho de empresas familiares listadas na BM&FBovespa. A pesquisa se caracterizou por utilizar empresas de capital aberto no Brasil, com características de possuir propriedade familiar, o que totalizou 130 empresas dos mais diferentes segmentos. As ferramentas utilizadas para a mineração de dados foram às 0178 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil técnicas de Teoria dos Conjuntos Aproximativos e a Análise Discriminante, ambas as técnicas já respaldadas por pesquisas acadêmicas como boas ferramentas de mineração de dados. Os resultados apontaram que as principais práticas do CA destacadas com a maior influência positiva sobre o desempenho, são o número total de conselheiros bem como o número de conselheiros suplentes. A técnica de análise discriminante destacou apenas a variável do número de conselheiros suplentes como significativa para a previsão, obtendo por sua vez um percentual de acerto de aproximadamente 34%. Pela a TCA todas as variáveis foram confirmadas, entretanto o percentual de qualidade da informação foi de 30% o que se pode considerar baixo. Por se tratar de variáveis referentes apenas a um elemento administrativo que é o conselho de administração como característica da governança corporativa, é possível então admitir como relevante o resultado obtido. Desta maneira o objetivo da pesquisa foi alcançado, e os resultados destacam a necessidade da investigação no que se refere a presença de conselheiros suplentes no conselho de administração, haja vista seu destaque tomado junto aos resultados apontados por ambos os métodos. A prática dos membros suplentes não é defendida pelo IBGC, o que deve ser investigado seus reais efeitos sobre o desempenho e a expropriação dos acionistas. Para futuras pesquisas, sugere-se aplicar o mesmo estudo analisando empresas não familiares de modo a efetuar um comparativo entre os estudos. Como segunda sugestão recomenda-se a utilização de outras técnicas de mineração de dados, além dos conjuntos aproximativos e da análise discriminante. REFERÊNCIAS ALTMAN, E. I. (1968). Financial ratios, discriminant analysis and prediction of corporate bankruptcy. The Journal of Finance, 23 (4), 589-609. Birolo, P. B.; Cittadin, A. & Ritta, C. de O. (2011, abril). Análise de crédito por meio de modelos de previsão de insolvência: um estudo de caso na empresa Cerâmica Alfa. Anais do Congresso UFSC de iniciação científica em contabilidade, Florianópolis, SC, Brasil, 4. Cărbureanu, M. (2012). The Annual Inflation Rate Analysis Using Data Mining Techniques. Economic Insights – Trends and Challenges, 1( 4), 121-128. Castro Junior, F. H. F. de. (2003). Previsão de insolvência de empresas usando análise discriminante, regressão logística e redes neurais. Dissertação de mestrado, Universidade de São Paulo, São Paulo, SP, Brasil. Comissão de Valores Mobiliários – CVM. (2009). Instrução Normativa nº. 480, de 07 de dezembro de 2009. Recuperado em 20 dezembro, 2012 de http://www.cvm.gov.br.html. Dias, M. M. (2002). Parâmetros na escolha de técnicas e ferramentas de mineração de dados. Acta Scientiarum, 24(6), 1715-1725. Dutra, M. G. L. & Saito, R. (2002). Conselhos de Administração: Análise de sua Composição em um Conjunto de Companhias Abertas Brasileiras. Revista de Administração Contemporânea - RAC, 6(2), 09-27. Fávero, L. P.; Belfiore, P.; Silva, F. L. da; Chan, B. L. (2009). Análise de dados: modelagem multivariada para tomada de decisões. Rio de Janeiro: Elsevier. Gana, M. & Lajmi, A. (2011). Directors’ Board Characteristics and Audit Quality: Evidence From Belgium. Journal of Modern Accounting and Auditing, 7(7), 668-679. 0179 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Gallon, A. V.; Beuren, I. M. & Hein, N. (2007). Análise da relação entre evidenciação nos relatórios da administração e o nível de governança das empresas na Bovespa. Revista de Informação Contábil, 1(2), 18-41. Gonçalves, C. A.; Dias, A. T. & Muniz, R. M. (2008). Análise discriminante das relações entre fatores estratégicos, indústria e desempenho em organizações brasileiras atuantes na indústria manufatureira. Revista de Administração Contemporânea, 12 (2), 287-311. Gomes, L. F. A. M. & Gomes, C. F. S. (2012). Tomada de decisão gerencial: enfoque multicritério (4a ed.). São Paulo: Atlas. Goebel, M. & Gruenwald, L. (1999). A survey of data mining and knowledge discovery software tools. ACM SIGKDD, 1(1), 20-33. Hair Jr., J. F.; Anderson, R. E.; Tatham, R. L. & Black, W. C. (2005). Análise multivariada de dados (5a ed.). Porto Alegre: Bookman. Hein, N. & Kroenke, A. (2010). Escólios sobre a teoria dos conjuntos aproximativos. Revista CIATEC, 2 (1), 13-20. Hein, N.; Pinto, J. & Bonelli, G. G. (2008, agosto). Uma ferramenta Data Minig na análise de solvência de empresas do setor têxtil. Anais do Simpósio de Pesquisa Operacional e Logistica da Marinha, Rio de Janeiro, RJ, Brasil, 11. Ienciu, I.-A. (2012). The relationship between environmental reporting and corporate governance characteristics of romanian listed entities. Accounting and management information systems, 11 (2), 267-294. Instituto Brasileiro de Governança Corporativa - IBGC. (2009). Código das melhores práticas de governança corporativa [Manual], (4a ed.). Recuperado em: 15 outubro, 2011. Disponível em: http://www.ibgc.org.br/CodigoMelhoresPraticas.aspx. Mário, P. do C. (2007). Análise discriminante. In: Corrar, L. J.; Paulo, E. & Dias Filho, J. M. (Coord.). Análise multivariada: para cursos de administração, ciências contábeis e economica. São Paulo: Atlas. Mazzola, P. (2012, may). Financial reporting quality of family firms: the auditors’ perspective. Proceedings in Annual Congress European Accounting Association, Ljubljana, Slovenia, 35. McKEE, T. E. (2000). Developing a bankruptcy prediction model via rough sets theory. International Journal of Intelligent Systems in Accounting, Finance & Management, 9, 159-173. Mendes-Da-Silva, W. & Grzybovski, D. (2006). Efeitos da governança corporativa e da performance empresarial sobre o turnover de executivos no Brasil: comparando empresas familiares e não familiares. Revista de Administração Mackenzie, 7(1), 45-70. Moura, G. D. & Beuren, I. M. (2011). Conselho de Administração das Empresas de Governança Corporativa Listadas na BM&Fbovespa: análise à luz da entropia da informação da atuação independente. Revista de Ciências da Administração, 13(29), 1137. Pawlak, Z. (1982). Rough Sets. International Journal of Parallel Programming, 11(5), 341-356. 0180 10th International Conference on Information Systems and Technology Management – CONTECSI June, 12 to 14, 2013 - São Paulo, Brazil Pawlak, Z. & Slowinski, R. (1994). Decision Analysis using Rough Sets. International Transactions in Operational Research, 1(1), 107-114. Pereira, J. M. Gómez, F. D. & López, M. R. (2008). Aplicação da Teoria dos Rough Sets na Previsão do Fracasso Empresarial. Polytechnical Studies Review, 6(10), 199-220. Pinto, J. (2008). Núcleo declaratório contábil na análise da solvência de empresas do setor têxtil listadas na Bovespa. Dissertação de mestrado, Universidade Regional de Blumenau, Blumenau, SC, Brasil. Ramos, R. R.; Machado, A. O. & Costa, H. G. (2003, novembro). A Teoria dos conjuntos aproximativos na determinação do grau de coerência aplicado a um sistema de classificação para a qualidade em serviços. Anais Simpósio de Engenharia de Produção, 10. Samanez, C. P. &Menezes, A. de S. (1999, setembro). Análise de solvência de instituições bancárias: uma abordagem multivariada. Anais do Encontro da Associação Nacional de Pós-Graduação e Pesquisa em Administração, Foz do Iguaçu, PR, Brasil, 23. Silva, R. V.(2009). Atendimento às regras, princípios e práticas de governança em entidades fechadas de previdência complementar. Dissertação de mestrado, Centro SócioEconômico da Universidade Federal de Santa Catarina, Florianópolis, SC, Brasil. Silveira, A. D. M. (2004). Governança Corporativa e estrutura de propriedade: determinantes e relação com o desempenho das empresas no Brasil. Tese de doutorado, Faculdade de Economia, Administração e Contabilidade, Universidade de São Paulo, São Paulo, SP, Brasil. Silveira, A. D. M.; Barros, L. A. B. de C. & Famá, R. (2003). Estrutura de governança e valor das companhias abertas brasileiras. Revista de Administração de Empresas, 43(3), 50-64. Silveira, A. D. M. & Barros, A. B. de C. (2008). Determinantes da qualidade da governança corporativa das companhias abertas brasileiras. Revista de Administração, edição 61, 14(3), 1-29. Shleifer, A. & Vishny, R. (1997). A survey of corporate governance. The Journal of Finance, 52(2), 737-783. Vintilă, G. & Gherghina, Ş. C. (2012). An Empirical Investigation of the Relationship between Corporate Governance Mechanisms, CEO Characteristics and Listed Companies’ Performance. International Business Research, 5(10), 175-191. 0181