RELATÓRIO DE REGULAÇÃO 2014 ANEXO 4 APLICAÇÃO DO TESTE DE ADERÊNCIA DO QUI-QUADRADO: ABORDAGEM TEÓRICA DEFINIÇÃO O presente teste tem por base a distribuição estatística do Qui-Quadrado e, no essencial, pretende medir a diversidade das categorias de variáveis nominais, neste caso, as variáveis: Fonte, Tema e Ator. É considerado um dos testes paramétricos19 mais adequados para o estudo de variáveis nominais. ABORDAGEM TEÓRICA Consideremos uma tabela com k frequências K ≥ 2: ›K é o total de categorias da variável nominal estudada. ›Número de peças observadas em cada categoria: O1,O2,...,Ok ›A soma do número de peças observadas em cada categoria é igual ao número total de peças ›Número de peças esperadas em cada categoria: E1,E2,...,Ek ›A soma do número de peças esperadas em cada categoria é igual ao número total de peças Na presente análise, pretende-se testar a diversidade. Desta forma, o número esperado de peças em cada categoria deverá assumir valores iguais. Sendo assim, a diversidade será maximizada se as peças estiverem uniformemente distribuídas. As probabilidades associadas a cada uma das k categorias serão dadas por: pk probabilidade associada à categoria k Passemos a descrever brevemente o teste: Definindo as hipóteses, temos20: 108 ERC • VOLUME 2 Ha: A igualdade anterior não é verificada O teste de aderência do qui-quadrado é construído a partir da seguinte estatística: Ei = Número esperado de peças na categoria i da variável. Na prática, esta estatística teste mede os desvios dos Oi em relação aos Ei Se estes desvios forem relevantes, a variável não segue a distribuição proposta, sendo rejeitada a hipótese nula. O valor mínimo da estatística, para o caso particular da uniformidade, é obtido da seguinte forma: Se para Então, o valor da estatística teste é mínimo e é dado por: Define-se, o número inteiro mais próximo de O valor é aproximadamente zero porque, em geral, os Oi são inteiros e os Ei são fracionários. O valor máximo da estatística21 é obtido da seguinte forma: Se existir um Oi = n Z ∈ {1,2,...,k} e os restantes Oi = 1,2,...,k k ≠ z Então, o valor da estatística teste é máximo e é dado por: Para este caso, teríamos diversidade mínima, ou seja, todas as categorias da variável estudada apresentavam zero peças, à exceção de uma que concentrava todas as peças. Por fim, é importante referir que a distribuição do qui-quadrado está tabelada e o resultado do teste tem na sua base a comparação entre valores experimentais e teóricos. 19 Os testes não paramétricos têm a vantagem de não depender dos parâmetros populacionais (média, variância, kurtosis e assimetria). A estatística contemporânea atribui um crescente relevo aos testes não paramétricos que, embora mais frágeis do ponto de vista de robustez teórica, são aplicáveis a um conjunto de realidades mais vasto para o qual a estatística clássica não apresentava soluções de análise. 20 As peças estão uniformemente distribuídas pelas categorias das variáveis. 21Os valores de que Oi maximizam a estatística teste são obtidos derivando a sua expressão em ordem aos Oi i = 1, 2, ..., k e igualando a zero.