abordagem teórica

Propaganda
RELATÓRIO DE REGULAÇÃO 2014
ANEXO 4
APLICAÇÃO DO TESTE DE ADERÊNCIA DO QUI-QUADRADO:
ABORDAGEM TEÓRICA
DEFINIÇÃO
O presente teste tem por base a distribuição estatística do Qui-Quadrado
e, no essencial, pretende medir a diversidade das categorias de variáveis nominais, neste caso, as variáveis: Fonte, Tema e Ator.
É considerado um dos testes paramétricos19 mais adequados para
o estudo de variáveis nominais.
ABORDAGEM TEÓRICA
Consideremos uma tabela com k frequências K ≥ 2:
›K é o total de categorias da variável nominal estudada.
›Número de peças observadas em cada categoria: O1,O2,...,Ok
›A soma do número de peças observadas em cada categoria é igual
ao número total de peças
›Número de peças esperadas em cada categoria: E1,E2,...,Ek
›A soma do número de peças esperadas em cada categoria é igual
ao número total de peças
Na presente análise, pretende-se testar a diversidade. Desta forma,
o número esperado de peças em cada categoria deverá assumir
valores iguais. Sendo assim, a diversidade será maximizada se as
peças estiverem uniformemente distribuídas.
As probabilidades associadas a cada uma das k categorias serão
dadas por:
pk probabilidade associada à categoria k
Passemos a descrever brevemente o teste:
Definindo as hipóteses, temos20:
108
ERC
•
VOLUME 2
Ha: A igualdade anterior não é verificada
O teste de aderência do qui-quadrado é construído a partir da seguinte
estatística:
Ei = Número esperado de peças na categoria i da variável.
Na prática, esta estatística teste mede os desvios dos Oi em relação
aos Ei Se estes desvios forem relevantes, a variável não segue a
distribuição proposta, sendo rejeitada a hipótese nula.
O valor mínimo da estatística, para o caso particular da uniformidade,
é obtido da seguinte forma:
Se para
Então, o valor da estatística teste é mínimo e é dado por:
Define-se,
o número inteiro mais próximo de
O valor é aproximadamente zero porque, em geral, os Oi são inteiros
e os Ei são fracionários.
O valor máximo da estatística21 é obtido da seguinte forma:
Se existir um Oi = n Z ∈ {1,2,...,k} e os restantes
Oi = 1,2,...,k k ≠ z
Então, o valor da estatística teste é máximo e é dado por:
Para este caso, teríamos diversidade mínima, ou seja, todas as categorias da variável estudada apresentavam zero peças, à exceção
de uma que concentrava todas as peças.
Por fim, é importante referir que a distribuição do qui-quadrado está
tabelada e o resultado do teste tem na sua base a comparação entre
valores experimentais e teóricos.
19 Os testes não paramétricos têm a vantagem de não depender dos parâmetros populacionais (média, variância, kurtosis e assimetria). A estatística contemporânea atribui um
crescente relevo aos testes não paramétricos que, embora mais frágeis do ponto de vista de robustez teórica, são aplicáveis a um conjunto de realidades mais vasto para o
qual a estatística clássica não apresentava soluções de análise.
20 As peças estão uniformemente distribuídas pelas categorias das variáveis.
21Os valores de que Oi maximizam a estatística teste são obtidos derivando a sua expressão em ordem aos Oi i = 1, 2, ..., k e igualando a zero.
Download