Tamanho de amostras - geste

Propaganda
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
ENGENHARIA MECÂNICA
ENG03108 - MEDIÇÕES TÉRMICAS
Energia e Fenômenos de Transporte
Prof. Paulo S. Schneider
www.geste.mecanica.ufrgs.br
[email protected]
Tamanho de amostras
Fundamentos
A capacidade de uma amostra de seguir uma distribuição estatística acaba determinando sua
classificação como grande ou pequena. As grandes amostras são aquelas onde se pode verificar a
densidade de probabilidade de forma definida, seguindo melhor as funções de distribuição adotadas,
o que não se verifica nas pequenas amostras.
Grandes amostras
Não há unanimidade na indicação do número de eventos que define uma grande amostra. A
norma ASHRAE 41.5-75 (1975) indica 20 eventos (n>20), enquanto que Triola (1998) já indica 30
eventos (n>30). Isso se deve ao comportamento dos níveis de confiança associados ao valor do desvio padrão σ em função do número de graus de liberdade ν, que passa a variar de forma importante
quando o número de eventos é inferior ao valor limite citado acima. Esse comportamento é mostrado na figura 1
Figura 1- Níveis de confiança P em função dos graus de liberdade ν (Fonte: Vuolo, 1998)
_
Nas grandes amostras, o valor médio x é a melhor estimativa da média populacional µ, ou
valor verdadeiro. Associa-se ao valor da média um intervalo de confiança, ou incerteza, que obedece a uma dada probabilidade.
Medições Térmicas – Universidade Federal do Rio Grande do Sul - Prof. Paulo Schneider
As equações aplicáveis para grandes e pequenas amostras são:
média aritmética
x=
∑x
i
n
desvio padrão para grandes amostras
 ( x − x )2 
σ =  ∑ i

n


(1)
1/ 2
(2)
e o desvio padrão experimental ou convencional
 ∑ ( xi − x ) 2 
s=


n −1


1/ 2
(3)
Quando consider-se uma grande amostra, a determinação do seu tamanho é dada pelo cálculo da incerteza da média
u_ =
x
kσ
n
(4)
Dela pode-se isolar o valor do número de eventos n, tal que

 kσ
n=
 u_
 x




2
(5)
Pequenas amostras- distribuição t de Student
Para amostras com número de eventos inferior a 30 ou mesmo 20, o valor do desvio padrão
não é mais conhecido estatisticamente, e passa-se a empregar a Equação 3, onde o número de eventos do denominador n-1 é conhecido por graus de liberdade ν. A subtração de um evento numa pequena amostra pode ser compreendida pelo fato que a média é empregada para o cálculo de grandezas estatísticas, e portanto está comprometida.
Como o desvio padrão não é conhecido, não estamos mais tratando com uma distribuição
gaussiana. A distribuição que melhor se adapta para esse caso é a distribuição t de Student, desenvolvida por William Gosset (1876-1937) que trabalhava para a cervejaria Guinness. Essa distribuição tem as seguintes propriedades
•
•
•
varia conforme o nº de eventos
tem forma simétrica (sino)
aproxima-se da distribuição de Gauss para ν > 30
A incerteza do valor médio de uma pequena amostra é dada por
Medições Térmicas – Universidade Federal do Rio Grande do Sul - Prof. Paulo Schneider
u_ =
x
ts
n
(6)
onde t é o valor da distribuição para uma dada confiabilidade e um número de graus de liberdade ν,
s o desvio para um número de graus de liberdade ν, e n é o número total de eventos da amostra.
Tabela 3 - Valores de t-student para diferentes níveis de confiabilidade
Nível de confiabilidade
ν
68,27%
95,45%
99,73%
1
1,84
13,97
235,80
2
1,32
4,53
19,21
3
1,20
3,31
9,22
4
1,14
2,87
6,62
5
1,11
2,65
5,51
6
1,09
2,52
4,90
7
1,08
2,43
4,53
8
1,07
2,37
4,28
9
1,06
2,32
4,09
10
1,05
2,28
3,96
15
1,03
2,18
3,59
20
1,03
2,13
3,42
25
1,02
2,11
3,33
30
1,02
2,09
3,27
40
1,01
2,06
3,20
50
1,01
2,05
3,16
1,00
2,00
3,00
∞
Deve-se observar que com este procedimento, ao se estimar a incerteza de medição, na realidade o que se faz é estimar o desvio padrão da população a partir do desvio padrão da amostra,
que subestima o primeiro. O valor estimado, portanto, é o que se deve usar em futuras medições,
com um número infinito de graus de liberdade.
A média da distribuição, também chamada de momento de la ordem, pode ser teoricamente
calculada quando o número de termos da população é muito grande. O mesmo acontece para o desvio padrão, também chamado de momento de 2a ordem . Entretanto, para os casos reais, a amostra é
finita e o número de termos é pequeno. Deve-se, portanto, determinar os parâmetros estatísticos de
medição a partir de um número pequeno de valores. Assim, a média será estimada e não determinada. Novamente, a estatística mostra que a melhor estimativa da média ( x ) e do desvio padrão da
amostra (s) são dadas respectivamente pelas expressões 1 e 3 já apresentadas. A média na Equação
1 pode ser determinada minimizando o valor de s na Eq. (3), em relação a ( x ) , isto é, diferenciando
s em relação a ( x ) , e igualando a zero.
Medições Térmicas – Universidade Federal do Rio Grande do Sul - Prof. Paulo Schneider
Exercícios
1- Uma dada substância na fase líquida encontra-se em equilíbrio térmico em um banho termostático. Sua temperatura é medida por um termômetro de exatidão de ±0,5 ºC, informado pelo seu fabri_
cante. Quantas medidas serão necessárias para que se possa dizer que a temperatura média t dessa
_
_
substância será expressa como t = t ± 0,2 º C , com 5% de nível de significância (ou 95% de confiança)?
a) Trate o problema como se fosse uma grande amostra
b) Trate agora o problema como uma pequena amostra
2- Deseja-se expressar o valor médio de uma medida de temperatura realizada com o termopar tipo
K (ver folha de dados a seguir) com aproximadamente 100% de probabilidade para a faixa de
120ºC, com metade da incerteza que o sensor exibe para essa faixa.
a) Quantas medidas seriam necessárias, empregando a noção de média de grande amostra?
b) Caso o valor encontrado para n seja inferior a 20 eventos, esse resultado caracteriza a pequena
amostra. Caso não se disponha de uma tabela para cálculo de pequenas amostras, indique o que devia mudar no resultado de grande amostra para que ele pudesse representar o de pequena amostra.
c) Agora, faça esse cálculo e compare o resultado com aquela estimado em b)
Download