UERN

Propaganda
Governo do Estado do Rio Grande do Norte
Secretaria de Estado da Educação e da Cultura - SEEC
UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE – UERN
FACULDADE DE CIÊNCIAS EXATAS E NATURAIS – FANAT
DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS – DECB
Criado pela Resolução do CONSUNI nº 08/97 de 09/12/97 e implantado em 03/01/2000
Fone: (0xx84) 3315-2237
e-mail:[email protected]
Disciplina: Bioexperimentação
Código: 0803002-1 Carga Horária: 60h/a
Professor: Dr. Iron Macêdo Dantas
Matrícula - 15946
Curso: 1017100 - Ciências Biológicas – Bacharelado Período: 6º
Turma: Única
Ano: 2013.1
Semestre: 1
Turno: Vespertino
AULA 01
CONCEITOS BÁSICOS DA ESTATÍSTICA
1.
Estatística
Segundo Viali (2002) a estatística pode ser definida como A ciência de coletar, organizar, apresentar, analisar e
interpretar dados numéricos com o objetivo de tomar melhores decisões. Neste sentido a estatística tem sido uma
excelente ferramenta para a diferentes campos como política, economia, gestão, educação, marketing, etc. No campo
da pesquisa científica, esta ciência tem uma importância fundamental justamente no que se diz respeito a própria
definição da estatística, ou seja, coletar, organizar, apresentar, analisar e interpretar dados numéricos além de oferecer
ao pesquisador uma confiança nos seus resultados que poderá ser estimada.
Divisão da estatística.
A estatística academicamente é dividida em duas partes:
Descritiva: Que utiliza dos procedimentos de usados para organizar, classificar, resumir, descrever e apresentar dados
numéricos que seja em forma de tabelas, gráficos ou outros recursos visuais, como também os cálculos dos parâmetros
desses dados.
Analítica ou inferencial: Que tem como objetivo tirar conclusões estabelecidas através de hipóteses em função de dados
observados em experimentos e posteriormente elaborar inferências sobre a população com base nos resultados
observados.
Ainda divide-se a estatística de acordo com sua atuação como:
Estatística básica: Abrangendo a estatística descritiva
Estatística aplicada: Envolvendo a estatística analítica.
Outras classificações também são encontradas de acordo com a área de atuação. Assim teremos: bioestatística,
estatística social, estatística médica, bioexperimentação, etc.
A bioexperimentação tem sua importância para a pesquisa biológica, auxiliando o biólogo na compreensão e condução
de experimentos científicos e na publicação de artigos científicos nas áreas específicas.
Para que o biólogo conduza, colete e avalie seus experimentos corretamente é necessário além do planejamento
dos métodos da pesquisa, também o planejamento estatístico. Neste sentido esta disciplina nos propomos estudar as
ferramentas estatísticas necessárias para o planejamento, coleta e análise e apresentação dos dados experimentais.
Conceitos básicos a serem utilizados nesta disciplina.
a. População: Segundo Arango (2001), população é a totalidade de elementos ou de um atributo dos elementos
referentes a um conjunto determinado, ou seja é um conjunto de elementos que têm, em comum determinada
característica. Como exemplo a população de Mossoró, (elemento das pessoas de Mossoró), a população de carros
registrados no DETRAN-RN, população de ratos no biotério da UERN.
b. Amostra: é todo subconjunto não vazio e com menor número de alementos do que o conjunto definido como
população (BARBOSA, 1999).
Variáveis são características que são medidas, controladas ou manipuladas em uma pesquisa. Diferem em muitos
aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas.
Variáveis podem ser classificadas da seguinte forma:
1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja,
apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas.
1. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o
resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de
cigarros fumados por dia.
2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na
reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de
algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade.
Unidade experimental ou parcela:
É a unidade que vai receber o tratamento e onde serão coletados os dados que deverão refletir seu efeito
(BANZATO E KRONKA, 1989). Como exemplo podemos citar com uma unidade experimental uma área de 1 m x 1
m, uma placa de Petri, ou um conjunto de 10 placas de Petri, uma planta, um grupo de 5 ratos, etc.
Experimento: É um trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a
comparação dos efeitos dos tratamentos (BANZATO E KRONKA, 1989).
Delineamento experimental: É o plano utilizado na experimentação e implica na forma como os tratamentos serão
distribuídos e como será a coleta e interpretação dos dados. Como exemplo podemos cita delineamento inteiramente
casualizado (DIC), delineamento em blocos casualizados (DBC), delineamento em parcelas sub-divididas.
PARÂMETRO
São características estatísticas que descrevem as populações. Alguns destes parâmetros são chamados de
medidas de posição e outros de medidas de dispersão
MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL: Através destes parâmetros temos idéia de como os dados
se agrupam em torno de um valor central
Média, Mediana e Moda
MÉDIA:
É de longe o parâmetro de medida de posição mais utilizado, nos dá uma idéia individual da variável estudada a partir
dos dados de uma amostra ou de população.
x
 ou 
É representada por m
e calculada de seguinte forma: supondo uma amostra aleatória de tamanho n, com
x1 , x2 , … xn
n
∑ xi
m=
 x =
i=1
n
no caso de média verdadeira, que é obtida de todos os dados de uma população esta é representada
N
por:
∑ xi
m= X =
i=1
, onde N representa o número de dados da população.
N
Proprieades da média aritmética:
1.
Seja uma série X1, X2 … Xn, a soma algébrica dos desvios entre seus dados e a média aritmética X, é igual a
zero
2.
Somando-se uma constante qualquer (alfa) a todos os valores da série ou subtraíndo-se esta constante a todos
os valores, a média aritmética ficará acrescida ou diminuída desta constante
3.
Multiplicando-se ou dividindo-se uma constante (alfa) diferente de zero or todos os valores da série, a média
aritmética ficará multiplicada ou dividida por esta constante.
VANTAGENS DO USO DA MÉDIA
1.
É a medida de tendência central mais conhecida e de maior emprego
2.
O cálculo é muito fácil e compreensível
3.
Pode-se obter médias de números relativos
4.
Pode ser utilizada para comparação entre dois fenômenos
5.
É sempre possível encontrar a média aritmética
6.
Seu valor é único
DESVANTAGENS DO USO DA MÉDIA
1.
É fortemente influenciada por valores altos e baixos
2.
Nem sempre tem existência real (nem sempre faz parte com conjunto de dados)
3.
Não pode ser calculada para séries com dados ilimitados ou indeterminados. É necessário que se definam todos
os valores do conjunto e o seu tamanho.
MEDIANA
A mediana de um conjunto ordenado de dados é o valor que ocupa a posição central (podendo pertencer ao conjunto de
dados ou não).
Sejam as observações:
valores centrais, isto é
md =
x 1 , x 2 , … x n já ordenadas, se n é par e n=2k, então a mediana será a média entre os dois
x k  x k1
quando n é impar e n=2k+1 a media será m d =x k 1
2
VANTAGENS DO USO DA MEDIANA
1.
Não depende de todos os valores da série, podendo não se alterar com a mudança de alguns deles.
2.
Não é influenciada por valores extremos
3.
Pode ser calculada para séries ilimitadas
DESVANTAGENS DO USO DA MEDIANA
1.
Séries que não tem distribuição normal, o seu valor fica deslocado da média
MODA
É o valor ou valores que ocorre com maior frequencia na amostras
VANTAGENS DO USO DA MODA
1.
Não depende de todos os valores da série, não se alterando com a modificação de alguns desses;
2.
Não é influenciada por valores altos ou baixos;
3.
Sempre tem existência real, isto é, sempre está contida entre os valores da série
4.
Pode ser calculada para séries com limites indeterminados
DESVANTAGENS DO USO DA MODA
1.
Não é aplicável a um pequeno número de dados observados;
2.
Nem sempre pode ser calculada (pode ter série amodal)
3.
Pode existir mais de uma moda por série de dados (série multimodal)
MEDIDAS DE DISPERSÃO OU MEDIDAS DE VARIAÇÃO
Medem o grau com que os dados tendem a se distribuirem em torno de um valor central, que geralmente é a
média aritmética. Como medidas mais comuns temos amplitude total, variância, desvio padrão, erro padrão da média e
coeficiente de variação.
1.
AMPLITUDE TOTAL
É a diferença entre o menor e o maior valor de uma série de dados
VANTAGENS DO USA DA AMPLITUDE TOTAL
1.
Cálculo muito fácil
2.
Sempre é possível de obter
3.
Dá ideia da variação dos dados de forma imediata
DESVANTAGENS DO USO DA AMPLITUDE TOTAL
1.
Baseia-se em, apenas nos valores extremos da distribuição
2.
Não representa precisamente a maneira com os valores são distribuídos na série de dados
2.
VARIÂNCIA
É a média aritmética dos quadrados dos desvios em relação à média aritmética de uma série de dados.
A estimativa da variância de população é calculada da seguinte forma:
n
2
s=
 2
∑  x i −m
i =1
. Como os dados constituem uma amostra e os desvios são tomados em relação à estimativa da
n
n
 , a estimativa da variância fica
média  m
2
s=
2

∑  x i −m
i=1
, onde
n−1
a média aritmética da série e n o número de dados contidos na série.
Outra forma de estimar a variância é
 é
x i é o dados observado na série de dados, m
n
n
2
∑ x 2i −
s=
 ∑ x 1
2
i =1
i=1
n
n−1
ALGUMAS PROPRIEDADES DA VARIÂNCIA
1. Somando-se cada valor
2.
x i , uma constante k, a variância não se altera;
Multiplicando-se cada valor
x i , por uma constante k , a variância fica multiplicada por k 2
VANTAGENS DO USO DA VARIÂNCIA
1.
É uma medida de dispersão que leva em conta todas as observações, sendo considerada a melhor medida de
dispersão
2.
Fácil transformação para o cálculo do desvio padrão
DESVANTAGENS DO USO DA VARIÂNCIA
1.
Tem seu resultado apresentado em unidade quadrática dificultando um pouco a interpretação
DESVIO PADRÃO
O desvio padrão é uma medida de dispersão que assim como a variância leva em consideração todos os dados
de uma série. Porém diferentemente da variância sua medida não é quadrática, utiliza a mesma unidade dos dados
originais.
O cálculo do desvio padrão é realizado extraindo a raiz quadrada da variância.
Para população= = 
2
Para amostra s= s2
VANTAGENS DO DESVIO PADRÃO
1.
É uma medida de dispersão que leva em conta todas as observações, porém utiliza a mesma unidade dos dados.
ERRO PADRÃO DA MÉDIA
Se em vez de uma amostra tivéssemos várias, provenientes de uma mesma população, obteríamos também
diversas estimativas da média, e provavelmente distintas entre si. O erro padrão da média indica a média verdadeira em
um intervalo com uma precisão estabelecida. Pode ser calculada por:
s  m=


s
s2
2

ou s  m=
onde s é o desvio padrão, s é a variância e n é o número de dados.
n
n
COEFICIENTE DE VARIAÇÃO
É uma medida de dispersão que expressa percentualmente o desvio padrão por unidade da média:
CV =
100 . S
 , são expressos na mesma unidade de dados, o coeficiente de variação é um número
Como s e m
m

abstrato, isto é, não tem unidade e portanto é expresso em porcentagem da média.
Os valores do CV esperados para ensaios em laboratórios são inferiores a 10%, em ensaios de campo admite-se CV
entre 10 e 20%, nos ensaios envolvendo pesquisas entomológicas é comum encontrar CV em torno de 30%.
Download