Governo do Estado do Rio Grande do Norte Secretaria de Estado da Educação e da Cultura - SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE – UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS – FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS – DECB Criado pela Resolução do CONSUNI nº 08/97 de 09/12/97 e implantado em 03/01/2000 Fone: (0xx84) 3315-2237 e-mail:[email protected] Disciplina: Bioexperimentação Código: 0803002-1 Carga Horária: 60h/a Professor: Dr. Iron Macêdo Dantas Matrícula - 15946 Curso: 1017100 - Ciências Biológicas – Bacharelado Período: 6º Turma: Única Ano: 2013.1 Semestre: 1 Turno: Vespertino AULA 01 CONCEITOS BÁSICOS DA ESTATÍSTICA 1. Estatística Segundo Viali (2002) a estatística pode ser definida como A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores decisões. Neste sentido a estatística tem sido uma excelente ferramenta para a diferentes campos como política, economia, gestão, educação, marketing, etc. No campo da pesquisa científica, esta ciência tem uma importância fundamental justamente no que se diz respeito a própria definição da estatística, ou seja, coletar, organizar, apresentar, analisar e interpretar dados numéricos além de oferecer ao pesquisador uma confiança nos seus resultados que poderá ser estimada. Divisão da estatística. A estatística academicamente é dividida em duas partes: Descritiva: Que utiliza dos procedimentos de usados para organizar, classificar, resumir, descrever e apresentar dados numéricos que seja em forma de tabelas, gráficos ou outros recursos visuais, como também os cálculos dos parâmetros desses dados. Analítica ou inferencial: Que tem como objetivo tirar conclusões estabelecidas através de hipóteses em função de dados observados em experimentos e posteriormente elaborar inferências sobre a população com base nos resultados observados. Ainda divide-se a estatística de acordo com sua atuação como: Estatística básica: Abrangendo a estatística descritiva Estatística aplicada: Envolvendo a estatística analítica. Outras classificações também são encontradas de acordo com a área de atuação. Assim teremos: bioestatística, estatística social, estatística médica, bioexperimentação, etc. A bioexperimentação tem sua importância para a pesquisa biológica, auxiliando o biólogo na compreensão e condução de experimentos científicos e na publicação de artigos científicos nas áreas específicas. Para que o biólogo conduza, colete e avalie seus experimentos corretamente é necessário além do planejamento dos métodos da pesquisa, também o planejamento estatístico. Neste sentido esta disciplina nos propomos estudar as ferramentas estatísticas necessárias para o planejamento, coleta e análise e apresentação dos dados experimentais. Conceitos básicos a serem utilizados nesta disciplina. a. População: Segundo Arango (2001), população é a totalidade de elementos ou de um atributo dos elementos referentes a um conjunto determinado, ou seja é um conjunto de elementos que têm, em comum determinada característica. Como exemplo a população de Mossoró, (elemento das pessoas de Mossoró), a população de carros registrados no DETRAN-RN, população de ratos no biotério da UERN. b. Amostra: é todo subconjunto não vazio e com menor número de alementos do que o conjunto definido como população (BARBOSA, 1999). Variáveis são características que são medidas, controladas ou manipuladas em uma pesquisa. Diferem em muitos aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas. Variáveis podem ser classificadas da seguinte forma: 1. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. 1. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. 2. Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. Unidade experimental ou parcela: É a unidade que vai receber o tratamento e onde serão coletados os dados que deverão refletir seu efeito (BANZATO E KRONKA, 1989). Como exemplo podemos citar com uma unidade experimental uma área de 1 m x 1 m, uma placa de Petri, ou um conjunto de 10 placas de Petri, uma planta, um grupo de 5 ratos, etc. Experimento: É um trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos (BANZATO E KRONKA, 1989). Delineamento experimental: É o plano utilizado na experimentação e implica na forma como os tratamentos serão distribuídos e como será a coleta e interpretação dos dados. Como exemplo podemos cita delineamento inteiramente casualizado (DIC), delineamento em blocos casualizados (DBC), delineamento em parcelas sub-divididas. PARÂMETRO São características estatísticas que descrevem as populações. Alguns destes parâmetros são chamados de medidas de posição e outros de medidas de dispersão MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL: Através destes parâmetros temos idéia de como os dados se agrupam em torno de um valor central Média, Mediana e Moda MÉDIA: É de longe o parâmetro de medida de posição mais utilizado, nos dá uma idéia individual da variável estudada a partir dos dados de uma amostra ou de população. x ou É representada por m e calculada de seguinte forma: supondo uma amostra aleatória de tamanho n, com x1 , x2 , … xn n ∑ xi m= x = i=1 n no caso de média verdadeira, que é obtida de todos os dados de uma população esta é representada N por: ∑ xi m= X = i=1 , onde N representa o número de dados da população. N Proprieades da média aritmética: 1. Seja uma série X1, X2 … Xn, a soma algébrica dos desvios entre seus dados e a média aritmética X, é igual a zero 2. Somando-se uma constante qualquer (alfa) a todos os valores da série ou subtraíndo-se esta constante a todos os valores, a média aritmética ficará acrescida ou diminuída desta constante 3. Multiplicando-se ou dividindo-se uma constante (alfa) diferente de zero or todos os valores da série, a média aritmética ficará multiplicada ou dividida por esta constante. VANTAGENS DO USO DA MÉDIA 1. É a medida de tendência central mais conhecida e de maior emprego 2. O cálculo é muito fácil e compreensível 3. Pode-se obter médias de números relativos 4. Pode ser utilizada para comparação entre dois fenômenos 5. É sempre possível encontrar a média aritmética 6. Seu valor é único DESVANTAGENS DO USO DA MÉDIA 1. É fortemente influenciada por valores altos e baixos 2. Nem sempre tem existência real (nem sempre faz parte com conjunto de dados) 3. Não pode ser calculada para séries com dados ilimitados ou indeterminados. É necessário que se definam todos os valores do conjunto e o seu tamanho. MEDIANA A mediana de um conjunto ordenado de dados é o valor que ocupa a posição central (podendo pertencer ao conjunto de dados ou não). Sejam as observações: valores centrais, isto é md = x 1 , x 2 , … x n já ordenadas, se n é par e n=2k, então a mediana será a média entre os dois x k x k1 quando n é impar e n=2k+1 a media será m d =x k 1 2 VANTAGENS DO USO DA MEDIANA 1. Não depende de todos os valores da série, podendo não se alterar com a mudança de alguns deles. 2. Não é influenciada por valores extremos 3. Pode ser calculada para séries ilimitadas DESVANTAGENS DO USO DA MEDIANA 1. Séries que não tem distribuição normal, o seu valor fica deslocado da média MODA É o valor ou valores que ocorre com maior frequencia na amostras VANTAGENS DO USO DA MODA 1. Não depende de todos os valores da série, não se alterando com a modificação de alguns desses; 2. Não é influenciada por valores altos ou baixos; 3. Sempre tem existência real, isto é, sempre está contida entre os valores da série 4. Pode ser calculada para séries com limites indeterminados DESVANTAGENS DO USO DA MODA 1. Não é aplicável a um pequeno número de dados observados; 2. Nem sempre pode ser calculada (pode ter série amodal) 3. Pode existir mais de uma moda por série de dados (série multimodal) MEDIDAS DE DISPERSÃO OU MEDIDAS DE VARIAÇÃO Medem o grau com que os dados tendem a se distribuirem em torno de um valor central, que geralmente é a média aritmética. Como medidas mais comuns temos amplitude total, variância, desvio padrão, erro padrão da média e coeficiente de variação. 1. AMPLITUDE TOTAL É a diferença entre o menor e o maior valor de uma série de dados VANTAGENS DO USA DA AMPLITUDE TOTAL 1. Cálculo muito fácil 2. Sempre é possível de obter 3. Dá ideia da variação dos dados de forma imediata DESVANTAGENS DO USO DA AMPLITUDE TOTAL 1. Baseia-se em, apenas nos valores extremos da distribuição 2. Não representa precisamente a maneira com os valores são distribuídos na série de dados 2. VARIÂNCIA É a média aritmética dos quadrados dos desvios em relação à média aritmética de uma série de dados. A estimativa da variância de população é calculada da seguinte forma: n 2 s= 2 ∑ x i −m i =1 . Como os dados constituem uma amostra e os desvios são tomados em relação à estimativa da n n , a estimativa da variância fica média m 2 s= 2 ∑ x i −m i=1 , onde n−1 a média aritmética da série e n o número de dados contidos na série. Outra forma de estimar a variância é é x i é o dados observado na série de dados, m n n 2 ∑ x 2i − s= ∑ x 1 2 i =1 i=1 n n−1 ALGUMAS PROPRIEDADES DA VARIÂNCIA 1. Somando-se cada valor 2. x i , uma constante k, a variância não se altera; Multiplicando-se cada valor x i , por uma constante k , a variância fica multiplicada por k 2 VANTAGENS DO USO DA VARIÂNCIA 1. É uma medida de dispersão que leva em conta todas as observações, sendo considerada a melhor medida de dispersão 2. Fácil transformação para o cálculo do desvio padrão DESVANTAGENS DO USO DA VARIÂNCIA 1. Tem seu resultado apresentado em unidade quadrática dificultando um pouco a interpretação DESVIO PADRÃO O desvio padrão é uma medida de dispersão que assim como a variância leva em consideração todos os dados de uma série. Porém diferentemente da variância sua medida não é quadrática, utiliza a mesma unidade dos dados originais. O cálculo do desvio padrão é realizado extraindo a raiz quadrada da variância. Para população= = 2 Para amostra s= s2 VANTAGENS DO DESVIO PADRÃO 1. É uma medida de dispersão que leva em conta todas as observações, porém utiliza a mesma unidade dos dados. ERRO PADRÃO DA MÉDIA Se em vez de uma amostra tivéssemos várias, provenientes de uma mesma população, obteríamos também diversas estimativas da média, e provavelmente distintas entre si. O erro padrão da média indica a média verdadeira em um intervalo com uma precisão estabelecida. Pode ser calculada por: s m= s s2 2 ou s m= onde s é o desvio padrão, s é a variância e n é o número de dados. n n COEFICIENTE DE VARIAÇÃO É uma medida de dispersão que expressa percentualmente o desvio padrão por unidade da média: CV = 100 . S , são expressos na mesma unidade de dados, o coeficiente de variação é um número Como s e m m abstrato, isto é, não tem unidade e portanto é expresso em porcentagem da média. Os valores do CV esperados para ensaios em laboratórios são inferiores a 10%, em ensaios de campo admite-se CV entre 10 e 20%, nos ensaios envolvendo pesquisas entomológicas é comum encontrar CV em torno de 30%.