Teoria de Amostragem Teoria de amostragem A amostragem consiste em observar ou mensurar uma parte de uma população florestal para obter estimativas representativas de todo o restante desta mesma população. É uma forma de estimar, com confiança, parâmetros populacionais sem precisar mensurar toda a população. Deve-se entender a população como uma floresta ou forma de vegetação definida e com limites físicos conhecidos, ou seja, uma área especificamente determinada no espaço e no tempo, podendo abranger um país, um estado, uma região, um bioma, um determinado ecossistema ou um habitat específico, como uma mata de galeria dentro de uma região ou município, por exemplo, e um talhão de um plantio florestal. A amostra é uma parte da população e a unidade amostral é o espaço físico onde são medidas as características da floresta. Em geral, as unidades amostrais possuem área fixa, mas também podem ser de área variável, como no método de Prodan e na amostragem por pontos quadrantes. As unidades amostrais de área fixa podem variar em tamanho e em forma, sendo comumente denominadas de Parcelas. Amostragem por área fixa: tamanho e forma de parcelas O tamanho de uma unidade amostral deve variar em razão da estrutura da vegetação, sendo que o tamanho mínimo deve ser aquele que reflita a estrutura da comunidade/floresta, contendo as variações florísticas e estruturais da vegetação. Dessa forma, não dever ser muito grande, dificultando a repetição e orientação dentro da parcela, nem muito pequena, que não abranja a variação florística e estrutural da vegetação. Quanto à forma, as unidades amostrais podem ser circulares, retangulares, quadradas, em faixas. As parcelas circulares apresentam como vantagem em relação às demais, o fato de possuírem maior área em relação ao perímetro e, deste modo, diminui-se as chances de erro relacionados à inclusão e exclusão de árvores na amostragem. Erros associados às medições das árvores localizadas próximas às bordas da unidade amostral, o chamado de efeito de borda. Estas parcelas são mais difíceis de serem instaladas e medidas no campo e, por este motivo, não são muito utilizadas. As parcelas retangulares possuem maior efeito de borda, mas captam melhor os efeitos de gradientes ambientais e facilitam a orientação dos trabalhos dentro das mesmas. Por esses motivos as parcelas retangulares são as mais usuais. Representatividade amostral O número de unidades amostrais a serem mensuradas em uma floresta (ou o número de árvores a serem cubadas rigorosamente; ou ainda o número de árvores que terão os seus pares de altura e DAP medidos, para o ajuste de equações hipsométricas), deve ser baseado em um limite de erro estabelecido pelo pesquisador/mensurador, conforme um determinado nível de probabilidade, para a variável de interesse (densidade arbórea, DAP, altura, volume, cobertura do solo, etc). Através de uma pré-amostragem, denominada de amostragem piloto, calcula-se o número de unidades amostrais necessárias para compor a amostra representativa da população dentro do limite de erro estipulado ou estabelecido. Não existe um número mínimo de parcelas a serem consideradas na amostragem piloto ou pré-amostragem, mas deve-se observar alguns procedimentos padronizados por pesquisadores e que facilitam as análises, comparações e interpretação dos resultados. Em vegetação nativa, no Cerrado, para o cálculo da variância exige-se no mínimo 10 unidades amostrais, enquanto que para análises de regressão exige-se no mínimo 30 unidades amostrais, como preconizado no Manual de Parcelas Permanentes dos Biomas Cerrado e Pantanal (FELFILI et al. 2005). No caso das análises de regressão, há diferentes formas de avaliar se um modelo foi bem ajustado ou não. Avalia-se as distribuições gráficas dos resíduos, os coeficientes de determinação múltipla, os erros-padrão, a significância dos coeficientes de regressão parcial, assim como a multicolinearidade das variáveis, conforme recomendado por Drapper (1981) e Zar (2010). Os seguintes softwares podem ser utilizados no ajuste das equações: Microsoft Excell®, R® e PAST®. Estimativas dos parâmetros populacionais Para estimar os parâmetros da população considere a seguinte notação: X: variável de interesse (diâmetro, número de indivíduos, altura, volume); n: amostra. Média aritmética - 𝑥̅ É uma medida de posição e, portanto, indica o valor médio da população. n x X i 1 i n Variância - 𝑠𝑥2 Determina o grau de dispersão da variável de interesse em relação à sua média. 𝑠𝑥2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑛−1 Erro Padrão - 𝑠𝑥̅ Indica a precisão da média amostral em relação a todos os possíveis desvios-padrão (variância) na população de tamanho n. 𝑠𝑥̅ = √ 𝑠𝑥2 𝑛 Erro de amostragem - Ea Erro devido ao processo de amostragem. É estimado para um nível de probabilidade (1α). 𝐸𝑟𝑟𝑜 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 − 𝐸𝑎 = ±𝑡. 𝑠𝑥̅ 𝐸𝑟𝑟𝑜 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑜 (%) − 𝐸𝑟 = ± 𝑡. 𝑠𝑥̅ ∗ 100 𝑥̅ O valor de t é obtido na tabela de distribuição de t-Student para a probabilidade fixada e para os graus de liberdade da amostragem [número de unidades amostrais menos uma (n – 1)]. Intervalo de confiança para a média - IC Embora a média amostral seja a melhor estimativa da média paramétrica da população ela é apenas uma estimativa e, portanto, para inferir sobre a confiabilidade dessa estimativa é preciso calcular o Intervalo de Confiança – IC, que indica o seguinte: se todas as possíveis médias de tamanho n forem tomadas da população e se fosse calculado o Intervalo de Confiança para cada uma dessas amostras, X% desses intervalos de confiança conteriam a verdadeira média da população. Ou seja, para X% das amostras, o intervalo entre o limite inferior e o limite superior do IC incluirá a verdadeira média da população. O IC só garante que X% das médias amostrais estarão dentro do intervalo (IC), sendo X a probabilidade de confiança estabelecida. Geralmente X é estabelecido em Termos de Referência de Órgãos Ambientais ou pelo pesquisador e fica entre 90%, 95% e 99% de confiança (P). ICx tsx X x tsx P Estimativa para o total da população 𝑋̂ = 𝑁𝑥̅ Intervalo de confiança para o total IC Xˆ Nts x X Xˆ Nts x P Intensidade de amostragem A intensidade amostral é a razão entre o tamanho da amostra (n) e o tamanho da população, isto é, a razão entre o número de unidades amostrais que compõem a amostra e o número total de unidades amostrais da população (N). A intensidade amostral pode ser expressa também pela razão entre a área amostrada (a) e a área total da população (A). 𝑓= 𝑛 𝑎 𝑜𝑢 𝑓 = 𝑁 𝐴 Número ideal de unidades amostrais que devem compor uma amostra. A expressão abaixo pode ser utilizada para quantificar o número mínimo de unidades amostrais que devem compor a amostra: 𝑡 2 𝑠𝑥2 𝑛= 2 𝐸 𝐸 = (𝐿𝐸. 𝑥̅ ) LE = Limite de erro de amostragem admitido, geralmente 10%.