4º INQUÉRITO NACIONAL DE SAÚDE UTILIZAÇÃO DA BASE DE DADOS – NOTA METODOLÓGICA 1. Âmbito do inquérito A população abrangida por este inquérito é constituída pelo conjunto dos indivíduos que residiam em alojamentos familiares no País, à data da realização das entrevistas. Excluiu-se do inquérito a população residente em alojamentos colectivos. O trabalho de campo para recolha dos dados decorreu entre Fevereiro de 2005 e Janeiro de 2006. 2. Desenho da amostra A amostra para o INS foi seleccionada a partir da Amostra-Mãe (AM), que é uma amostra de unidades de alojamento destinada a servir de base de amostragem dos inquéritos a realizar pelo Instituto Nacional de Estatística (INE) junto das famílias. 2.1. Amostra-Mãe A Amostra-Mãe foi seleccionada a partir dos dados do Recenseamento da População e Habitação de 2001 (Censos2001), utilizando-se para o efeito um esquema de amostragem complexo, que inclui estratificação e selecção sistemática de conglomerados. O nível da estratificação utilizado na construção da AM foi o nível III da Nomenclatura das Unidades Territoriais para Fins Estatísticos (NUTS), embora em algumas das regiões se tenha ainda efectuado uma sub-estratificação para garantir a selecção de unidades de alojamento nessas sub-regiões. Os conglomerados são áreas constituídas por uma ou mais secções estatísticas dos Censos 2001, tendo um mínimo de 240 unidades de alojamento de residência principal. As áreas foram definidas mediante a condição de que secções pertencentes à mesma área sejam contíguas e não ultrapassem os limites do concelho a que pertencem. Posteriormente, em cada estrato e numa única etapa, procedeu-se à selecção sistemática de conglomerados, com probabilidade proporcional ao número de alojamentos de residência principal. A AM é constituída por 1408 áreas, tendo-se listado em cada uma todos os alojamentos familiares, sendo cada um deles referenciado pela respectiva morada e nome do representante. Os alojamentos colectivos, que compreendem os hotéis e similares e ainda as convivências (apoio social, educação, militar, prisional, religiosa, saúde, trabalho e outras) foram excluídos da AM e como tal, não fazem parte da amostra do INS. 2.2. Amostra do INS A amostra do INS foi seleccionada a partir da AM introduzindo uma nova etapa no processo de selecção. Assim, as unidades da primeira etapa (unidades primárias) correspondem às áreas da AM, e as unidades da segunda etapa (unidades secundárias) correspondem aos alojamentos familiares de residência principal existentes em cada uma das áreas. Dentro das unidades secundárias – alojamentos de residência principal – não se realizou qualquer amostragem, dado que se recolheu informação sobre todos os indivíduos que aí tinham a sua residência principal. Sabendo o número de alojamentos a seleccionar em cada uma das regiões, seguiu-se a selecção das áreas da Amostra-Mãe a visitar nessas mesmas regiões. Esta selecção foi efectuada tendo em conta o limite máximo de 7 ou 8 entrevistas a realizar por cada entrevistador e por semana. Em cada uma das regiões NUTS II, as áreas seleccionadas foram distribuídas de forma mais ou menos uniforme por trimestre e por semana, de modo a minimizar os efeitos sazonais nos resultados do inquérito. 3. Dimensionamento e distribuição da amostra O dimensionamento da amostra, em número de indivíduos, foi efectuado pelo INE em colaboração com o INSA, de acordo com os seguintes critérios: • Ter por base os resultados dos Recenseamentos da População e da Habitação de 2001 e a informação do Inquérito Nacional de Saúde de 1998. • Ter uma distribuição aproximadamente homogénea nas sete regiões NUTS II (delimitação de 1989), de forma a garantir em cada uma, um coeficiente de variação não superior a 15% para sub-populações não inferiores a 5% da população de qualquer das regiões atrás referidas. • Permitir a obtenção de estimativas para as Regiões de Saúde, embora essas estimativas possam não respeitar as condições de precisão indicadas na alínea anterior. O número de alojamentos a visitar para obter o número de indivíduos correspondentes à amostra dimensionada com base nos critérios atrás definidos, foi obtido tendo como base o número médio de indivíduos (que estão no âmbito do inquérito) por alojamento de residência principal, segundo os Censos2001. A fim de colmatar possíveis não respostas devidas a desactualizações da base de amostragem, a amostra de alojamentos atrás referida, foi reforçada com uma taxa adequada, de modo a que o número final de entrevistas conseguidas fosse o previsto inicialmente. No quadro seguinte apresenta-se a dimensão global da amostra, em unidades de alojamento, e a sua distribuição por cada uma das regiões NUTS II. Portugal Norte Centro Lisboa e Vale do Tejo Alentejo Algarve Açores Madeira Dimensão (unidades de alojamento) 19950 2604 3048 3328 3045 3220 2304 2401 Em cada uma das regiões NUTS II, as áreas seleccionadas foram distribuídas de forma mais ou menos uniforme por trimestre e por semana, de modo a minimizar os efeitos sazonais nos resultados do inquérito. 4. Estimativas e sua Precisão1 O cálculo das estimativas tem como base a aplicação a cada unidade estatística (indivíduo) de um ponderador calculado em duas fases: 1ª fase: Determinação de um ponderador inicial, a nível de região NUTS II, baseado no estimador de Horvitz-Thompson, em que os pesos de cada unidade foram obtidos pelo quociente entre as estimativas da população média para 2005 e o número de indivíduos das famílias que responderam ao inquérito. 2ª fase: Correcção dos ponderadores iniciais aplicando o método de ajustamento por margens, para cada uma das regiões geográficas envolvidas, de modo a que a 1 Tanto as estimativas como a sua precisão foram calculadas informaticamente utilizando o software R - R Development Core Team (2006). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.; T. Lumley (2006) "survey: analysis of complex survey samples". R package version 3.6-5. distribuição dos efectivos ponderados pelos valores das variáveis consideradas no ajustamento, seja idêntica à estrutura no universo correspondente. As margens utilizadas foram as estimativas da população, fornecidas pelo Serviço de Estatísticas Demográficas, por sexo x escalão etário, para os seguintes escalões etários: 0 anos; 1 – 4; 5 – 9; 10 - 14 ; 15 – 19; 20 – 24; 25 – 29;30 – 34; 35 – 39; 40 – 44; 45 – 49; 50 – 54; 55 – 59; 60 – 64; 65 – 69; 70 – 74; 75 – 79; 80 – 84; 85 e mais. Os apuramentos do INS são totais ou valores médios obtidos pelo quociente entre dois totais, correspondendo, portanto, respectivamente à estimativa de um total ou à de um quociente. Para todas as estimativas são produzidas estimativas das variâncias e coeficientes de variação. As variâncias são directamente calculadas pelo package Survey do software R para cada uma das regiões atrás referidas. A precisão de uma estimativa – X – é indicada pelo valor do coeficiente de variação correspondente, obtido através da expressão: C.V .( X ) = Var ( X ) X Para o cálculo da variância das estimativas – Var(X) – utilizou-se um estimador de variância do tipo Jacknife; esta técnica pressupõe a partição da amostra em grupos e o cálculo de estimativas para toda a amostra e para as várias subamostras obtidas, retirando à amostra global cada um dos grupos constituídos; a variância é estimada com base na variabilidade entre as estimativas obtidas a partir das subamostras constituídas e a calculada a partir da amostra na sua totalidade. A utilização de uma estimativa deverá ter em atenção o valor do coeficiente de variação que lhe corresponde, tendo em conta que a precisão de uma estimativa é tanto melhor quanto menor o respectivo coeficiente de variação. Em particular, estimativas associadas a coeficientes de variação superiores a 50% não devem ser utilizadas. 5. Ponderadores Atendendo a alguns condicionalismos do inquérito e/ ou do questionário correspondente, a saber: • Permissão ou não de respostas proxy • Questões inquiridas apenas em algumas semanas foram calculados vários ponderadores, dependendo das variáveis inquiridas e do âmbito temporal (número de semanas de inquirição, que condiciona o número de indivíduos que responderam ao inquérito). A designação do ponderador, associado às semanas de inquirição, às respostas aceites e às áreas de estudo estão indicadas no quadro anexo. [INS4_Anexo Nota para utilizadores BD.pdf] Para uma boa compreensão da utilização dos ponderadores adequados, seguem-se três exemplos concretos: Exemplo 1: Quadro 1.1 – População inquirida por estado civil, idade e sexo No ficheiro de dados consideram-se todas as respostas (proxy e não proxy) correspondentes às 52 semanas do ano e utiliza-se para cada indivíduo o ponderador POND 1. Exemplo 2: Quadro 2.2 – População inquirida que referiu ser o seu estado de saúde como muito bom ou bom, por anos de escolaridade completados, idade e sexo No ficheiro de dados consideram-se as respostas proxy para pessoas com idade até 14 anos e apenas não proxy para maiores de 14 anos, correspondentes às 52 semanas do ano, e aplica-se a cada indivíduo o ponderador POND 2. Exemplo 3: Quadro 4.3. – População inquirida de 10 e mais anos que declarou estar limitada á sua casa para se movimentar, por idade e sexo No ficheiro de dados consideram-se todas as respostas (proxy e não proxy) correspondentes às semanas 1 a 13 e utiliza-se para cada indivíduo o ponderador POND 3.