Nota Metodológica

Propaganda
4º INQUÉRITO NACIONAL DE SAÚDE
UTILIZAÇÃO DA BASE DE DADOS – NOTA METODOLÓGICA
1. Âmbito do inquérito
A população abrangida por este inquérito é constituída pelo conjunto dos indivíduos que
residiam em alojamentos familiares no País, à data da realização das entrevistas. Excluiu-se
do inquérito a população residente em alojamentos colectivos.
O trabalho de campo para recolha dos dados decorreu entre Fevereiro de 2005 e Janeiro de
2006.
2. Desenho da amostra
A amostra para o INS foi seleccionada a partir da Amostra-Mãe (AM), que é uma amostra de
unidades de alojamento destinada a servir de base de amostragem dos inquéritos a realizar
pelo Instituto Nacional de Estatística (INE) junto das famílias.
2.1. Amostra-Mãe
A Amostra-Mãe foi seleccionada a partir dos dados do Recenseamento da População e
Habitação de 2001 (Censos2001), utilizando-se para o efeito um esquema de amostragem
complexo, que inclui estratificação e selecção sistemática de conglomerados.
O nível da estratificação utilizado na construção da AM foi o nível III da Nomenclatura das
Unidades Territoriais para Fins Estatísticos (NUTS), embora em algumas das regiões se tenha
ainda efectuado uma sub-estratificação para garantir a selecção de unidades de alojamento
nessas sub-regiões.
Os conglomerados são áreas constituídas por uma ou mais secções estatísticas dos Censos
2001, tendo um mínimo de 240 unidades de alojamento de residência principal. As áreas
foram definidas mediante a condição de que secções pertencentes à mesma área sejam
contíguas e não ultrapassem os limites do concelho a que pertencem.
Posteriormente, em cada estrato e numa única etapa, procedeu-se à selecção sistemática de
conglomerados, com probabilidade proporcional ao número de alojamentos de residência
principal.
A AM é constituída por 1408 áreas, tendo-se listado em cada uma todos os alojamentos
familiares, sendo cada um deles referenciado pela respectiva morada e nome do
representante.
Os alojamentos colectivos, que compreendem os hotéis e similares e ainda as convivências
(apoio social, educação, militar, prisional, religiosa, saúde, trabalho e outras) foram excluídos
da AM e como tal, não fazem parte da amostra do INS.
2.2. Amostra do INS
A amostra do INS foi seleccionada a partir da AM introduzindo uma nova etapa no processo
de selecção. Assim, as unidades da primeira etapa (unidades primárias) correspondem às
áreas da AM, e as unidades da segunda etapa (unidades secundárias) correspondem aos
alojamentos familiares de residência principal existentes em cada uma das áreas.
Dentro das unidades secundárias – alojamentos de residência principal – não se realizou
qualquer amostragem, dado que se recolheu informação sobre todos os indivíduos que aí
tinham a sua residência principal.
Sabendo o número de alojamentos a seleccionar em cada uma das regiões, seguiu-se a
selecção das áreas da Amostra-Mãe a visitar nessas mesmas regiões. Esta selecção foi
efectuada tendo em conta o limite máximo de 7 ou 8 entrevistas a realizar por cada
entrevistador e por semana.
Em cada uma das regiões NUTS II, as áreas seleccionadas foram distribuídas de forma mais
ou menos uniforme por trimestre e por semana, de modo a minimizar os efeitos sazonais nos
resultados do inquérito.
3. Dimensionamento e distribuição da amostra
O dimensionamento da amostra, em número de indivíduos, foi efectuado pelo INE em
colaboração com o INSA, de acordo com os seguintes critérios:
•
Ter por base os resultados dos Recenseamentos da População e da Habitação de 2001
e a informação do Inquérito Nacional de Saúde de 1998.
•
Ter uma distribuição aproximadamente homogénea nas sete regiões NUTS II
(delimitação de 1989), de forma a garantir em cada uma, um coeficiente de variação
não superior a 15% para sub-populações não inferiores a 5% da população de
qualquer das regiões atrás referidas.
•
Permitir a obtenção de estimativas para as Regiões de Saúde, embora essas
estimativas possam não respeitar as condições de precisão indicadas na alínea
anterior.
O número de alojamentos a visitar para obter o número de indivíduos correspondentes à
amostra dimensionada com base nos critérios atrás definidos, foi obtido tendo como base o
número médio de indivíduos (que estão no âmbito do inquérito) por alojamento de residência
principal, segundo os Censos2001.
A fim de colmatar possíveis não respostas devidas a desactualizações da base de amostragem,
a amostra de alojamentos atrás referida, foi reforçada com uma taxa adequada, de modo a que
o número final de entrevistas conseguidas fosse o previsto inicialmente.
No quadro seguinte apresenta-se a dimensão global da amostra, em unidades de alojamento, e
a sua distribuição por cada uma das regiões NUTS II.
Portugal
Norte
Centro
Lisboa e Vale do Tejo
Alentejo
Algarve
Açores
Madeira
Dimensão
(unidades de alojamento)
19950
2604
3048
3328
3045
3220
2304
2401
Em cada uma das regiões NUTS II, as áreas seleccionadas foram distribuídas de forma mais
ou menos uniforme por trimestre e por semana, de modo a minimizar os efeitos sazonais nos
resultados do inquérito.
4. Estimativas e sua Precisão1
O cálculo das estimativas tem como base a aplicação a cada unidade estatística (indivíduo)
de um ponderador calculado em duas fases:
1ª fase: Determinação de um ponderador inicial, a nível de região NUTS II, baseado no
estimador de Horvitz-Thompson, em que os pesos de cada unidade foram obtidos pelo
quociente entre as estimativas da população média para 2005 e o número de indivíduos
das famílias que responderam ao inquérito.
2ª fase: Correcção dos ponderadores iniciais aplicando o método de ajustamento por
margens, para cada uma das regiões geográficas envolvidas, de modo a que a
1
Tanto as estimativas como a sua precisão foram calculadas informaticamente utilizando o software R - R
Development Core Team (2006). R: A language and environment for statistical computing. R Foundation
for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.; T.
Lumley (2006) "survey: analysis of complex survey samples". R package version 3.6-5.
distribuição dos efectivos ponderados pelos valores das variáveis consideradas no
ajustamento, seja idêntica à estrutura no universo correspondente.
As margens utilizadas foram as estimativas da população, fornecidas pelo Serviço de
Estatísticas Demográficas, por sexo x escalão etário, para os seguintes escalões etários:
0 anos; 1 – 4; 5 – 9; 10 - 14 ; 15 – 19; 20 – 24; 25 – 29;30 – 34; 35 – 39; 40 – 44; 45 –
49; 50 – 54; 55 – 59; 60 – 64; 65 – 69; 70 – 74; 75 – 79; 80 – 84; 85 e mais.
Os apuramentos do INS são totais ou valores médios obtidos pelo quociente entre dois
totais, correspondendo, portanto, respectivamente à estimativa de um total ou à de um
quociente. Para todas as estimativas são produzidas estimativas das variâncias e coeficientes
de variação. As variâncias são directamente calculadas pelo package Survey do software R
para cada uma das regiões atrás referidas.
A precisão de uma estimativa – X – é indicada pelo valor do coeficiente de variação
correspondente, obtido através da expressão:
C.V .( X ) =
Var ( X )
X
Para o cálculo da variância das estimativas – Var(X) – utilizou-se um estimador de variância
do tipo Jacknife; esta técnica pressupõe a partição da amostra em grupos e o cálculo de
estimativas para toda a amostra e para as várias subamostras obtidas, retirando à amostra
global cada um dos grupos constituídos; a variância é estimada com base na variabilidade
entre as estimativas obtidas a partir das subamostras constituídas e a calculada a partir da
amostra na sua totalidade.
A utilização de uma estimativa deverá ter em atenção o valor do coeficiente de variação que
lhe corresponde, tendo em conta que a precisão de uma estimativa é tanto melhor quanto
menor o respectivo coeficiente de variação. Em particular, estimativas associadas a
coeficientes de variação superiores a 50% não devem ser utilizadas.
5. Ponderadores
Atendendo a alguns condicionalismos do inquérito e/ ou do questionário correspondente, a
saber:
•
Permissão ou não de respostas proxy
•
Questões inquiridas apenas em algumas semanas
foram calculados vários ponderadores, dependendo das variáveis inquiridas e do âmbito
temporal (número de semanas de inquirição, que condiciona o número de indivíduos que
responderam ao inquérito). A designação do ponderador, associado às semanas de inquirição,
às respostas aceites e às áreas de estudo estão indicadas no quadro anexo.
[INS4_Anexo Nota para utilizadores BD.pdf]
Para uma boa compreensão da utilização dos ponderadores adequados, seguem-se três
exemplos concretos:
Exemplo 1: Quadro 1.1 – População inquirida por estado civil, idade e sexo
No ficheiro de dados consideram-se todas as respostas (proxy e não proxy)
correspondentes às 52 semanas do ano e utiliza-se para cada indivíduo o ponderador
POND 1.
Exemplo 2: Quadro 2.2 – População inquirida que referiu ser o seu estado de saúde como
muito bom ou bom, por anos de escolaridade completados, idade e sexo
No ficheiro de dados consideram-se as respostas proxy para pessoas com idade até 14
anos e apenas não proxy para maiores de 14 anos, correspondentes às 52 semanas do ano,
e aplica-se a cada indivíduo o ponderador POND 2.
Exemplo 3: Quadro 4.3. – População inquirida de 10 e mais anos que declarou estar
limitada á sua casa para se movimentar, por idade e sexo
No ficheiro de dados consideram-se todas as respostas (proxy e não proxy)
correspondentes às semanas 1 a 13 e utiliza-se para cada indivíduo o ponderador POND
3.
Download