0 Bioestatística 1 1. INTRODUÇÃO Olá Pessoal, Como estão os estudos? Animados? Hoje vamos estudar sobre bioestatística. Esse tema é pouco cobrado em provas, mas é necessário cobrir todo o seu edital, por isso vamos ser objetivos e abordar o que é mais importante dentro dessa temática para sua prova. Vamos conceituar a bioestatística? A Bioestatística É uma adaptação da estatística, propriamente dita, direcionada às áreas biológicas. Através dela, podemos utilizar conceitos e propriedades matemáticas para explicar fenômenos ou eventos em caráter biológico. Ela é essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa na área biológica e médica. É fundamental para compreender a epidemiologia e as pesquisas científicas. Vamos estudar os dados e a estatística, métodos de tabular dados e métodos gráficos, passos para construir tabelas a partir de um conjunto de dados coletados de uma amostra, histograma, probabilidade e distribuição de amostras. Esses assuntos são densos e complexos. Sua incidência em questões de concursos é muito pequena, no entanto, é necessário compreender esse assunto, pois servirá como base para entender a epidemiologia, assunto de grande relevância nos concursos. 2 2. DADOS E ESTATÍSTICA Definiremos de maneira simples e concisa alguns elementos que usaremos no decorrer da aula. Dados: é um (ou mais) conjunto de valores, numéricos ou não. Estatística: é um conjunto de técnicas desenvolvidas com a finalidade de auxiliar a responder, de forma objetiva e segura, as situações que envolvem uma grande quantidade de informações. A estatística pode ser usada para analisar situações complexas ou não. Permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudo ou experimentos realizados em qualquer área do conhecimento. Podemos dividir a estatística em três partes: a) Estatística Descritiva – Resume e descreve fatos a partir de números; b) Probabilidade – Trabalha com dados aleatórios; c) Inferência Estatística – Utiliza amostra dentro de uma população maior e extrapola os dados coletados dessa amostra para a população geral. 1. (IADES 2013 EBSERH) “Costuma ser encontrada com maior frequência em jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de simplificar informações. ” O texto faz referência à: a) Estatística inferencial b) Estatística de probabilidade c) Estatística por amostragem d) Estatística descritiva e) Média aritmética 3 Comentários: Letra D O enunciado se refere à estatística descritiva, pois descrever e resumir fatos são função da estatística descritiva. Letra A. errada, pois a estatística inferencial extrapola os dados de uma amostra para uma população. Letra B. Errada. A estatística da probabilidade trabalha com eventos aleatórios. Letra C. Errada. A estatística por amostragem está dentro da estatística inferencial. Letra E. Errada. A média aritmética é uma análise de dados dentro da estatística descritiva. 2. (FUNCAB 2013 ANS) A estatística descritiva: a) permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. b) é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. c) é a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes. d) é a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. e) é a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. Comentários: Letra C A primeira parte da alternativa A mostra o conceito de probabilidade (Palavra-chave: eventos aleatórios) e a segunda parte referem-se ao conceito de estatística inferencial. A letra B nos traz o conceito de estatística. 4 A letra C é o conceito de estatística descritiva Palavra Chave: descrever e resumir os dados. A letra D mesclou os conceitos de estatística descritiva e probabilidade para induzir o candidato ao erro. A letra E misturou os conceitos, iniciou falando da estatística descritiva (palavrachave: descrever e resumir dados) e finalizou a alternativa descrevendo estatística inferencial (extrapola os dados a partir de uma amostra). 3. (FEMPERJ 2012 TCE RJ) uma atividade típica da Estatística Inferencial é: a) calcular taxas; b) descrever dados em tabelas; c) definir índices; d) estimar tamanho amostral; e) estabelecer hipóteses. Comentários: Letra E A atividade típica da estatística inferencial é o estabelecimento de hipóteses para serem testadas. O cálculo de taxa, descrever dados em tabelas, definir índices e estimar tamanho amostral fazem parte da estatística descritiva. Vamos analisar a figura abaixo para aprender a interligação entre as três modalidades da estatística? 5 A Estatística na Prática Porque a estatística é importante? A estatística usa os dados para analisar e a partir dessa análise TOMAR DECISÕES. Em linhas gerais, a Estatística fornece métodos que auxiliam o processo de tomada de decisão na presença de incerteza. Atualmente os métodos estatísticos são usados em quase todos os campos de investigação científica, já que eles nos capacitam a responder a um vasto número de questões, tais como as listadas abaixo: • Como os pesquisadores médicos testam a eficiência de novas drogas? • Como os demógrafos preveem o tamanho da população do mundo em qualquer tempo futuro? • Como os pesquisadores na educação testam a eficiência de um novo método de ensino? • Como os cientistas avaliam a validade de novas teorias? A Estatística, além de servir como apoio científico a quase todas as áreas do conhecimento (Engenharia, Economia, Agronomia, Medicina, Física, Ciências Humanas em geral), proporciona mecanismos para diagnosticar e aperfeiçoar a gestão e operação de diversos sistemas complexos, desde os sistemas humanos aos sistemas físicos, possibilitando criar modelos que descrevam o comportamento de algumas variáveis em função de outro conjunto de variáveis. 6 2.1. DADOS Coleta de Dados Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades, custos envolvidos; exame das informações disponíveis; delineamento da amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado. A coleta de dados pode ser direta ou indireta. a) Coleta direta: Quando os dados são obtidos na fonte originária. Os valores assim compilados são chamados de dados primários, como, por exemplo, nascimentos, casamentos e óbitos, todos registrados no Cartório de Registro Civil; opiniões obtidas em pesquisas de opinião pública, ou ainda, quando os dados são coletados pelo próprio pesquisador. A coleta direta pode ser classificada relativamente ao fator tempo em: Contínua – Quando feita continuamente, como por exemplo, nascimentos e I. óbitos; II. Periódica – Quando é feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos); III. Ocasional – Quando é feita sem época preestabelecida. b) Coleta indireta: Quando os dados obtidos provêm da coleta direta. Os valores assim compilados são denominados de dados secundários, como, por exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE constitui-se em uma coleta indireta. 7 Apresentação dos Dados Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado. Análise dos Resultados Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferência, e tiram-se as conclusões e previsões. Tipos de Variáveis Cada uma das características observadas ou mensuradas em um fenômeno é denominada de variável. Para o fenômeno “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino. Para a variável “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0, 1, 2, 3, ..., n; Para a variável “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Organização dos Dados Os dados podem ser organizados em função do tipo de variável coletada, essa pode ser quantitativa e qualitativa. Vamos detalhá-las? a) Variáveis Quantitativas - Referem-se às quantidades e podem ser medidas em uma escala numérica. Exemplos: idade das pessoas, preço dos produtos, peso dos recém-nascidos. Elas subdividem-se em dois grupos: • Variáveis Quantitativas Discretas: são aquelas que assumem apenas determinados valores tais como 0, 1, 2, 3, 4, 5, 6 dando saltos de descontinuidade entre seus valores. Normalmente refere-se a contagens. Por exemplo: número de pessoas por família, quantidade de doentes por hospital. 8 • Variáveis Quantitativas Contínuas: são aquelas cujos valores assumem uma faixa contínua e não apresentam saltos de descontinuidade. Exemplos dessas variáveis são: Os pesos de pessoas, a renda familiar. b) Variáveis Qualitativas - Refere-se a dados não numéricos. Exemplos dessas variáveis são: O sexo das pessoas, a cor, o grau de instrução. Elas subdividem-se também em dois grupos: • Variáveis Qualitativas Ordinais: São aquelas que definem um ordenamento ou uma hierarquia. Exemplos são: O grau de instrução, a classificação de um estudante no curso de Estatística, as posições das 100 empresas mais lucrativas, etc. • Variáveis Qualitativas Nominais: Estas por sua vez, não definem qualquer ordenamento ou hierarquia. São exemplos destas: A cor, o sexo, o local de nascimento, etc. Esquema: 9 Para análises estatísticas é fundamental entender os conceitos de população e amostra. Vamos nessa? População: É o conjunto de elementos a serem observados. Exemplo: todos os pacientes em um hospital, pessoas que moram em Brasília. Amostra: É uma pequena parte selecionada de uma população que se pretende estudar. Faz-se amostragem quando: 1. O número de elementos da população é muito grande; 2. Quando queremos economizar tempo e dinheiro; 3. Não é possível acessar todos os elementos da população. 10 • Vantagens do levantamento por amostragem: custo menor, menor tempo e objetivos mais amplos. • Situações para trabalho com amostras: população muito grande, dificuldade de acesso, grande número de variáveis. Vantagens do levantamento por amostragem: custo menor; menor tempo; e objetivos mais amplos. Situações para trabalho com amostras: população muito grande; dificuldade de acesso; e grande número de variáveis. 4. (FCC 2010 TCM PA) A técnica que consiste em dividir uma população em subpopulações, cada qual contendo um grupo de unidades de amostragem com características homogêneas ou similares, é denominada amostragem: a) randômica. b) estratificada. c) não estatística. d) por julgamento. e) não aleatória. Comentários: Letra B 11 ESTRATIFICAÇÃO - é o processo de dividir uma população em subpopulações, cada qual contendo um grupo de unidades de amostragem com características homogêneas ou similares. Objetiva auxiliar no planejamento eficiente e eficaz da amostra. 5. (UNIRIO 2012). No âmbito das bibliotecas universitárias, a estatística é considerada uma das ferramentas para analisar os dados bibliográficos, de circulação e de uso do material da biblioteca. Todo grupo de objetos ou indivíduos observados e o conjunto de dados que se deseja estudar na biblioteca são denominados: a) inferência e variáveis. b) população e amostra. c) gráfico e tabelas. d) indicadores e média. e) amostragem e frequência. Comentário: Letra B População é o bloco de todos os dados e a amostra o grupo menor que irá ser analisado. 6. (FCC 2009 TRE MG) O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram, respectivamente: a) censo e amostragem por conglomerados. b) amostragem aleatória e amostragem sistemática. 12 c) censo e amostragem casual simples. d) amostragem estratificada e amostragem sistemática. e) amostragem sistemática e amostragem em dois estágios. Comentário: Letra C. Censo é um estudo estatístico que resulta da observação de todos os indivíduos da população relativamente a diferentes atributos pré-definidos. Censo: Avalia todos os participantes. Amostra casual simples - Elementos são retirados ao acaso da população, assim todo elemento da população tem igual probabilidade de ser escolhido para a amostra. Amostragem - aborda apenas uma parte do grupo total. Observe a diferença: Censo (todos) X Amostra (uma parte) Vamos conhecer outros tipos de amostragem? 1. Seleção aleatória ou randômica: é a que assegura que todos os itens da população ou do estrato fixado tenham idêntica possibilidade de ser escolhidos. Nessa seleção são utilizadas, por exemplo, tabelas de números aleatórios que determinarão quais os números dos itens a serem selecionados dentro do total da população ou dentro de uma sequência de itens da população predeterminada. 2. Amostragem estratificada: consiste em dividir ou estratificar a população em certo número de subpopulações que não se sobrepõem e então extrair uma amostra de cada estrato. Este tipo de amostragem também é usado quando 13 métodos diferentes de coleta de dados são aplicados em diferentes partes da população. Ex.: Amostragem em grafos ou aureolar 3. Amostragem não estatística: Amostragem não-estatística (por julgamento) é aquela em que a amostra é determinada utilizando sua experiência, critério e conhecimento. Amostragem estatística é aquela em que a amostra é selecionada cientificamente com a finalidade de que os resultados obtidos possam ser estendidos ao conjunto de acordo com a teoria da probabilidade ou as regras estatísticas. O emprego de amostragem estatística é recomendável quando os itens da população apresentam características homogêneas. 4. Amostragem por julgamento: quando o pesquisador seleciona os elementos mais representativos da amostra de acordo com seu julgamento pessoal. Esse tipo é ideal em casos de populações pequenas. 5. Seleção não aleatória ou causal: essa ocorre a critério do autor da pesquisa, baseada em sua experiência profissional. Pode ser uma alternativa aceitável para a seleção, desde que o auditor tente extrair uma amostra representativa da população, sem a intenção de incluir ou excluir unidades específicas. 14 2.2. MÉTODOS TABULARES E MÉTODOS GRÁFICOS Organizar e trabalhar os dados em forma de tabelas e gráficos permite melhor analise dos resultados e melhor tomada de decisão. TABELAS Tabela é um quadro que resume um conjunto de observações. Ela é composta de: Título: Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que? (Referente ao fato), Quando? (Correspondente à época), Onde? (Relativo ao lugar); Corpo: Conjunto de linhas e colunas que contém informações sobre a variável em estudo; Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas; Rodapé: Reservado para as observações pertinentes, bem como a identificação da fonte dos dados. Exemplos: Estimativas para o ano de 2006 de número de casos novos por câncer, em homens e mulheres, segundo localização primária, no Brasil. Para fazer uma tabela é necessário aprender sobre distribuição de frequência que relacionam categorias ou classes de valores, juntamente com contagens (ou frequência) do número de valores que se enquadram em cada categoria. Vamos praticar? 15 7. (CESPE 2011). Julgue o item subsecutivo, relativo a planejamento e organização de pesquisas. Após a coleta de dados, as tabelas de contingência representam uma forma de tabulação útil para avaliar relacionamento entre duas variáveis qualitativas. Comentários: Certo. As tabelas servem para organizar os dados que foram coletados e poder relacionar variáveis. Pessoal, vamos aproveitar essa questão para aprofundar o conhecimento nas tabelas de contingência? As tabelas de contingência são usadas para registrar observações independentes de duas ou mais variáveis aleatórias, normalmente qualitativas. Suponha que se têm duas variáveis, desenvolvimento de tumor maligno (desenvolveu ou não desenvolveu) e hábito de fumar (fumante ou não fumante) e considere uma amostra aleatória (casual) de 100 adultos. Uma tabela de contingência pode ser usada para apresentar essas duas variáveis na amostra estudada, como abaixo. Note que as classes de cada variável são independentes, ou seja, uma pessoa não pode ser fumante e não fumante ao mesmo tempo, e similar ocorre com o desenvolvimento de câncer. No uso desse tipo de tabela é comum se pretender investigar se as variáveis estudadas têm alguma associação. Pode-se, por exemplo, estudar se o hábito de fumar está ou não associado, de alguma forma, ao desenvolvimento de tumor maligno. Desenvolveu Não desenvolveu Total Fumante 43 44 87 16 Não fumante 9 4 13 Total 52 48 100 GRÁFICOS A representação gráfica dos dados tem por finalidade dar uma ideia, mais imediata possível, dos resultados obtidos. Permitindo-nos chegar a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do pesquisador. Contudo, os elementos: Simplicidade, clareza e veracidade devem ser consideradas quanto à elaboração de um gráfico. Veja como foi abordado na prova: 8. (AOCP 2012) A respeito de gráficos estatísticos, assinale a alternativa correta. a) A representação gráfica por pictogramas utiliza símbolos relacionados à ideia central dos dados que se deseja representar. Nesse gráfico, as barras são substituídas pelos símbolos e a quantidade de símbolos em cada “barra” corresponde à frequência relativa. b) Em um gráfico de colunas, as alturas de cada retângulo independem dos dados. c) Dados que estejam organizados apenas em uma coluna ou linha, em uma planilha, podem ser plotados em um gráfico de setor e os setores representam as proporções das categorias. d) Um gráfico de barras apresenta a frequência absoluta (ou relativa) cumulativa. e) Em um gráfico de linhas, os dados de categorias são distribuídos uniformemente ao longo do eixo vertical, e todos os valores são distribuídos igualmente ao longo do eixo horizontal. Comentários: Letra C. Letra A - Um pictograma é um gráfico semelhante a um gráfico de barras onde utiliza símbolos apelativos em substituição das barras. 17 Para construir um pictograma deve-se dá atenção aos seguintes aspetos: • indicar no gráfico o significado de cada símbolo utilizado; • utilizar símbolos ou figuras sugestivas de acordo com a variável estatística a representar; • utilizar sempre o mesmo símbolo ou símbolos; • os símbolos devem ser apresentados em linhas ou colunas e com espaçamento uniforme entre eles; • as diferentes frequências são representadas por um maior ou menor número de símbolos; • se for necessário poderão ser utilizadas frações dos símbolos, mas nunca símbolos de tamanhos diferentes; Nos dados do pictograma a quantidade de símbolos representa a frequência absoluta e não a relativa. Ex. de pictograma Letra B Em um gráfico de colunas, as alturas de cada retângulo dependem dos dados. Letra C os gráficos de linha podem ser detalhados por gráficos de setores. Vamos aprender sobre os gráficos de setores? 18 Este tipo de gráfico é bastante utilizado, pois permite comparar rapidamente as diferentes categorias ou classes de dados em estudo. Na construção de um gráfico circular é necessário ter em atenção os seguintes aspetos: • a cada setor do gráfico corresponde uma categoria ou classe de dados; • a amplitude de cada setor é proporcional à frequência que representa; • podem ser representadas frequências absolutas ou relativas, sendo comum a utilização de percentagens; • os setores do gráfico devem ser identificados, podendo recorrer-se a uma legenda; • podem usar-se cores diferentes para os diferentes setores; • o gráfico deve ter um título adequado. A letra D está errada porque o gráfico de barras pode representar a frequência relativa ou absoluta, porém não representa a frequência cumulativa. Vamos aprender sobre o gráfico em barras? Os gráficos de barras são um dos tipos de gráficos mais utilizados para representar e comparar rapidamente categorias ou classes de dados. Para construir um gráfico de barras é necessário levar em conta as seguintes características: • o gráfico possui dois eixos, o eixo horizontal (onde habitualmente estão representadas as categorias ou classes) e o eixo vertical (onde geralmente se representam as frequências relativas ou absolutas); • a cada categoria ou classe corresponde uma barra do gráfico; • só uma das dimensões das barras varia (geralmente a altura); • a dimensão que varia corresponde à frequência da variável estatística; • as barras devem estar separadas por espaços iguais; • o gráfico deve ter um título adequado Letra E. Um gráfico de linhas é muitas vezes usado para visualizar uma tendência nos dados em intervalos de tempo - uma série de tempo -, assim, a linha é muitas vezes utilizada por ordem cronológica. O gráfico de linha é composto por dois eixos, um vertical e outro horizontal, e por uma linha que mostra a evolução de um fenômeno ou processo, ou seja, não são uniformes como afirma à alternativa. 19 2.3. APRESENTANDO DADOS EM TABELAS E GRÁFICOS Uma vez estabelecido os dados a serem coletados e o tamanho da amostra de dados, a melhor forma de examinar um volume de dados é apresentá-los de forma reduzida e esquematizada, utilizando TABELAS E GRÁFICOS APROPRIADOS. Conceitos Básicos A - Característica = variável x = (x1, x2, x3, ......xn) Importante: B - Medidas de Tendência Central- Esses dados tentam mostrar a tendência para o centro dos dados. Pode ser a mediana, média e moda. Representam o valor de ponto em torno do qual os dados se distribuem. B1 - Mediana = é o meio que divide os valores “50% para cada lado”. Se a quantidade de valores do conjunto for ímpar, a mediana é o valor central; Se a quantidade de valores do conjunto for par, é preciso tirar a Média Aritmética dos valores centrais. B2 - Média = uma idéia de centro. B.2.1 - Média aritmética simples – Soma os valores e divide pelo número total de dados. 2 3 1 4 x x2 x3 .....xn xi 2,5 x 1 4 n n B.2.2 - Média aritmética ponderada (considera pesos diferentes para os valores. Podemos pensar em uma prova de concurso quando o peso de uma matéria é maior que o da outra, dessa forma antes de dividir pelo n, multiplica-se cada valor obtido nas matérias pelo respectivo n peso). ni x i n1 .x1 n 2 .x 2 n3 .x3 ....n n .x n i 1 x n n Vamos entender!! N1 seria a nota de português e x1 o peso da matéria português. N2 a nota de informática e x2 o peso da matéria informática... B3 - Moda = Característica que mais se repete na amostra ou na população - é a maior frequência. 20 Essa é fácil pessoal! Simplesmente o valor que mais aparece na amostra. Quando um conjunto de dados não apresenta moda, dizemos que esse conjunto é amodal. Caso exista uma moda, denominamos o conjunto de Unimodal. Existindo duas modas, denominamos o conjunto de bimodal. 9. (IESES 2014) Com relação às medidas de tendência central assinale a alternativa INCORRETA: a) A moda não é influenciada por valores extremos (outliers). b) A média pode apresentar um valor maior que a moda. c) A média é influenciada por valores extremos (outliers). d) A mediana é influenciada pelos valores extremos (outliers). Comentários: Letra D Vamos fazer uma breve revisão? As medidas de centralidade ou medidas de posição são a Média, a Moda e a Mediana. O outlier é o valor aberrante ou valor atípico, é uma observação que apresenta um grande afastamento das demais da série. Observe melhor no gráfico abaixo: 21 Agora vamos explicar as alternativas: Letra A. A moda é simplesmente o valor que mais aparece na amostra, ela não é influenciada se aparecer um valor extremo, ou aberrante na amostra. Ex: 5, 6, 5, 7, 250, 5,9, 10. Nesse caso a moda é o número 5. O número 250 não interfere no valor da moda. Entendeu? Letra B e C. A média como é influenciada por todos os valores, inclusive o extremo, ela pode ser maior que a moda. No exemplo acima a média será bem maior que a média. A letra D está errada, pois a mediana divide a amostra ao meio, não sendo influenciada por valores extremos. No exemplo acima: Ex: 5, 6, 5, 7, 250, 5, 10. Teríamos que colocar a amostra em ordem crescente e achar o valor do meio 5,5,5,6,7,9,10,250 A mediana seria o valor do meio= 7. 10. (CESGRANRIO 2011) A respeito das medidas de tendência central e de dispersão de uma distribuição de probabilidades, verifica-se que a(o): a) moda é sempre maior que a média. b) mediana é sempre menor que o desvio padrão. c) variância é sempre o dobro do desvio padrão. d) variância é uma medida de tendência central. e) desvio padrão é uma medida de dispersão Comentários: Letra E Letra A. Nem sempre a moda será maior que média, a moda é simplesmente o valor que mais aparece na amostra. Letra B. Não há uma relação exata entre mediana e desvio padrão. Lembrando que a mediana é um valor de medida central e desvio padrão é uma medida de dispersão. Letras C e D. Variância é o desvio padrão elevado ao quadrado. Ambos são medidas de dispersão. Letra E. Desvio padrão também é uma medida de dispersão. Distribuição de Frequência Se o número de dados for muito grande será necessário agrupar os dados em classes, esse agrupamento será denominado de distribuição de frequência. 22 Para a construção da tabela de distribuição de frequência deve ser observado: A – AMPLITUDE TOTAL (OU INTERVALO) - AT É a diferença entre o maior e o menor valor do rol de dados = X max - X min. B – NÚMERO DE CLASSES (k) Intervalos de Classe: Conjunto de observações apresentadas na forma contínua, sem superposição de intervalos, de tal modo que cada valor do conjunto de observação possa ser alocado em um, e apenas um, dos intervalos. Para achar o número de classes é necessário aplicar uma fórmula. Existem 3 tipos de fórmulas, nosso objetivo aqui é ser objetivo e focar na prova de concurso. A mais fácil é que o número de classes é a raiz quadrada de n. K= raiz quadrada de n C – AMPLITUDE DE INTERVALO DE CLASSE (h) D– D– h AT k PONTO MÉDIO DA CLASSE (Xi) xi ls li FREQUÊNCIA 2 Número de vezes que ocorre uma determinada característica da variável. 23 2.4. PASSOS PARA CONTRUIR TABELAS A PARTIR DE UM CONJUNTO DE DADOS COLETADOS DE UMA AMOSTRA QUALQUER A - Você tem um rol proveniente de uma amostra qualquer. B - Organize os dados em ordem crescente C - Determine a amplitude total D - Determine o número de classes E - Calcule a amplitude das classes F - Determine xi, fi, fr, fr% Simbologia: fi= Frequência absoluta simples fia = frequência absoluta acumulada f fir = frequência relativa simples = n i f i 1 fi n ou i fip= frequência percentual simples: f ip fi 100 n fira= frequência relativa acumulada fipa = frequência percentual acumulada xi = ponto médio do intervalo de classe xi li ls 2 Tabela montada com todos os elementos: Classe fi xi fir fip% fia fira fipa% 15 29 5 22 0,125 12,5 5 0,125 12,5 29 43 3 36 0,075 7,5 8 0,200 20,0 43 57 5 50 0,125 12,5 13 0,325 32,5 57 71 7 64 0,175 17,5 20 0,500 50,0 71 85 9 78 0,225 22,5 29 0,725 72,5 85 99 11 92 0,275 27,5 42 1,000 100,0 TOTAL 40 - 1,00 100,0 - - - Vamos praticar! 24 11. (FUNIVERSA 2012) Com relação aos principais conceitos de estatística descritiva, assinale a alternativa correta. a) Frequência relativa simples é o número de vezes em que determinado valor aparece em uma população ou em uma amostra. b) Ponto médio de classe é a soma das frequências absolutas simples dos valores inferiores ou iguais a determinado valor. c) Amplitude de classe é a diferença entre o mais alto e o mais baixo dos valores de uma distribuição. d) Rols são dados não organizados numericamente, ou seja, aqueles que não se encontram preparados para análise. e) Variável contínua é aquela que pode assumir, teoricamente, qualquer valor em certo intervalo da reta real. Comentários: Letra E Letra A. A frequência relativa é o percentual dos valores e não o número de vezes em que ele aparece. Letra B. Ponto médio de classe (Xi) é o valor médio encontrado em cada classe da tabela. A Letra C apresenta o conceito de amplitude total. Vamos diferenciar amplitude total e amplitude de classe? Amplitude total (AT): dispersão entre o maior e o menor número, no caso a idade. Quanto maior a amplitude, mais heterogêneo é o grupo. Amplitude de classe(AC): divide-se a amplitude total pelo número de classes (K). Letra D. Rol: organização dos dados por ordem de valor, sendo ele crescente ou decrescente. Letra E está correta, pois a variável contínua pode assumir qualquer valor. Ex. Peso e altura (não são números inteiros). Histograma: Variação e Distribuição Histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. 25 O Histograma é o tipo de gráfico mais utilizado, é constituído barras, cujas bases são determinadas pelos intervalos de classe e suas alturas são determinadas pelas correspondentes frequências de classe. Observe como estará na prova: 12. (CESGRANRIO 2010) Um especialista reconhece as técnicas de estatística descritiva, sabendo, dentre elas, ser uma EXCEÇÃO: a) os histogramas. b) os testes de hipótese. c) os polígonos de frequência. d) o gráfico de setores. e) as medidas de dispersão. Comentários: Letra B Os testes de hipóteses estão dentro da estatística inferencial e não na descritiva. As demais alternativas são partes da estatística descritiva. 26 13. (CESGRANRIO 2010) Histogramas e polígonos de frequências são duas representações gráficas de distribuições: a) uniformes. b) de frequências. c) de acumulações. d) não uniformes. e) assimétricas. Comentários: Letra B Os histogramas e os polígonos colocam em forma gráfica a distribuição de frequências. Polígono de frequência: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. 14. (CESGRANRIO 2014) Quando os dados referentes aos problemas são mostrados em histograma, objetiva-se: a) analisar o processo procurando pontos fora dos limites de controle b) facilitar o entendimento da distribuição de dados c) verificar se o processo foi estabilizado após uma atividade de melhoria. d) buscar causas ativamente, de forma sinérgica e devidamente registradas e hierarquizadas. 27 e) representar graficamente cada processo, informando seu respectivo peso e a expectativa de execução. Comentários: Letra B Os histogramas são gráficos de barras utilizados para facilitar o entendimento da distribuição dos dados e sua frequência dentro da amostra analisada. 15. (CESPE 2011) Um histograma é um gráfico que representa a dispersão tanto de variáveis discretas quanto de contínuas. Comentários: Errado. O erro desta questão está no termo DISPERSÃO. O histograma representa a DISTRIBUIÇÃO de frequências. A dispersão representa outro tipo de medidas, como é o caso do desvio padrão que indica a variação dos dados em volta da média. 16. (IBFC 2012) Gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência: a) Polígono de frequência b) Polígono de frequência acumulada c) Setor circular d) Histograma e) Pictogramas Comentários: Letra D. O enunciado mostra o conceito de histograma. Vamos analisar outros gráficos? 28 Polígono de frequência: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior a primeira e da posterior à última, da distribuição. Polígono de frequência acumulada: é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Pictograma é quando utiliza símbolos significativos para formar as barras do gráfico. Setor circular é um gráfico em pizza. 29 2.4. PROBABILIDADE É a possibilidade ou chance de que um evento ocorra. É a proporção ou a fração cujos valores variam de 0 a 1. Quando um evento não tem a menor chance de ocorrer a probabilidade é 0, portanto um evento nulo. Quando o evento certamente vai ocorrer a probabilidade é 1 A probabilidade de sucesso baseia-se no conhecimento prévio do processo envolvido. Ex: Chance de se obter aleatoriamente uma carta preta do baralho. Eu conheço o baralho (52 cartas), eu conheço as cartas pretas (26 cartas) Pr ob carta preta 26 1 0,5 52 2 A probabilidade de ocorrência é dada: PROB DE OCORRÊNCIA X T X = Número de resultados nos quais os eventos que estamos procurando ocorre, T = Número total de resultados possíveis. Espaço Amostral A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6. Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto universo, representados por . Os dois experimentos citados anteriormente têm os seguintes espaços amostrais: - lançamento de uma moeda: = {Cara, Coroa}; - lançamento de um dado: = {1, 2, 3, 4, 5, 6}. Do mesmo modo, como em dois lançamentos sucessivos 30 de uma moeda podemos obter cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é: = {(Cara, Cara), (Cara, Coroa), (Coroa, Cara), (Coroa, Coroa)}. Cada um dos elementos de que corresponde a um resultado recebe o nome de ponto amostral. 17. (VUNESP 2009) Um evento cujo resultado coincide com a totalidade do espaço amostral e que, portanto, acontecerá sem nenhuma chance do contrário é um evento: a) nulo. b) complementar. c) mutuamente exclusivo. d) certo. e) composto. Comentários: Letra D Vamos entender o que é um evento certo? Ao lançarmos um dado é certo que a face que ficará para cima, terá um número divisor de 720. Este é um evento certo, pois 720 = 6! = 6 . 5 . 4 . 3 . 2 . 1, obviamente qualquer um dos números da face de um dado é um divisor de 720, pois 720 é o produto de todos eles. O conjunto A = {2, 3, 5, 6, 4, 1} representa um evento certo pois ele possui todos os elementos do espaço amostral S = { 1, 2, 3, 4, 5, 6 }. Logo, o único evento que acontecera ''sem nenhuma chance do contrário'' é o evento CERTO. 31 Evento Chamamos de eventos a qualquer subconjunto do espaço amostral de um experimento aleatório. Conceitos Básicos EVENTO SIMPLES: Característica simples ESPAÇO DA AMOSTRA: Conjunto de eventos Vamos praticar! 18. (AOCP 2015) Referente à estatística e à probabilidade, assinale a alternativa INCORRETA: a) Probabilidade é a medida de como um evento é provável de ocorrer dado um número de possíveis resultados. b) Calcular a probabilidade permite que você use a lógica e a razão, mesmo com algum grau de incerteza. c) A distribuição de probabilidade é uma função que determina probabilidades para eventos ou proposições. d) Estatística é a ciência que se utiliza das teorias probabilísticas para explicar a frequência da ocorrência de um evento. e) Uma variável aleatória não pode ser entendida como uma variável quantitativa, cujo resultado depende de fatores aleatórios. Comentários: Letra E Uma variável aleatória é uma variável quantitativa, cujo resultado depende de fatores aleatórios. A alternativa está errada, pois mostra que a variável aleatória não é quantitativa. 32 Interseção de dois eventos O evento interseção de dois eventos A e B equivalem à ocorrência de ambos. Ela contém todos os pontos do espaço amostral comum a A e a B. Denota-se por A B (ou às vezes, por AB). A interseção é ilustrada pela área representada pela letra a do diagrama abaixo. Exemplo: Seja A o conjunto de alunos de uma instituição que frequentam o curso secundário, e B o conjunto dos que frequentam um curso facultativo de interpretação musical. A interseção A B é o conjunto dos alunos que fazem o curso secundário e frequentam o curso facultativo. Exclusão de dois eventos Exclusão Dois eventos A e B dizem-se mutuamente exclusivos ou mutuamente excludentes quando a ocorrência de um deles impossibilita a ocorrência do outro. Os eventos não têm nenhum elemento em comum. Exprime-se isto escrevendo A B = . O diagrama a seguir ilustra esta situação. 33 Ex.: Na jogada de um dado, seja A o evento “aparecer número par” e B o evento “aparecer número ímpar”. A e B são mutuamente excludentes; A B = ; nenhum número pode ser par e ímpar ao mesmo tempo. União O evento união de A e B equivale à ocorrência de A, ou de B, ou de ambos. Contém os elementos do espaço amostral que estão em pelo menos um dos dois conjuntos. Denota-se por A B. A área rachurada do diagrama ilustra a situação. Nota-se que à interseção está associada à conjunção e, enquanto que à união está associada à conjunção ou. Exemplo: Se A é o conjunto dos alunos de um estabelecimento que frequentam o curso de ciências contábeis e B é o conjunto de aluno do mesmo estabelecimento que fazem administração de empresas, então A B é o conjunto dos alunos que fazem pelo menos um daqueles dois cursos. Negação (Complementar). A negação do evento A, denotada por A é chamada de evento complementar de A. É ilustrada na parte azul da figura abaixo. 34 Vamos resumir os principais aspectos da probabilidade? a) Experimento Aleatório - é um experimento é aleatório caso seu resultado final dependa totalmente do acaso. b) Espaço amostral (E) - é o conjunto que possui todos os resultados possíveis de um experimento aleatório. c) Evento (A) - é um subconjunto qualquer do espaço amostral. Seja n(A) o número de elementos de um evento A e n(E) o número de elementos do espaço amostral E que contém A. A probabilidade do evento A é P(A) = n(A)/ n(E). Esclarecendo: P(A) = número de casos favoráveis/ número total de casos Se P(A) = 0, dizemos que o evento é impossível. Se P(A) = 1, dizemos que o evento é certo. 0 P(A) 1 Eventos complementares O evento complementar de A em E A) o su conjunto de todos os elementos de E que não estão em A. Vale que P A) P A) 1 Probabilidade da união A probabilidade de ocorrer o evento A ou o evento B é: P(AB) = P(A) + P(B) – P(AB) Observação: Dizemos que A e B são eventos mutuamente exclusivos se AB = 0. Nesse caso, P(AB) = 0. 35 Probabilidade condicional A probabilidade de A, sabendo que já ocorreu B, é: P(A/B) = P(AB) / P(B) Vejamos como foi cobrado: 19. (CESPE 2012) Considere os eventos A, B, C e D, definidos abaixo, relativos ao número de veículos por família em determinada cidade. A = uma família possui 1 ou mais veículos; B = uma família possui 2 ou mais veículos; C = uma família possui 3 ou mais veículos; D = uma família possui 4 ou mais veículos. Considere, ainda, que as probabilidades de ocorrência desses eventos são: P(A) = 0,9; P(B) = 0,6; P(C) = 0,3 e P(D) = 0. Com base nessas informações, julgue os itens que se seguem. A probabilidade condicional é inferior a 0,6. Comentários: Errada Veja a fórmula de probabilidade condicional: Queremos a interseção de A e B que é 60% dividido por 90%. Como sabemos a interseção? Se a chance de A (1 ou mais carros) é 90% e B (2 ou mais carros) é 60%, temos que a interseção é ter 2 ou mais carros, logo 60%. Assim ficamos: 0,60/0,90=0,66 Diagrama de Dispersão Gráfico ou diagrama de dispersão é utilizado para a visualização do tipo de relacionamento existente entre suas variáveis. Estas variáveis podem ser duas causas, uma causa e um efeito ou dois efeitos. 36 VARIÁVEL Y EX.: VARIÁVEL X O diagrama de dispersão consiste, basicamente, num aglomerado de pontos, distribuído sobre um plano de eixos cartesianos (x e y), onde é visualizada a relação entre suas variáveis. O objetivo é visualizar a intensidade do relacionamento entre duas variáveis. QUANDO UTILIZAR na Saúde Pública? Determinação do efeito da ingestão de calorias e o peso das pessoas. Determinação da incidência de doenças em função do número de cigarros consumidos por dia Determinação da incidência de doenças em função da área de ausência de saneamento. 20. (FCC 2010) Na gestão da qualidade, a ferramenta que auxilia o gestor a visualizar a alteração sofrida por uma variável quando outra se modifica é denominada: a) gráfico de Pareto. b) diagrama de dispersão. c) histograma. d) diagrama de causa e efeito. e) carta de controle. 37 Comentários: Letra B. O diagrama de dispersão mostra o relacionamento entre duas variáveis. O diagrama de dispersão como ferramenta da qualidade nos mostra o uso da estatística na prática. Essa ferramenta permite que a equipe de qualidade estude e identifique o relacionamento possível entre as mudanças observadas em duas variáveis. Os outros itens não estão dentro dessa temática de bioestatística, porém vamos conceituar cada uma das alternativas para você: Ferramentas para controle de qualidade de PROCESSOS: a) Gráfico de Pareto. - Princípio 80-20 - 80% das consequências advêm de 20% das causas - Permite priorizar problemas separando os diversos TRIVIAIS dos poucos que são VITAIS. b) Diagrama de dispersão. - Analisar a influência de uma variável em relação a outra. Visualizar a alteração sofrida por uma variável quando outra se modifica. Exemplo: relação velocidade X viscosidade. c) Histograma. - Ferramenta simples - gráfico de barras verticais - para análise e representação de dados quantitativos, agrupados em classes de freqüência que permite distinguir a forma, o ponto central e a variação da distribuição, além de outros dados como amplitude e simetria na distribuição dos dados. d) Diagrama de causa e efeito. - Tb chamado de Diagrama Espinha de Peixe ou Diagrama 6M (Método; Matériaprima; Mão-de-obra; Máquinas; Medição; Meio ambiente). - O sistema permite estruturar hierarquicamente as causas potenciais de determinado problema ou oportunidade de melhoria, bem como seus efeitos sobre a 38 qualidade dos produtos. Permite também estruturar qualquer sistema que necessite de resposta de forma gráfica e sintética. e) Carta de controle. - Monitora os processos, a variação na produção, através de medidas padrões estabelecidos - processos devem estar dentro dos limites estabelecidos. - Determina uma faixa chamada de tolerância limitada pela linha superior (limite superior de controle) e uma linha inferior (limite inferior de controle) e uma linha média do processo (limite central), que foram estatisticamente determinadas. 39 QUESTÕES 1. (IADES 2013 EBSERH) “Costuma ser encontrada com maior frequência em jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de simplificar informações.” O texto faz referência à: a) Estatística inferencial b) Estatística de probabilidade c) Estatística por amostragem d) Estatística descritiva e) Média aritmética 2. (FUNCAB 2013 ANS) A estatística descritiva: a) permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. b) é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. c) é a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes. d) é a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. e) é a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. 3. (FEMPERJ 2012 TCE RJ) Uma atividade típica da Estatística Inferencial é: a) calcular taxas; b) descrever dados em tabelas; c) definir índices; d) estimar tamanho amostral; e) estabelecer hipóteses. 40 4. (FCC 2010 TCM PA) A técnica que consiste em dividir uma população em subpopulações, cada qual contendo um grupo de unidades de amostragem com características homogêneas ou similares, é denominada amostragem: a) randômica. b) estratificada. c) não estatística. d) por julgamento. e) não aleatória. 5. (UNIRIO 2012) No âmbito das bibliotecas universitárias, a estatística é considerada uma das ferramentas para analisar os dados bibliográficos, de circulação e de uso do material da biblioteca. Todo grupo de objetos ou indivíduos observados e o conjunto de dados que se deseja estudar na biblioteca são denominados: a) inferência e variáveis. b) população e amostra. c) gráfico e tabelas. d) indicadores e média. e) amostragem e frequência. 6. (FCC 2009 TRE MG) O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram, respectivamente: a) censo e amostragem por conglomerados. b) amostragem aleatória e amostragem sistemática. c) censo e amostragem casual simples. d) amostragem estratificada e amostragem sistemática. e) amostragem sistemática e amostragem em dois estágios. 41 7. (CESPE 2011) Julgue o item subsecutivo, relativo a planejamento e organização de pesquisas. Após a coleta de dados, as tabelas de contingência representam uma forma de tabulação útil para avaliar relacionamento entre duas variáveis qualitativas. 8. (AOCP 2012) A respeito de gráficos estatísticos, assinale a alternativa correta. a) A representação gráfica por pictogramas utiliza símbolos relacionados à ideia central dos dados que se deseja representar. Nesse gráfico, as barras são substituídas pelos símbolos e a quantidade de símbolos em cada “barra” corresponde à frequência relativa. b) Em um gráfico de colunas, as alturas de cada retângulo independem dos dados. c) Dados que estejam organizados apenas em uma coluna ou linha, em uma planilha, podem ser plotados em um gráfico de setor e os setores representam as proporções das categorias. d) Um gráfico de barras apresenta a frequência absoluta (ou relativa) cumulativa. e) Em um gráfico de linhas, os dados de categorias são distribuídos uniformemente ao longo do eixo vertical, e todos os valores são distribuídos igualmente ao longo do eixo horizontal. 9. (IESES 2014) Com relação as medidas de tendência central assinale a alternativa INCORRETA: a) A moda não é influenciada por valores extremos (outliers). b) A média pode apresentar um valor maior que a moda. c) A média é influenciada por valores extremos (outliers). d) A mediana é influenciada pelos valores extremos (outliers). 10. (CESGRANRIO 2011) A respeito das medidas de tendência central e de dispersão de uma distribuição de probabilidades, verifica-se que a(o): a) moda é sempre maior que a média. b) mediana é sempre menor que o desvio padrão. c) variância é sempre o dobro do desvio padrão. d) variância é uma medida de tendência central. e) desvio padrão é uma medida de dispersão 42 11. (FUNIVERSA 2012) Com relação aos principais conceitos de estatística descritiva, assinale a alternativa correta. a) Frequência relativa simples é o número de vezes em que determinado valor aparece em uma população ou em uma amostra. b) Ponto médio de classe é a soma das frequências absolutas simples dos valores inferiores ou iguais a determinado valor. c) Amplitude de classe é a diferença entre o mais alto e o mais baixo dos valores de uma distribuição. d) Rol são dados não organizados numericamente, ou seja, aqueles que não se encontram preparados para análise. e) Variável contínua é aquela que pode assumir, teoricamente, qualquer valor em certo intervalo da reta real. 12. (CESGRANRIO 2010) Um especialista reconhece as técnicas de estatística descritiva, sabendo, dentre elas, ser uma EXCEÇÃO: a) os histogramas. b) os testes de hipótese. c) os polígonos de frequência. d) o gráfico de setores. e) as medidas de dispersão. 13. (CESGRANRIO 2010) Histogramas e polígonos de frequências são duas representações gráficas de distribuições a) uniformes. b) de frequências. c) de acumulações. d) não uniformes. e) assimétricas. 14. (CESGRANRIO 2014) Quando os dados referentes aos problemas são mostrados em histograma, objetiva-se: a) analisar o processo procurando pontos fora dos limites de controle b) facilitar o entendimento da distribuição de dados c) verificar se o processo foi estabilizado após uma atividade de melhoria. d) buscar causas ativamente, de forma sinérgica e devidamente registradas e hierarquizadas. e) representar graficamente cada processo, informando seu respectivo peso e a expectativa de execução. 43 15. (CESPE 2011) Um histograma é um gráfico que representa a dispersão tanto de variáveis discretas quanto de contínuas. 16. (IBFC 2012) Gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência: a) Polígono de frequência b) Polígono de frequência acumulada c) Setor circular d) Histograma e) Pictogramas 17. (VUNESP 2009) Um evento cujo resultado coincide com a totalidade do espaço amostral e que, portanto, acontecerá sem nenhuma chance do contrário é um evento: a) nulo. b) complementar. c) mutuamente exclusivo. d) certo. e) composto. 18. (AOCP 2015) Referente à estatística e à probabilidade, assinale a alternativa INCORRETA. a) Probabilidade é a medida de como um evento é provável de ocorrer dado um número de possíveis resultados. b) Calcular a probabilidade permite que você use a lógica e a razão, mesmo com algum grau de incerteza. c) A distribuição de probabilidade é uma função que determina probabilidades para eventos ou proposições. d) Estatística é a ciência que se utiliza das teorias probabilísticas para explicar a frequência da ocorrência de um evento. e) Uma variável aleatória não pode ser entendida como uma variável quantitativa, cujo resultado depende de fatores aleatórios. 44 19. (CESPE 2012) Considere os eventos A, B, C e D, definidos abaixo, relativos ao número de veículos por família em determinada cidade. A = uma família possui 1 ou mais veículos; B = uma família possui 2 ou mais veículos; C = uma família possui 3 ou mais veículos; D = uma família possui 4 ou mais veículos. Considere, ainda, que as probabilidades de ocorrência desses eventos são: P(A) = 0,9; P(B) = 0,6; P(C) = 0,3 e P(D) = 0. Com base nessas informações, julgue os itens que se seguem. A probabilidade condicional é inferior a 0,6. 20. (FCC 2010) Na gestão da qualidade, a ferramenta que auxilia o gestor a visualizar a alteração sofrida por uma variável quando outra se modifica é denominada: a) gráfico de Pareto. b) diagrama de dispersão. c) histograma. d) diagrama de causa e efeito. e) carta de controle. 45 GABARITO 1 D 2 C 3 E 4 B 5 B 6 C 7 Certo 8 C 9 D 10 E 11 E 12 B 13 B 14 B 15 Errado 16 D 17 D 18 E 19 Errado 20 B 46 47