Módulo 9 4 Algoritmos 4.1 Definição e Características 4.2 Fatoração 4.3 Pesquisa 4.3.1 Pesquisa Sequencial 4.3.2 Pesquisa Binária DCC 001 Programação de Computadores 2° Semestre de 2011 Prof. Osvaldo Carvalho DCC001 - 2011-2 1 Algoritmos e Programas DCC001 - 2011-2 2 Algoritmos e Programas Algoritmo Prescrição de passos para transformar uma informação de entrada em outra informação de saída Cada passo prescrito deve ser uma operação garantidamente realizável seja por operações elementares seja por outro algoritmo Programa Um programa é a concretização de um algoritmo em uma linguagem executável DCC001 - 2011-2 3 Questões sobre Algoritmos e Problemas Especificação: Para qual problema precisamos de um algoritmo? Correção: O algoritmo resolve mesmo o problema proposto? Eficiência: Qual é o consumo de recursos computacionais (tempo e memória, essencialmente) para se resolver o problema? DCC001 - 2011-2 4 Especificação Surge de um processo de análise de um problema de transformação de informação Não é estática; muitas vezes uma especificação é modificada durante o processo de desenvolvimento, ou mesmo durante o uso de um programa Ex. O caso de equações de 2º grau com o primeiro coeficiente igual a zero não foi previsto em nossos exemplos Em problemas reais muitas vezes a especificação é a etapa mais demorada DCC001 - 2011-2 5 Correção Podemos verificar se um algoritmo atende a uma especificação por um exame de sua estrutura – uma prova formal de sua correção Na prática somente algoritmos pequenos têm uma prova de correção viável Testes são usados para ganhar convicção do bom funcionamento de um algoritmo Testes podem descobrir erros, mas quase nunca garantir sua ausência DCC001 - 2011-2 6 Somador em Cascata Entrada b Entrada a SC DCC001 - 2011-2 SC SC SC 7 Somador Testes ou Prova Formal? Para testar completamente um somador de 32 bits são necessários 264 testes! Se estamos convencidos da correção de um circuito de soma completa, não temos problemas em aceitar a correção do somador É da compreensão da estrutura do somador que vem a nossa convicção; testes viáveis cobrem uma fração ínfima do espaço de entradas DCC001 - 2011-2 8 Eficiência Algoritmos com a mesma funcionalidade podem diferir muito em sua eficiência O termo complexidade é usado para designar uma função que descreve como o uso de recursos computacionais cresce com o tamanho da entrada de um algoritmo Procura-se determinar a complexidade de um algoritmo de forma independente da velocidade de um computador específico e de outros fatores que afetam o tempo de execução de um programa DCC001 - 2011-2 9 Fatoração DCC001 - 2011-2 10 Fatoração de Inteiros Consiste em descobrir o menor divisor > 1 de um número inteiro n >= 2 dado (se este fator for igual a n, n é primo) Uma boa parte da segurança da informação em uso hoje em dia depende da dificuldade computacional de se fatorar um número Chaves criptográficas podem ser quebradas por fatoração Estas chaves são produtos de dois primos grandes, com 1024 ou 2048 bits cada DCC001 - 2011-2 11 A função MenorFator function p = MenorFator(n) p = 2; while modulo(n,p) <> 0 p = p + 1; end endfunction function ehPrimo = Primo(n) ehPrimo = (n == MenorFator(n)); endfunction DCC001 - 2011-2 12 O programa Fatora.sce exec("MenorFator.sci"); n = input("n = "); while n >= 2 timer(); p = MenorFator(n) ; tempoGasto = timer(); // Imprime o resultado printf("\nTempo = %8.6fs, %6d é divisível por %6d",... tempoGasto,n,p); if n == p then printf(" **PRIMO**") end n = input("n = "); end DCC001 - 2011-2 13 Dois Casos de Fatoração Para 131101, primo, são feitas 131101 chamadas da função modulo Para 131103, somente 3 chamadas! Conclusão: o tempo de execução pode depender da instância específica do problema Para a fatoração, primos são o pior caso Tempo = 3.062500s, 131101 é divisível por 131101 **PRIMO** n = 131103 Tempo = 0.000000s, 131103 é divisível por DCC001 - 2011-2 3 14 Variações no Tempo de Execução n = 131101 Tempo = 2.984375s, 131101 é divisível por 131101 **PRIMO** n = 131101 Tempo = 3.078125s, 131101 é divisível por 131101 **PRIMO** n = 131101 Tempo = 3.015625s, 131101 é divisível por 131101 **PRIMO** Um mesmo programa pode apresentar variações no tempo de execução de uma mesma instância de um problema O principal motivo é o compartilhamento do computador DCC001 - 2011-2 15 Tempos do Programa Fatora.sce em dois computadores Somente números primos DCC001 - 2011-2 16 Função de Complexidade n é o tamanho de uma instância de um problema Uma função g n caracteriza a complexidade de um algoritmo quando o seu tempo de execução é limitado por g n multiplicado por uma constante A idéia é absorver na constante diferenças de desempenho entre computadores específicos Escreve-se T n O g n (“big O notation”) DCC001 - 2011-2 17 Complexidade da função MenorFator em função do número de bits na entrada T n O 2n DCC001 - 2011-2 18 Melhorando a Fatoração Se d é um divisor de n, existe d’ tal que d*d’ = n Temos ou d <= sqrt(n), ou d’ <= sqrt(n) Portanto, ao fatorar só precisamos testar os divisores menores ou iguais à raiz de n P.ex., sqrt(12) = 3,464, e só precisamos testar divisores menores ou iguais a 3 DCC001 - 2011-2 d 1 2 3 4 6 12 d' 12 6 4 3 2 1 19 A Função MenorFator2.sce function p = MenorFator2(n) limite = int(sqrt(n)); p = 2; while modulo(n,p) <> 0 & p <= limite p = p + 1; end if modulo(n,p) <> 0 then p = n; end endfunction T n O 2 O2 n DCC001 - 2011-2 n/2 20 Complexidade O(2^n) versus O(2^(n/2)) Quando n = 10 bits a função modulo é chamada ~1024 vezes com o primeiro algoritmo, e ~32 com o segundo. Quando dobramos o tamanho do problema, com n = 20 bits, a função modulo é chamada ~1048576 vezes com o primeiro algoritmo, ou seja, 1024 vezes o tempo para n = 10 ~1024 vezes com o segundo algoritmo, ou seja, 32 vezes o tempo para n = 10! DCC001 - 2011-2 21 Pesquisa DCC001 - 2011-2 22 Pesquisa em Tabelas Localizar um elemento em uma tabela é um problema clássico da computação Vamos ver dois algoritmos para isto: Pesquisa Sequencial Pesquisa Binária DCC001 - 2011-2 23 Pesquisa por um Número Primo Vamos utilizar algoritmos de pesquisa para testar se um número é primo Obviamente isto só funciona para números menores ou iguais ao maior número presente na tabela DCC001 - 2011-2 24 Tabela de Números Primos Números primos têm propriedades matemáticas interessantes, e por isso são muito estudados Na internet é possível encontrar arquivos com os primeiros muitos números primos O arquivo 200000primos.txt contém os 200.000 primeiros números primos DCC001 - 2011-2 25 Início e Final do Arquivo 200000primos.txt DCC001 - 2011-2 26 Especificação Faça um programa que Leia o arquivo 200000primos.txt que contém os primeiros 200000 números primos Leia repetidamente números inteiros e, para cada número lido, verifique se o número é primo utilizando a tabela lida. O programa deve parar quando o número lido for 0 (zero). DCC001 - 2011-2 27 Pesquisa Sequencial DCC001 - 2011-2 28 Pesquisa Sequencial function p = seqSearch(key,table) i = 1; // A chave nunca está à esquerda de i while i <= length(table) & table(i) ~= key i = i+1; end if i <= length(table) then p = i; else Convenção para valor p = -1; retornado quando a end pesquisa falha endfunction DCC001 - 2011-2 29 O Programa VerificaPrimos3.sce arqTab = xgetfile("*.txt",pwd(),"Arquivo com Tabela"); tabPrimos = fscanfMat(arqTab); n = input("n = "); while n >= 2 timer();eh_Primo = Primo3(n,tabPrimos); tempoGasto = timer(); // Imprime o resultado printf("\nTempo gasto = %g segundos", tempoGasto); if eh_Primo then printf("\nO número %d é primo!\n\n",n); else printf("\nO número %d não é primo!\n\n", n) end n = input("n = "); end DCC001 - 2011-2 30 A Função Primo3.sce function ePrimo = Primo3(n,tabela) ePrimo = seqSearch(n,tabela) ~= -1; endfunction DCC001 - 2011-2 31 Complexidade da Pesquisa Sequencial Não é difícil ver que se n é o tamanho da tabela, o número de comparações feito em uma pesquisa por um elemento presente na tabela varia entre 1 e n Se considerarmos todas as chaves presentes na tabela como tendo a mesma probabilidade de serem pesquisadas, o algoritmo fará em média n/2 comparações O pior caso ocorre com pesquisas por chaves que não constam da tabela, quando são feitas n comparações Nós dizemos que a complexidade da pesquisa sequencial é O(n), ou seja, cresce linearmente com o tamanho da tabela DCC001 - 2011-2 32 Pesquisa Binária DCC001 - 2011-2 33 Pesquisa Binária Quando a tabela tem suas entradas em ordem crescente (ou decrescente), podemos utilizar um algoritmo muito mais eficiente para a pesquisa A chave é comparada com o elemento no meio da tabela. Se a chave for DCC001 - 2011-2 Igual a este elemento: sucesso Menor: a pesquisa é reaplicada à metade inferior da tabela Maior: a pesquisa é reaplicada à metade superior da tabela 34 Procurando por Procurando por7171 1 2 3 4 5 6 7 8 9 10 DCC001 - 2011-2 20 35 46 48 58 68 71 74 87 98 6 7 8 9 10 68 71 74 87 98 6 68 7 71 7 71 35 Procurando por Procurando por 37 37 1 2 3 4 5 6 7 8 9 10 DCC001 - 2011-2 20 35 46 48 58 68 71 74 87 98 1 2 3 4 20 35 46 48 3 46 4 48 36 Pesquisa Binária function p = BinarySearch(key,table,low,high) printf("\nlength(table) = %d",high-low); //extra if high < low then p = -1; else m = int((low+high)/2); if key == table(m) then p = m; else if key < table(m) then p = BinarySearch(key,table,low,m-1); else p = BinarySearch(key,table,m+1,high); end end end endfunction DCC001 - 2011-2 37 O Programa VerificaPrimos5.sce // Programa para deteção de números primos exec("Primo5.sci") exec("BinarySearch.sci") arqTab = uigetfile("*.txt",pwd(),"Arquivo com Tabela"); tabPrimos = fscanfMat(arqTab); n = input("n = "); while n >= 2 timer(); eh_Primo = Primo5(n,tabPrimos); tempoGasto = timer(); // Imprime o resultado printf("\nTempo gasto = %g segundos", tempoGasto); if eh_Primo then printf("\nO número %d é primo!\n\n",n); else printf("\nO número %d não é primo!\n\n", n) end n = input("n = "); end DCC001 - 2011-2 38 A Função Primo5.sci function ePrimo = Primo5(n,tabela) posicao = BinarySearch( n,tabela,1,length(tabela)); ePrimo = (posicao <> -1); endfunction DCC001 - 2011-2 39 Pesquisa Binária Passos para n = 16 São 4 passos no pior caso 24 23 22 21 20 DCC001 - 2011-2 40 Pesquisa Binária Qual é a maior tabela pesquisável com p passos? Com p passos uma pesquisa é completada em uma tabela de tamanho <= 2p 20 21 22 2p DCC001 - 2011-2 … … 41 Complexidade da Pesquisa Binária A cada passo o tamanho da porção da tabela é DCC001 - 2011-2 dividido por 2 No pior caso, o algoritmo termina quando o tamanho dessa porção é igual a 1 Com p passos, reduzimos a 1 o tamanho da porção examinada de uma tabela com n =~ 2p elementos Temos no máximo log2(n) passos Ou seja, a complexidade da pesquisa binária é logarítimica 42 Complexidade linear x complexidade logarítmica Para pesquisar em uma tabela de 200.000 elementos, a pesquisa binária faz no máximo log2(200.000) =~ 18 comparações Para a mesma tabela, a pesquisa sequencial pode necessitar de 200.000 comparações; Se dobrarmos o tamanho da tabela, a pesquisa binária fará no máximo 19 comparações (uma a mais), enquanto que a pesquisa sequencial poderá fazer 400.000 comparações! DCC001 - 2011-2 43 Resumo Aspectos fundamentais do estudo de algoritmos são especificação, correção e complexidade Algoritmos podem ter desempenhos distintos para instâncias distintas de um mesmo problema Procuramos caracterizar a complexidade de forma independente do desempenho de máquinas específicas DCC001 - 2011-2 44 Resumo Muitas vezes podemos encontrar melhores algoritmos estudando propriedades do problema de transformação de informação Algumas funções de complexidade indicam que poderíamos esperar milênios pela execução de um programa DCC001 - 2011-2 45