Lista de Exercícios 1 – Tópicos Especiais em Banco de Dados (SCC-0542) Resposta dos exercícios de simulação de algoritmos 2. Considerando o conjunto X abaixo, faça: x1 2 2 3 x2 7 9 8 x3 7 2 1 x4 3 9 9 x5 6 2 2 x6 6 9 5 x7 8 1 3 x8 4 9 6 a) Simule a execução do algoritmo k-médias com os centróides iniciais m1=[1,0,0] e m2=[0,0,1] até convergir (os centróides serem iguais em duas iterações consecutivas). Quais as coordenadas finais dos centróides e o valor de SEQ da partição final? b) Simule a execução do algoritmo hierárquico Single-Linkage e apresente o dendrograma obtido. c) Simule a execução do algoritmo hierárquico Complete-Linkage e apresente o dendrograma obtido. x9 6 1 3 x10 2 8 6 a) Matriz de distâncias entre objetos e centróides iniciais: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 c1 14 181 41 166 33 131 59 126 35 101 c2 12 179 53 154 41 133 69 122 41 93 2 2 Centróide mais próximo 2 1 2 1 1 1 2 1 Novas posições centróides: c1=([7,2,1]+[6,2,2]+[6,9,5]+[8,1,3]+[6,1,3])/5 = [6.6, 3.0, 2.8] c2=([2,2,3]+[7,9,8]+[3,9,9]+[4,9,6]+[2,8,6])/5 = [3.6, 7.4, 6.4] Matriz de distâncias entre objetos e novos centróides (valores truncados): x1 x2 x3 x4 x5 x6 x7 x9 x10 c1 22 63 4 87 2 6 53 4 56 c2 43 16 69 9 54 10 71 2 58 3 1 2 1 2 1 2 Centróide mais próximo 2 1 41 x8 2 1 Novas posições centróides: c1=([2,2,3]+[7,2,1]+[6,2,2]+[8,1,3]+[6,1,3])/5 = [5.8, 1.6, 2.4] c2=([7,9,8]+[3,9,9]+[6,9,5]+[4,9,6]+[2,8,6])/5 = [4.4, 8.8, 6.8] Matriz de distâncias entre objetos e novos centróides (valores truncados): x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 c1 14 87 3 106 0 61 5 70 0 68 c2 66 8 86 6 71 5 88 0 77 7 Centróide mais próximo 1 2 1 2 1 2 1 2 1 2 b) Matriz de distâncias (Euclidiana ao quadrado) entre objetos: x1 x2 x3 x4 x5 x6 x7 x8 x9 x2 99 x3 29 98 x4 86 17 129 x5 17 86 x6 69 10 66 25 58 x7 37 90 125 6 72 x8 62 13 83 10 69 5 89 x9 17 90 109 2 68 4 77 2 6 6 x10 45 30 86 107 11 68 18 94 5 74 [ Altura das uniões (valores eixo y): 2,2,4,5,5,10,10,17,45] c) Mesma matriz de distâncias utilizada em b. [ Altura das uniões (valores eixo y): 2,4,5,6,11,13,30,37,129] 6. Simule a execução de uma iteração do algoritmo Spherical K-means nos dados abaixo e apresente os centróides obtidos. Considere como centróides iniciais: m1=[0,1,0,1,0,1,0,1,0,1] e m2=[1,0,1,0,1,0,1,0,1,0]. Aplique a normalização apropriada. x1 0 1 1 1 0 0 1 0 0 1 x2 1 0 1 0 1 0 1 0 0 1 x3 1 0 1 0 1 0 1 1 0 0 x4 0 1 1 0 1 0 0 1 1 0 x5 1 0 1 1 0 1 1 0 0 0 x6 0 1 0 1 1 0 0 1 0 1 x7 1 0 1 0 0 0 1 1 0 1 x8 0 0 0 1 0 1 0 1 1 1 x9 0 0 0 1 1 0 1 1 1 0 x10 0 1 0 0 0 1 0 1 1 1 Devido a todos os vetores terem norma=raiz(5), valores 1 nos dados são normalizados para o valor 1/raiz(5). Matriz de similaridades: x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 c1 3/5 1/5 1/5 2/5 2/5 4/5 2/5 4/5 2/5 4/5 c2 2/5 4/5 4/5 3/5 3/5 1/5 3/5 1/5 3/5 1/5 Centróide mais similar 1 2 2 2 2 1 2 1 2 1 Novas posições centróides: Valores em decimal (considere os vetores x após a normalização, valores truncados): m1=(x1+x6+x8+x10)/4 = [0; 0,33; 0,11; 0,33; 0,11; 0,22; 0,11; 0,33; 0,22; 0,44] m2=(x2+x3+x4+x5+x7+x9])/6 = [0,29; 0,07; 0,37; 0,14; 0,29; 0,07; 0,37; 0,29; 0,14; 0,14] Valores em frações: m1=( 4 * raiz(5) )-1 * (x1+x6+x8+x10) = ( 4 * raiz(5) )-1 [ 4; 1; 5; 2; 4; 1; 5; 4; 2; 2] m2=( 6 * raiz(5) )-1 * (x2+x3+x4+x5+x7+x9) = ( 6 * raiz(5) )-1 [ 0; 3; 1; 3; 1; 2; 1; 3; 2; 4] Centróides após normalização: c1=[ 0; 0,4; 0,13; 0,4; 0,13; 0,27; 0,13; 0,4; 0,27; 0,54 ] c2=[0,37; 0,09; 0,47; 0,18; 0,37; 0,09; 0,47; 0,37; 0,18; 0,18]