Lista de Exercícios 1 – Tópicos Especiais em Banco de Dados (SCC

Propaganda
Lista de Exercícios 1 – Tópicos Especiais em Banco de Dados (SCC-0542)
Resposta dos exercícios de simulação de algoritmos
2. Considerando o conjunto X abaixo, faça:
x1 2 2 3
x2 7 9 8
x3 7 2 1
x4 3 9 9
x5 6 2 2
x6 6 9 5
x7 8 1 3
x8 4 9 6
a) Simule a execução do algoritmo k-médias com os centróides iniciais
m1=[1,0,0] e m2=[0,0,1] até convergir (os centróides serem iguais em duas
iterações consecutivas). Quais as coordenadas finais dos centróides e o
valor de SEQ da partição final?
b) Simule a execução do algoritmo hierárquico Single-Linkage e apresente o
dendrograma obtido.
c) Simule a execução do algoritmo hierárquico Complete-Linkage e
apresente o dendrograma obtido.
x9 6 1 3
x10 2 8 6
a) Matriz de distâncias entre objetos e centróides iniciais:
x1 x2 x3
x4
x5
x6
x7
x8
x9
x10
c1
14 181 41 166 33 131 59 126 35 101
c2
12 179 53 154 41 133 69 122 41
93
2
2
Centróide mais próximo
2
1
2
1
1
1
2
1
Novas posições centróides:
c1=([7,2,1]+[6,2,2]+[6,9,5]+[8,1,3]+[6,1,3])/5 = [6.6, 3.0, 2.8]
c2=([2,2,3]+[7,9,8]+[3,9,9]+[4,9,6]+[2,8,6])/5 = [3.6, 7.4, 6.4]
Matriz de distâncias entre objetos e novos centróides (valores truncados):
x1 x2 x3 x4 x5 x6 x7
x9 x10
c1
22 63
4
87
2
6
53
4
56
c2
43 16 69
9
54 10 71
2
58
3
1
2
1
2
1
2
Centróide mais próximo
2
1
41
x8
2
1
Novas posições centróides:
c1=([2,2,3]+[7,2,1]+[6,2,2]+[8,1,3]+[6,1,3])/5 = [5.8, 1.6, 2.4]
c2=([7,9,8]+[3,9,9]+[6,9,5]+[4,9,6]+[2,8,6])/5 = [4.4, 8.8, 6.8]
Matriz de distâncias entre objetos e novos centróides (valores truncados):
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
c1
14 87
3
106
0
61
5
70
0
68
c2
66
8
86
6
71
5
88
0
77
7
Centróide mais próximo
1
2
1
2
1
2
1
2
1
2
b) Matriz de distâncias (Euclidiana ao quadrado) entre objetos:
x1
x2
x3
x4
x5 x6 x7 x8 x9
x2
99
x3
29 98
x4
86 17 129
x5
17 86
x6
69 10 66
25 58
x7
37 90
125 6 72
x8
62 13 83
10 69 5 89
x9
17 90
109 2 68 4 77
2
6
6
x10 45 30 86
107
11 68 18 94 5 74
[ Altura das uniões (valores eixo y): 2,2,4,5,5,10,10,17,45]
c) Mesma matriz de distâncias utilizada em b.
[ Altura das uniões (valores eixo y): 2,4,5,6,11,13,30,37,129]
6. Simule a execução de uma iteração do algoritmo Spherical K-means nos dados abaixo e
apresente os centróides obtidos. Considere como centróides iniciais: m1=[0,1,0,1,0,1,0,1,0,1] e
m2=[1,0,1,0,1,0,1,0,1,0]. Aplique a normalização apropriada.
x1 0 1 1 1 0 0 1 0 0 1
x2 1 0 1 0 1 0 1 0 0 1
x3 1 0 1 0 1 0 1 1 0 0
x4 0 1 1 0 1 0 0 1 1 0
x5 1 0 1 1 0 1 1 0 0 0
x6 0 1 0 1 1 0 0 1 0 1
x7 1 0 1 0 0 0 1 1 0 1
x8 0 0 0 1 0 1 0 1 1 1
x9 0 0 0 1 1 0 1 1 1 0
x10 0 1 0 0 0 1 0 1 1 1
Devido a todos os vetores terem norma=raiz(5), valores 1 nos dados são normalizados para o
valor 1/raiz(5).
Matriz de similaridades:
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
c1
3/5
1/5
1/5
2/5
2/5
4/5
2/5
4/5
2/5
4/5
c2
2/5
4/5
4/5
3/5
3/5
1/5
3/5
1/5
3/5
1/5
Centróide mais similar
1
2
2
2
2
1
2
1
2
1
Novas posições centróides:
Valores em decimal (considere os vetores x após a normalização, valores truncados):
m1=(x1+x6+x8+x10)/4 = [0; 0,33; 0,11; 0,33; 0,11; 0,22; 0,11; 0,33; 0,22; 0,44]
m2=(x2+x3+x4+x5+x7+x9])/6 = [0,29; 0,07; 0,37; 0,14; 0,29; 0,07; 0,37; 0,29; 0,14; 0,14]
Valores em frações:
m1=( 4 * raiz(5) )-1 * (x1+x6+x8+x10) = ( 4 * raiz(5) )-1 [ 4; 1; 5; 2; 4; 1; 5; 4; 2; 2]
m2=( 6 * raiz(5) )-1 * (x2+x3+x4+x5+x7+x9) = ( 6 * raiz(5) )-1 [ 0; 3; 1; 3; 1; 2; 1; 3; 2; 4]
Centróides após normalização:
c1=[ 0; 0,4; 0,13; 0,4; 0,13; 0,27; 0,13; 0,4; 0,27; 0,54 ]
c2=[0,37; 0,09; 0,47; 0,18; 0,37; 0,09; 0,47; 0,37; 0,18; 0,18]
Download