Ficha_AR1_ 7_Troubleshooting - AEISTECP

ISTEC Porto
AR1
Guião 7
Nº: 667
Nome: João Ribeiro
Curso: Licenciatura em Informática
Data: 11-12-2013
Questões
1. Onde se enquadra o Troubleshooting? Que tipo de problemas? Qual o
princípio?
- O troubleshooting enquadra-se na Gestão da rede, na fase de diagnóstico de
problemas, o tipo de problemas são:
 Falha de conetividade/segurança;
 Degradação de desempenho;
O princípio do troubleshooting é:
 Vários sintomas como:
o Incapacidades de clientes se ligarem a determinados servidores;
o Rotas inexistentes em tabelas de routing;
o Etc;
 Cada sintoma resulta de um ou vários problemas ou causas;
 Depois de ser identificado, cada problema/causa deve ser remediado;
 Solução consiste numa serie de ações;
2. Quais as fases do Troubleshooting?
- As fases do troubleshooting são:
Definir os sintomas;
Identificar problemas/causas;
Implementar soluções genéricas/particulares;
1
3. Qual a metodologia estudada para o Troubleshooting? Faça o esquema
ilustrativo e explique cada passo.
FIM
INICIO
Definir Problemas
Definir Problemas
Agregar Factos
Definir Problemas
Considerar Possibilidades
SIM
Criar Plano de Acão
Implementar Planos de Ação
Sintomas
Desapareceram?
Observar Resultados
NÃO
Iterar Processo
Definir problemas:
 Quais são os sintomas?
 Quando, com que frequência, onde?
 Quais são as causas possíveis/prováveis?
Agregar factos:
 Alguma coisa mudou recentemente?
 Efetuar verificações:
o Routers/switches;
o Syslog:
o Plataforma de gestão;
Considerar possibilidades:
 Reavaliar causas possíveis;
 Tentar reduzir o número de possibilidades; (Por exclusão de partes)
 Identificar tudo o que é necessário verificar.
2
Criar plano de ação:
 Definir procedimento de resolução de problemas;
o Seccionar sempre que possível;
 Começar num dispositivo de origem;
 Testar todas as possibilidades;
Implementar plano de ação:
 Executar procedimentos;
 Verificar à medida que se testa;
 Estar preparado para fazer roll-back;
Observar resultados:
 Observar o resultado de cada passo do plano de ação;
 Fazer referência à definição do problema;
 Fazer referência aos testes na fase de agregação de factos;
 Pela observação se determinará se os sintomas se mantêm;
Se sintomas não se mantêm:
 Documentar todo o processo;
 Terminar metodologia;

Se sintomas se mantêm:
 Nova iteração do processo de resolução;
 Criar novo plano de ação;
o Talvez baseado numa nova agregação de factos;
o Seguir sequência até à observação de resultados;
Processo só termina quando sintomas terminaram;
4. Indique algumas das ferramentas de Troubleshooting e para que servem.
Comandos de nós de redes;
- Show – vários comandos;
o Permitem monitorizar o comportamento do dispositivo e da rede.
o Ex: show interfaces.
- Debug – assiste no isolamento de problemas no dispositivo/rede;
- Ping – determinar conetividade entre nós;
- Trace/Traceroute – determinar rota que pacotes seguem entre dois nós;
3
Aplicações de gestão (exemplos)
 CiscoWorks
o CiscoView: display gráfico, estatísticas, configurações e funções de
troubleshooting;
o Internet Performance Monitor (IPM);
 Monitorizar latência, definir thresholds, etc;
o TrafficDirector, VlanDirector, etc;
 OpenNMS, Ping, MRTG, traceroute, etc;
Traps e Syslog;
Outras:
 Voltímetros, multímetros digitais, “cable testers”;
 Time-domain
Reflectometers
(TDRs)
e
Optical
Time-Domain
Reflectometers (OTDRs):
o Permitem determinar a localização de falhas nos cabos, impedâncias
desadaptadas, etc;
 Breakout boxes, BERTs/BLERTs:
o Testam interfaces de periféricos (impressoras, modems, CSU/DSU);
 Network Monitors/Protocol Analysers;
5. Como proceder se existir falha num dos módulos?





Geralmente resultam em perda de conetividade, erros de comunicação,
degradação do desempenho;
Detetam-se remotamente:
o Plataformas de gestão: traps;
o Reclamações/notificações;
Ou localmente:
o Através dos LEDs:
 Desligados/laranja, a piscar, etc;
 Depende do dispositivo e fabricante;
Resolução do problema:
o Ligar/desligar o módulo (se possível, via software);
o Substituir o módulo (primeiro deve ser desativo pela CLI e devem
ser acionadas eventuais mecanismos de redundância);
o Por vezes também resulta substituir o módulo por outro de um tipo
de diferente e depois voltar a colocar o primeiro;
Módulos de software:
o Trace level <modid> <level>
4
6. O que são Traps?
Traps são alarmes, que são despoletados por:
o Falhas de módulos;
o Falhas de interfaces;
o Falhas de portas/ligações (link flaps);
o Falhas de fontes de alimentação;
o Falhas de ventilação;
o Temperatura;
Polling deteta, por exemplo:
o Falhas de comunicação com o dispositivo, pode requerer troubleshooting
local, por porta série;
7. Quais os problemas típicos dos Servidores?
- Os problemas são:
o Servidor não liga: problema de fonte de alimentação, power cord,
componentes internos danificados, etc;
o Servidor não inicia: (boot): erros do SO, (corrupção de dados;
o Falhas nas drives, KVM (Keyboard, Video, Mouse);
o Tempos de resposta elevados (problema interno ou externo);
o Outros: temperatura elevada, falha de conetividade, não recebe traps
(porta 162);
8. Quais os problemas típicos nas ligações óticas?
- Os




problemas típicos são:
Falhas nos transceiver (potencia tx insuficiente);
Links danificados;
Transceiver mismatch: 1000BASE-SX/LX;
Tipo de fibra errado.
9. Para que serve o Internal Loopback Testing?
- O Internal Loopback Testing serve para assegurar que os circuitos internos do
transceiver associado a uma determinada porta estão a funcionar corretamente, o
que significa que os pacotes podem ser transmitidos/recebidos internamente;
A operação pode ser efetuada a partir de plataforma de gestão, desde que o nó
esteja acessível;
5
10.
Quais os potenciais problemas associados à Conetividade IP?









Router não contém rota para determinado destino;
Routing loop: falha no protocolo de encaminhamento;
Falha de conetividade física;
Problema de recurso em nó de rede;
Pouca memória, buffers, utilização de CPU;
Problema de configuração num nó de rede;
Problema de software/firmware num no de rede;
Filtro de pacotes pode estar a impedir a comunicação (firewall);
MTU mismatch;
6