1 / 34

Administración y Monitoreo de Redes

Diseño y Operaciones de Redes Hervey Allen hervey@nsrc.org Carlos Armas carmas@roundtripnetworks.com. Administración y Monitoreo de Redes. Introducción. Este es un tópico extenso... Muchas herramientas para escoger: Open Source Comerciales

lynsey
Download Presentation

Administración y Monitoreo de Redes

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diseño y Operaciones de Redes Hervey Allen hervey@nsrc.org Carlos Armas carmas@roundtripnetworks.com Administración y Monitoreo de Redes

  2. Introducción • Este es un tópico extenso... • Muchas herramientas para escoger: • Open Source • Comerciales • Para Linux/Unix, para Windows • Herramientas de proveedores de equipos de red (Cisco, Juniper, others) • No hay una combinación perfecta • La decisión debe basarse de acuerdo a lo que se necesita saber de la red

  3. Quéesadministración de redes? • Monitoreo de Sistemas y Servicios • Accesible? Disponible? • Medición de recursos • Planificación de capacidadfutura, disponibilidad • Monitoreo de Rendimiento • RTT, volumen de tráfico‏ • Medición de Estadisticas, y Facturación • Gestión de Fallas, Detección de Intrusos • Detección de fallas, diagnóstico, seguimiento • NOC, Sistemas de Gestión de Incidencias • Gestión de Cambios, y Monitoreo de Configuraciones

  4. Visión General • - Monitoreo • Recolección de Datos • - Conteo Notificaciones Ticket - Control de cambios ymonitoreo • - Planear/Capacidad • Disponibilidad(SLAs)‏ • - Tendencias • - Detectarproblemas Herramientas NOC - Sistema de Tickets Ticket Ticket Ticket - Mejoramientos - Actualizaciones Ticket - Quejas de Clientes - Solicitudes - Arreglarproblemas

  5. Porquéadministración de redes? • Asegurarseque la red estáfuncionando. Se necesitamonitorearla! • Proveer el nivel de serviciosacordado (SLA)‏ • Depende de factoresadministrativos • A quéaspira la gerencia? • A quéaspiran los usuarios, y clientes? • Monitoreo 24x7? • No esposibleproveerservicios a100% disponibilidad

  6. Para qué administrar la red? - 2 • Dado que los conmutadores y enrutadores de la red soportan SNMP… • Use herramientas de dominiopúblico (y gratis!) paramonitorearesosequipos: • Nagios – http://nagios.org/ • Sysmon - http://www.sysmon.org/ • Open NMS - http://www.opennms.org/ • Cacti – http://www.cacti.net • La meta es saber que la red tiene problems antes que los clientesempiezen a telefonear

  7. Para qué administrar la red? - 3 • Qué se necesitaparaproveer 99.9 % de disponibilidad? • 30,5 x 24 = 762 horas al mes • (762 – (762 x .999)) x 60 = 45 minutos - máximolímite de tiempo de red no disponible al mes! • Necesitadetener la red 1 hora/ semana? • (762 - 4) / 762 x 100 = 99.4 % <=  • Recuerda! • Tener en cuentamantenimientosplanificadospara el cálculo del nivel de servicio (SLA). • Notificar a los clientes al respecto, víaacuerdo o contrato • Cómo se mide la disponibilidad? • En el núcleo de la red? • De extremo a extremo? • Desde Internet?‏

  8. Para qué administrar la red? - 4 • Para sabercuandoaumentarrecursos • Es el uso de ancho de bandamuy alto? • Haciadondeva el tráfico? • Se necesitaunaconexiónmásrápida, o máslíneas? Otrosproveedorespararedundancia? • Es el equipamientomuyviejo u obsoleto? • Para mantener un registro de cambios • Registrar todos los cambios • Facilitar el establecimineto de lascausas de fallas, cuandoestasfueronmotivadasporcambios o actualizaciones • Dondeconsolidarestasactividades? • El Centro de Operacion de Red (NOC)‏

  9. El Centro de Operación de Red (NOC)‏ • El lugardondetodosucede! • Coordinación de tareas • Estado actual de la red y servicios • Notificaciٕón de incidentes y quejasreferentes a la red • El hogar de lasherramientas de red (”servidor NOC”)‏ • El hogar de la documentación, incluyendo: • diagramas de red • Base de datos de cadapuerto en cadaconmutador • descripción de la red • Y mucho más!

  10. Documentación • Cómocontrolartodaesainformación? ...En la Universidad de Oregon, crearon un programaparaello... Netdot!

  11. Documentación • Datosbásicos, porejemplo, conmutadores... • A qué se conectacadapuerto? • Puede ser un simple ficherotexto: health-switch1, port 1, Room 29 – Director’s office health-switch1, port 2, Room 43 – Receptionist health-switch1, port 3, Room 100 – Classroom health-switch1, port 4, Room 105 – Hervey’s computer closet • Estainformaciónpuede ser accedidapor el grupo de redes, NOC, o demásempleados • Recuerda: ponetiquetas de identificación en los puertos!

  12. Documentación: Etiquetas • Como diría Hervey: ”Nice!” 

  13. Documentación:Programas y Descubrimiento • Otros proyectos de Codigo Abierto: • DHCP y DNS • See http://maintainproject.osuosl.org • Netdisco: • Localiza una estación en la red via dirección MAC o IP, y muestra en cuál conmutador y puerto está conectada. Contiene herramientas de inventario y registro de bitácora. • Inventario de la red:modelo, fabricante, firmware, otros • Reporta uso de direcciones IP y puertos, tanto actual como histórico. • Software web, multilingue, para administración de direcciones IP, y una herramienta de auditoria

  14. Documentación:Diagramas

  15. Documentación:Programas de Diagramas • Windows • Visio:http://office.microsoft.com/en-us/visio/FX100487861033.aspx • Ezdraw:http://www.edrawsoft.com/ Código Abierto • Dia:http://live.gnome.org/Dia • Cisco reference iconshttp://www.cisco.com/web/about/ac50/ac47/2.html • Nagios Exchange:http://www.nagiosexchange.org/

  16. Sistemas y herramientas de monitoreo de redes • TresTipos • Diagnóstico– paraprobarconectividad, y acceso, o si el dispositivoestádisponible. Herramientasgeneralmenteactivas • Monitoreo– corren “trasbambalinas” (background) comoservicios ”daemon”. Coleccionanincidentes, perotambienpuedeniniciarpruebas, a unadeterminadafrecuencia, y registrar los datos. • Rendimiento– cómo la red estáfuncionando y manejando el flujo de datos, “cuellos de botella”, y otros.

  17. Sistemas y herramientas de monitoreo de redes - 2 • Rendimiento • Herramientascomunes: • http://cricket.sourceforge.net/ • http://www.mrtg.com/ • http://www.cacti.net/

  18. Sistemas y herramientas de monitoreo de redes - 3 • HerramientasActivas • Ping – pruebaconectividad a un dispositivo • Traceroute – muestra la via a un dispositivo • MTR – combinación de ping + traceroute • Collectores de SNMP (en mode encuesta)‏ • HerramientasPasivas • Monitoreo de logs, Colectores de “trampas” SNMP , NetFlow • Herramientasiterativas • SmokePing – muestrea, registra y graficademora a un grupo de dispositivos, usando ICMP (Ping) u otrosprotocolos • MRTG/RRD – registra y graficaancho de banda a intervalosregulares

  19. Sistemas y herramientas de monitoreo de redes - 4 Herramientas de Monitoreo de Servicios y Redes • Nagios– monitor de servidores y servicios • Puedemonitorearcasitodo • HTTP, SMTP, DNS, espacio en disco, uso de CPU, ... • Es fácilcrearextensiones (plugins)‏ • Con habilidadesbásicas de programación (scripting) : • Perl, Shellscript, python, ruby • Muchasherramientas de códigoabierto • Zabbix, ZenOSS, Hyperic, Cacti, OpenNMS, Groundworks

  20. Sistemas y herramientas de monitoreo de redes - 5 • Monitorea los serviciosesenciales de la red • DNS • Radius/LDAP/SQL • SSH a enrutadores • De que forma recibiránotificaciones? • No olvidar la recolección de trazas! • Cadadispositivo de red (al igualqueservidores UNIX y Windows) son capaces de reportarincidenciasvíasyslog • DEBE recolectar y monitoreartrazas! • La omisión de estatareaesencialesuno de los erroresmáscomúnes en la administración de redes

  21. Protocolos de Administracion de Red • SNMP – Protocolo Simple de Administración de Red • no tan simple, en realidad • Estándar, cientos de herramientas lo utilizancomonúcleooperacional • Presenteen cualquierdispositivo de red decente • Volúmen de datos, errores, carga de CPU... muchas variables a monitorear... • UNIX y Windows lo implementan • Espacio en disco, procesos en ejecución, ... • SSH y telnet • Es tambiénposibleprogramarprocesos batch paraautomatizar el monitoreo de servidores y servicios

  22. Herramientas SNMP • Conjunto de herramientasSNMP • http://net-snmp.sourceforge.net/ • Es muyfácilconstruirherramientas simples • Ejemplo 1: qué IP esasignada a unadirección MAC? • Ejemplo 2: Quedirección MAC existen en la tabla ARP de un conmutador? Y asignado a cualpuerto?

  23. Estadisticas y tabulación • Tabulación y análisis de tráfico • Para qué se estáusando la red, y cuantotráfico? • UtilparaestablecerCalidad de Servicio (QOS), detectarabusos de recursos, asícomofacturación • NetFlow • Identificar “flujos” de tráfico: protocolo, fuente, destino, cantidad de bytes • Existendiferentesherramientasparaprocesarestetipo de información • Flowtools, flowc • NFSen • ...

  24. Fallas y gestión de problemas • Es el problema temporal? • Sobrecarga, carencia temporal de recursos • Es el problemapermanente? • Fallo de equipmento, enlace caído • Cómodetectar un error? • Monitoreo! • Quejas de clientes • Un sistema de gestión de incidencias (tickets) esesencial • Abrir un casoparaseguirunaincidenciadetectada o reportada (planificada, o de emergencia) • Definirasignación de caso, y escalamientosiesnecesario • Quién se encarga de arreglar el problema? • Quiénrecibe el caso (escalamiento) si no hay nadiedisponible?

  25. Sistema de Gestión de Incidencias • Importancia? • Registro y control de incidencias, fallas y problemas • Punto focal de comunicaciones con el buró de ayuda • Registrar y seguirtodaslascommunicaciones • Tantointernascomoexternas • Incidentesexternos: • Quejas y solicitudes de clientes • Incidentesinternos: • Fallas de servicios y sistemas • Notificadosporsistema de monitoreo • Mantenimientoplanificado - actualizacion, nuevosequipos • No olvidenotificar a los clientes!

  26. Sistema de Gestión de Incidencias - 2 • Use el sistemaparaseguircadacaso • Incluyendocomunicacionesinternas entre técnicos • A cadacaso se asigna un númeroúnico • Cadacasosigue el mismociclo • (tambiénconocidocomo “maquina de estado”) • caso Nuevo • casoAbierto • caso En-Progreso • CasoResuelto • CasoCerrado

  27. Sistema de Gestión de Incidencias – 3Ciclo de vida de un caso 2-NOC creacaso 3-Notifica a cliente 5-ingenier@ investiga, Y arregla o escala a segundonivel 4-NOC asignacaso 1-Cliente pide ayuda SGI 7-ing. actualiza caso en SGI, y notifica a cliente sobresolucion 6-Falla corregida • El SGI es el centrocolector de informacionsobre el caso, de principio a fin. • Al cerrar el caso, la historia del incidente se guardaparafuturareferencia 1-Monitor reporta incidente

  28. Sistema de Gestión de Incidencias - 4 • Algunossistemas de gestión de incidencias: • rt • Extensivamenteusado • sistemaclásico, puede ser adaptado a necesidad local • relativamentecomplejo de instalar • capaz de manipulargrandesvolúmenes de transaccciones trac • Sistemahíbridoqueincluye un wiki, asícomo un gestionador de proyectos • El sistema de gestión no es tan robustocomort. Perofuncionabastantebién • Frecuentementeusadoparagestionarproyectos de grupo. • redmine • Parecido a trac, aunquemásrobusto. Instalacióncompleja.

  29. Sistema de Detección de Intrusiones - NIDS • Monitorean de tráfico en busca de patrones de ataqueconocidos, o condicionessospechosas • Ejemplos: • Servidoresactuandocomo ‘spamming’ • Gran cantidad de conexiones TCP “medio-abiertas” procedentes de unamismadirección IP • SNORTis the most common open source tool http://www.snort.org/

  30. Control de cambios Tresprincipiosbásicos: • Mantener un registro e historia de cambios ‏ • Dar accesopublico a la información ‏ • Mantenerdiferentesversiones de un mismoconjunto de datos Quétipo de datos?Códigofuente, • Documentación • Ficheros de configuración • En general, cualquierdato‏

  31. Control de Cambios - 2 BuenasPrácticas : • Dsiciplinade cambios: • Registrar todos los cambios • Consultartodos los cambios • El personal másexperimentadosanaliza los cambiospropuestos antes de implementar • Prueba de cambios • Tener un “banco de prueba” paraverificarcambios • Asignarresponsabilidad de control de calidad • Controlar el proceso de cambios • Mantenerhistoria de cambios en un registro • Crearcasos en el SGI paracadacambioaprobado e implementado En un team disciplinado, nunca se cambia nada sin consultar!!!

  32. Visión General, otravez • - Monitoreo • Recolección de Datos • - Conteo Notificaciones Ticket - Control de cambios ymonitoreo • - Planear/Capacidad • Disponibilidad(SLAs)‏ • - Tendencias • - Detectarproblemas Herramientas NOC - Sistema de Tickets Ticket Ticket Ticket - Mejoramientos - Actualizaciones Ticket - Quejas de Clientes - Solicitudes - Arreglarproblemas

  33. Resumen de Herramientas de Codigo Abierto • Rendimiento • Cricket • IFPFM • flowc • mrtg • netflow • NfSen • ntop • pmacct • rrdtool • SmokePing SNMP/Perl/ping • Administración • Big Brother • Big Sister • Cacti • Hyperic • Munin • Nagios* • Netdisco • Netdot • OpenNMS • Sysmon • Zabbix • Manejo de Cambios • Mercurial • Rancid (routers) • RCS • Subversion • Security/NIDS • Nessus • OSSEC • Prelude • Samhain • SNORT • Untangle • Ticketing • RT, Trac, Redmine

  34. Mantenerunaorganización (NOC) responsabilizada con la administración de la red Monitorear la red paragarantizarniveles de servicioen el presente y el futuro Mantener y velar por la seguridad de la red. Una red seguragarantizaintegridad, confidencialidad, y disponibilidad de susdatos y servicios Controlar , analizar, probar y registrar cambios en la red Mantener un registro de incidentes y solicitudes Resumen – las “reglas de oro”

More Related