1 / 20

Forelesning nr 22: Feilsøking og -retting

Forelesning nr 22: Feilsøking og -retting. TDT4285 Planlegging og drift av IT-systemer Våren 2006 Anders Christensen, IDI. Fasene i feilsøking og -retting. Reprodu- serbarhet. Feil- isolering. Verifisering. Feilmelding. Retting. Testing. Tilbake- melding. Doku- ment- ering.

kaiyo
Download Presentation

Forelesning nr 22: Feilsøking og -retting

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Forelesning nr 22: Feilsøking og -retting TDT4285 Planlegging og drift av IT-systemer Våren 2006 Anders Christensen, IDI TDT4285 Planl&drift IT-syst

  2. Fasene i feilsøking og -retting Reprodu- serbarhet Feil- isolering Verifisering Feilmelding Retting Testing Tilbake- melding Doku- ment- ering Deployment Tilpassing TDT4285 Planl&drift IT-syst

  3. Feilmeldingsfasen • Få tak i mest mulig info om problemet • Skaff eksakte feilmeldinger • Skaff skjermbilder/transaksjonslogg • Hva sier egentlig feilmeldingen? • Hva er det brukeren ønsker å gjøre? • Hva mener brukeren burde ha skjedd? • Hvilke kontekst skjedde det i? TDT4285 Planl&drift IT-syst

  4. To hovedtyper problemer Reproduserbare. De som du på kommando kan reprodusere. Ikke-reproduserbare. De som opptrer mer eller mindre sporadisk, og som du ikke kan fremkalle på kommando. TDT4285 Planl&drift IT-syst

  5. Ikke-reproduserbare feil • Monitorer dem over tid. • Iverksett en stresstest. • Analyser deg frem til feilen • Sett opp alarmer/varsling TDT4285 Planl&drift IT-syst

  6. Prinsipper for feilisolering • Eliminere enkeltkomponenter • Suksessiv refinement • Fotfølge sporet fra A til Å • Statistisk analyse av loggdata TDT4285 Planl&drift IT-syst

  7. Tips til feilisolering • Kikk på mellomformat • Introduser ’print-setninger’ • Sjekk opp loggene • Analyser symptomene • Single-step gjennom programmet • Endre parametre og observer • Les dok’en enda en gang TDT4285 Planl&drift IT-syst

  8. Ulike årsaker • Direkte årsak. Det som umiddelbart gjør at det ikke virker. • Indirekte årsak. Det som forårsaker den direkte årsaken. Direkte årsak Indir. årsak Problem TDT4285 Planl&drift IT-syst

  9. Rett feilen midlertidig Verifiser at den forsvant Fjern fiksen Verifiser at feilen er kommet tilbake Repeter etter behov Verifisering Midl.- retting Testing Fjern fiksen Testing TDT4285 Planl&drift IT-syst

  10. Ha de riktige verktøyene • For å se interne tilstander • For å se på mellomformat • For å ta ut konfigurasjonsdata • For å samle logg- og utdata • For å kjøre trinnvis • Kompetanse, forståelse og innsikt! TDT4285 Planl&drift IT-syst

  11. Eksempler verktøy... • Traceroute – liste nettverkspath • Ping – sjekke konnektivitet • Truss – liste systemkall • Tcpdump – dumpe nettdata • Lastcomm – presentere prosessloggen TDT4285 Planl&drift IT-syst

  12. Feil håndering :-) • Undertrykke symptomene • Rette feil uten å forstå årsak • Rette bare midlertidig • Rette en feil ved å introdusere nye • Rette en feil ved å redesigne systemet. TDT4285 Planl&drift IT-syst

  13. Feilsøking krever: Kreativitet Verktøykunnskap Systemoversikt Teknisk innsikt Generell erfaring Feilretting krever: Nøyaktighet Systemforståelse Historisk kunnskap Lokal spesialkunnskap Feilsøking og -retting TDT4285 Planl&drift IT-syst

  14. Feilhåndtering og linjedelt drift (Prosjekter) 3.linje Retting Testing (”Drift”) Tilpassing 2.linje Feil- isolering Verifisering Dokument- asjon Reprodu- serbarhet Deploy- ment 1.linje Feil- melding Tilbake- melding (Rutiner og brukerstøtte) TDT4285 Planl&drift IT-syst

  15. Hovedkategorier av feil • Brukerfeil, forvirring eller misforståelse hos brukeren • Rutineoppgaver, f.eks brukeradm og restore og andre forutsigelige oppgaver • Feilsituasjon som skal rettes, der systemet har fått en feil • Konseptuell feil med systemet, må gis ny funksjonalitet for å klare oppgavene. TDT4285 Planl&drift IT-syst

  16. Retting av feil 1.linje 2.linje 3.linje Veiledes Brukerfeil Utføres Rutineoppgave Verifiseres Rettes Feilsituasjon Verifiseres Feilsøkes Redesignes Konseptuell feil TDT4285 Planl&drift IT-syst

  17. Retting og testing Retting. Gjør rettingen permanent, Distribuer den til alle maskiner. Testing. Test på mer enn en måte, fokuser fra mer enn en vinkel. Dobbelttest og trippeltest. Dokumentasjon. Sluttfør dok på hva du har gjort, og gi tilbakemelding til bruker TDT4285 Planl&drift IT-syst

  18. Fire strategier for feilretting • Korrigere før feilen oppstår • Automatisk korrigere idet feilen oppstår • Manuell korrigering når de første symptomene melder seg • Opprydding når problemet er blitt merkbart TDT4285 Planl&drift IT-syst

  19. Kostnader (anslag) 4 Når problemet melder seg Nede tid 3 Når symptomet melder seg Automatisk retting 2 1 Før feilen oppstår Initielle driftsutgifter TDT4285 Planl&drift IT-syst

  20. Akkumulative feil En kritisk feilsituasjon har sjelden bare ett enkelt problem som årsak. Dersom problemer korrigeres ASAP, kan man hindre at de blir delårsaker i komplekse feilsituasjoner. TDT4285 Planl&drift IT-syst

More Related