Network Troubleshooting Methodology - The Systematic Approach
Network Troubleshooting Methodologiya: Sistematik əlaqə
Niyə metodologiya mövzuları
Problem: A bazar proqramı "slow"dur. Ağ komandası server komandasını günahlandırır. Server komandası şəhərinə qəbul edir. Bu arada, istifadəçilər güclü, və saat ümumi debugging boşanmışdır.
Çözüm: Əməliyyatdan istifadə etmək üçün sistematik, elmi yanaşma, qadın səbəblərini müəyyən etmək.
Haphazard Troubleshooting qiyməti: Ətraflı vaxt, maska real problemləri, komandalar arasında barmaq, və degraded user experience.
Giriş: Networking üçün hazırlanmış Elmi Metod
Ağ problemliyi əsasən elmi üsulda bir egzersizdir:
- Qeydiyyat simptomlar və data toplamaq
- Bir hipotez kök mövzu
- Arxa diqqoriyalar
- Analyze və ya hipotezini redaktə və ya redaktə
- Bir düzeltme təsdiq kök sənayesi
- Axtarış Problem haqqında
Bu məhsul kimi ümumi pitfalls qarşısını qarşısını almaq üçün yapılandırılmış bir səhifə verir:
- təsdiqliyyat (başa ilk tahmin dəstəyini dəstəkləyən sübut üçün görünür)
- Tanınma olmadan Random dəyişikliklər (səfər və dualar)
- Kök səbəblərinin yerine simptomları düzeltmek
- s s s s
Beş Key məlumat
texniki diaqnostikaya daldırmadan əvvəl, bu beş kritik sualları araşdırmaq üçün:
Konfiqurasiya dəyişiklikləri? Yeni hardware? Yadda saxla Topologiya məlumatları?
- Check-in idarə edilməsi
- konfiqurasiya idarəetmə sistemləri üzrə son işləri
- Sorğun: "Bu dün işləyir?"
Bir istifadəçi? Bir bina? Haqqımızda Xüsusi proqram yalnız?
- Bir cihaz: Bir yerli mövzu kimi (NIC, kabel, konfiqurasiya)
- One subnet: Gateway, DHCP
- Ümumi: Core infrastruktur, ISP və ya geniş məhsul
- Xüsusi proqram: Application server, firewall qorunması və ya DNS
Bütün vaxt olur? Yalnız müxtəlif saatlar? Random hallar?
- Ümumi: Hard çatışmazlığı (sable cut, yanlış konfiqurasiya, aşağı xidmət)
- Vaxt-based: Biznes saatları zamanı kongestion, planlaşdırılmış proseslər
- Intermittent/Random: Avtomobil, distent link
İstehsal problemini tetikləyə bilərsiniz?
- Yes: Tanınmaq üçün çox daha asan (d testi hipotez)
- No: monitorinq / qazanmaq və recurrence üçün baxmaq
Yadda saxla
- Yadda saxla
- Pulsuz mövcuddur.
- Asimmetrik routing? vs göndərmək üçün müxtəlif yollar?
OSI Model-based diqqqoriya
OSI modeli problemləşdirilməsi üçün yapılandırılmış bir çərçivə verir. Layer 1 (Physical) upward, və ya Layer 7 (Application) aşağı, simptomlar asılı olaraq.
Alt-Up haqqında (Layer 1 → Layer 7)
istifadə etmək üçün: Tam bağlantı itkisi, heç bir link işıq, və ya fiziki kağız simptomları
- Check: Kabel bağlı? Yadda saxla Fiber təmiz?
- Komissiyalar:
show interfaces,ethtool eth0 - Axtarış: CRC hataları, döyüşlər, gecikmiş döyüşlər, runts, devs
- Check: Düz VLAN? Port xidməti? STP bloklaşdırmaq
- Komissiyalar:
show mac address-table,show spanning-tree - Axtarış: MAC flapping, STP topologiya dəyişiklikləri, VLAN yanlış
- Qeydiyyatdan keçmək: Routing masa düz?
- Komissiyalar:
ping,traceroute,show ip route - Axtarış: Xüsusi marşrutlar, yanlış bir nömrə, routing loops
- Check: TCP bağlantısı yaradır? Yadda saxla
- Komissiyalar:
telnet host port,netstat -an, , - Axtarış: TCP retransmissions, sıfır windows, RST paketləri
- Check: DNS qarşılaşdırılması? Proqram xidməti? E-poçt ünvanı
- Komissiyalar:
nslookup,dig,curl -v - Baxış: DNS hataları, proqramlar, vaxtlar
Top-Down Approach (Layer 7 → Layer 1)
istifadə etmək üçün: Əsas bağlantının var olduğu kompüter-spublika problemləri
Layer 7 başlayır ( SharePoint xidməti çalışır? DNS düzgün IP qarşılaşdırılması?) və yalnız lazım olsaydı aşağı iş.
Qalereya: Bu Layer 1, 2 və ya 3?
bu sürətli diqqqoriyasını qaldırmaq üçün istifadə edin:
TCP/IP yığın işləyir. OS xidmətlərini kontrol edin, ağacaq sürücülərini yeniləyin.
NIC, yanlış sürücü, istehsalsız. Giriş: ip link show Cihaz meneceri
Check: Fiziki kabel, qazanma port statusu, VLAN təhlükəsizlik, ARP masa
Check: Routing masa, firewall qaydaları, ACLs. Daxil ol traceroute paketin qaldığını tapmaq
Check: DNS server ayarları, DNS server təhlükəsizlik, firewall blok port 53
Check: Firewall qaydaları, təhlükəsizlik qrupları, limanda dinləmə xidmət
Problem proqramın özü, təhlükəsizlik və ya proqram konfiqurasiyası ilə
Layihələri
Kök mövzu haqqında bir hipoteziniz varsa, bu soyutma texnologiyalarından istifadə edin və ya redaktə:
1. Komponentlərini dəstəkləyir
- tanınan-good kabel ilə Swap yama kabel
- müxtəlif şüşə limanında test
- müxtəlif NIC (or USB ağ adapter)
- müxtəlif müştəri cihazdan test
- müxtəlif VLAN/subnet
2. Paket Çıxışları Birden çox Points
Yüksək, orta xüsusiyyətlər və paketin düşmüş və ya dəyişdirilən yerləşdirilməsi:
# Capture on client
tcpdump -i eth0 -w client.pcap host server.example.com
# Capture on server
tcpdump -i eth0 -w server.pcap host client.example.com
# Compare:
# - Do packets leave client? (check client.pcap)
# - Do packets arrive at server? (check server.pcap)
# - If yes/no: problem is in the path between
# - If yes/yes but server doesn't respond: server-side issue
3. Çapa Testi
Bir cihaz daxil olmaqla xarici növbətlərin qarşısını almaq:
# Test TCP stack without network
ping 127.0.0.1
# Test application listening locally
telnet localhost 80
# Test loopback on network interface (if supported)
# Some NICs support physical loopback for Layer 1 testing
4. tanınan-Good Baseline müqavilələri
İş sisteminin qarşı konfiqurasiyası və davranışı ilə əlaqə edin:
# Compare interface settings
diff <(ssh working-switch "show run int gi1/0/1") \
<(ssh broken-switch "show run int gi1/0/1")
# Compare routing tables
diff <(ssh router1 "show ip route") \
<(ssh router2 "show ip route")
İmtahanlar
Proper məsləhətləri, onu təhlükəsiz bir çox dəfəsiz eyni şeyi axtardığınız ümumi debugging qarşısını alır.
Şablonlar
Issue ID: TICKET-12345
Date/Time: 2026-02-02 14:30 UTC
Reported By: Jane Smith (jane.smith@company.com)
Affected Users: ~50 users in Building A, 3rd floor
Symptom: Cannot access file server \\fileserver01
Initial Observations:
- Issue started around 14:00 UTC
- Only affects Building A, 3rd floor
- Other buildings can access fileserver01
- Ping to fileserver01 (10.1.50.10) times out from affected users
- Ping to default gateway (10.1.30.1) succeeds
Tests Performed:
1. [14:35] Checked switch port status: gi1/0/15 is UP/UP
2. [14:38] Checked VLAN assignment: Port is in VLAN 30 (correct)
3. [14:42] Checked interface errors: 1,234 CRC errors on gi1/0/15
4. [14:45] Replaced patch cable - still seeing CRC errors
5. [14:50] Moved uplink to different port (gi1/0/16) - errors persist
6. [14:55] Checked fiber cleanliness - dirty connector found
Root Cause:
Dirty fiber connector on uplink between Building A floor switch
and distribution switch causing CRC errors and packet loss
Resolution:
Cleaned fiber connector with proper cleaning kit. CRC errors
dropped to zero. File server access restored.
Verification:
Users confirmed file server accessible. Monitored for 15 minutes
with no errors.
Time to Resolution: 25 minutes
Real-World Case Studies
Case Study 1: "The Network's Slow" (Actually: TCP Sərgisi)
Qalereya
Database proqramı cavab vaxtı <100ms-dən 5+ sm-ə qəbul edilir. Proqram komandası "network latency".
Baş inkişaf (Wrong)
- Axtarış
- WAN link doyğu
- Qablaşdırma
Diaqnostik proses
- Ping testi: RTT = 2ms (excellent, diametri 3 latency)
- Banden test (iperf): 950 Mbps haqqında 1 Gbps link (heç bir kongestion)
- Paket çıxış: Açıq TCP Zero Window paketləri məlumat server
- Yadda saxla Database server buffers almaq = 64KB (tiny!)
Kateqoriya
Database server OS buffers yüksək × gecikmə məhsul üçün çox kiçik idi. TCP qapı doldurmaq, baxmaq üçün.
Qeyd
# Increased TCP receive buffers on Linux database server
sysctl -w net.ipv4.tcp_rmem="4096 87380 16777216"
sysctl -w net.core.rmem_max=16777216
Onlayn
Qeyd etməyin: "Slow" hər zaman "network latency" deyil. Hər zaman məlumat toplamaq (sonsuzluq üçün qazanmaq, davranış üçün paket tutmaq) məlumat toplamaq.
Case Study 2: Intermittent Connectivity (Actually: Duplex Mismatch)
Symptom
Yadda saxla Ən çox yaxşı işləyir, əvvəl məlumat.
Initial Assumptions (Wrong)
- Qeydiyyat
- Pulsuz kabel
- Laptop məlumatı
Diagnostic Process
- İnterfeys: Yadda saxla
- Qeyd: Ətraflı döyüş sayı
- Son döyüşlər: duplex qaynaq
Root Cause
Auto-negotiation başarısız oldu. Yadda saxla Collisions həmçinin tərəfindən istifadə etdiyi zaman yük altında yalnız meydana gəldi.
Resolution
! Cisco switch - force full duplex
interface GigabitEthernet1/0/10
speed 1000
duplex full
Lesson Learned
Check: Interface status müzakirə edilmiş ayarları göstərir. Yanlış bir xüsusiyyət auto-negotiation başarısız deyil. serverlər üçün daima sabit kodlu sürət/duplex.
Case Study 3: "MTU/PMTUD Black Hole"
Symptom
Yadda saxla Kiçik HTTP məlumatları işlədi, böyük pages vaxt.
Initial Assumptions (Wrong)
- DNS məlumat
- Daxili saytların bloklanması
- Uşaq problemləri
Diagnostic Process
- DNS haqqında Bütün saytlar üçün gözəl iş
- Ping testi: "İctimai" saytları qazanmaq
- Kiçik HTTP istəyi (curl): Kiçik pages üçün iş
- Böyük download: Oxunub: 30
-
MTU testi:
ping -M do -s 1472uğurlu,ping -M do -s 1473qarşı - ICMP monitorinq: No "Fragmentation Needed" (Type 3 Kodu 4) mesaj alındı
Root Cause
VPN tüneli MTU-yu 1400-də azaldır, lakin firewall ICMP "Fragmentation Needed" mesajlarını blokladı. Yol MTU Discovery (PMTUD) işləyib, MTU qara deyil. Kiçik paketlər uyğun, DF bit set ilə böyük paketlər sıxdı.
Resolution
! Implemented TCP MSS clamping on router
interface Tunnel0
ip tcp adjust-mss 1360
! Alternative: Allow ICMP Type 3 Code 4 through firewall
access-list 101 permit icmp any any packet-too-big
Lesson Learned
Ölçü mövzuları: Kiçik məsləhətlər işləyir, lakin böyük transferlər başarısız, MTU/fragmenta məsləhətləri. MTU sınaq yolu üçün DF bit ilə istifadə edin.
Case Study 4: VoIP Quality Issues (Actually: QoS Misconfiguration)
Symptom
Ses çağrıları doğranmış audio, intermittent dropouts idi. Yalnız iş saatları zamanı (9am-5pm).
Initial Assumptions (Wrong)
- Xüsusi bant
- VoIP server yüklədi
- ISP bağlantısı keyfiyyət
Diagnostic Process
- Banden testi: İş saatı zamanı yalnız 40% istifadə olunur
- QoS konfransı: DSCP EF ilə qeyd olunan səyahət
- Qeydiyyat Voice sıra yalnız 5% bantlıq ayrılması idi (3% olmalıdır)
- Paket çıxış: Voice gest gest gest
Root Cause
QoS siyasəti mövcuddur, lakin bant ayrılması geri idi: ən yaxşı-effort 60%, səs 5% aldı. Data trafik artır zaman iş saatları vasitəsilə, səyahət paketləri qaldırılmışdır.
Resolution
! Corrected QoS policy
policy-map WAN-QOS
class VOICE
priority percent 33
class VIDEO
bandwidth percent 25
class CRITICAL-DATA
bandwidth percent 20
class class-default
bandwidth percent 22
Lesson Learned
Vaxt-based məlumatlar = gücü: Problemlər yalnız məhsul saatları çıxırsa, ağır bir çatışmazlığı deyil, lakin bir gücü / QoS problemi deyil. Check sıra statistika, yalnız ümumi bant.
Symptom
| Qalereya | Kataloq | Daxil ol | Bakı |
|---|---|---|---|
| No link işıq | Kataloq 1 | show interfaces |
Status: aşağı, heç bir operator, kabel çıxış |
| Pulsuz | Kataloq 1 | show interfaces |
CRC hataları, runts, devs, çatışmazlıqlar, gecikmiş çatışmazlıqlar |
| Qeydiyyat | Kataloq | arp -a |
No ARP giriş, MAC öyrənilmədi, STP blok |
| uzaq subnet çatdırmaq | Kataloq | traceroute |
Missing, yanlış next-hop, routing loop |
| E-poçt | Kataloq 4 | telnet host port |
Yadda saxla |
| Yavaş performans | Kataloq | ping (RTT) |
Yüksək latency, bantlı limit, TCP retransmissions, sıfır windows |
| Hostnameni qarşılamaq | Kataloq 7 | nslookup |
DNS server məlumatsız, yanlış DNS config, NXDOMAIN |
| Intermittent damlaları | Layer 1/2 | ping -f (flood) |
Avtomobil, qızıllıq kabel, STP rekonvergence |
| Ətraflı işlər, başqaları | Daha çox | Extended ping |
Yük balans xidməti, ECMP asimmetri, dövr masa üstü |
Ətraflı
Satıcı TAC və ya üst mühəndislər qaldırmaq zaman bilir. ::
- Siz məlumat bazarında bütün problemli addımları bitkinir
- Qeyd etdiyiniz giriş/permissions
- Problem satıcı proqram bug və ya hardware defekt daxildir
- Biznes haqqında kritik və vaxt-səssiz
- Bir çox komanda əməkdaşlıq lazımdır (application + ağ + server)
- İnformasiya
- Vaxt başladı
- Müəlliflik hüquqları və onların çıxışları
- Konfiqurasiya backups
- Packet qazanmaq (gə müvafiq)
- Siz artıq çalışdıq
Kişisel məlumat bazası
Hər problemli sessiyası bir öyrənmək imkanıdır. Xüsusi məlumat bazası yaradır:
1. Troubleshooting Jurnalı
# Example structure
~/troubleshooting-journal/
├── 2026-01-15-duplex-mismatch.md
├── 2026-01-22-mtu-black-hole.md
├── 2026-02-02-tcp-window-exhaustion.md
└── README.md # Index of all issues
# Each file contains:
# - Symptom
# - Diagnostic steps
# - Root cause
# - Resolution
# - Lessons learned
# - Related tickets/documentation
2. Kompüter Cheat Sheet inşa
Problemləndirilməsi vasitəsində sürətli məlumatlar ilə çıxış edirik.
3. Sizin Network
- Topologiya divarları (Layer 2 və Layer 3)
- IP ünvanı məlumatları
- Axtarış
- Standart konfiqurasiyalar (templates)
- Ətraflı üslublar (həm problemlərdən əvvəl statistika)
İctimai Anti-Patterns
❌ DON'T: diqqqoriyasız dəyişikliklər edin
Problemi anlamadan konfiqurasiyaların dəyişdirilməsi çox şeylər və ya maskaları real mövzu edir.
❌ DON'T: Ağacaq hər zaman səviyyədədir
Ən çox "network issues" proqram, server, və ya müştəri-sayt problemləridir. Təhlükəsizliyi qəbul etməyə məlumat verir.
❌ DON'T: Problemsizlik addımları
Siz əvvəl etdiyiniz testlərini reaksiya etmək olacaqsınız, və ya çalışdığınız yoldaşlara izah edə bilərsiniz.
❌ DON'T: Ignore intermittent
İntermittent problemləri çox əvvəl çatışmazlığı qeyd edir. Onlar ehtiyac olmaqdan əvvəl onları inkişaf edin.
❌ DON'T: Kök səbəblərinin əlavə simptomları
Bir cihaz rebooting xidmət dəstəkləyir, lakin nömrənin yeniləndirilməsini tapmaq istəyirsinizsə, problem recur.
Kateqoriya: Sistematik Problemləri
✓ Başlamadan əvvəl
- Beş əsas sualları cavablayın (Ne dəyir? Kim dəstəyir? Yadda saxla Reproducible? Digər yan görə?)
- Gather ilk simptomlar və istifadəçi hesabatları
- Son dəyişikliklər və ya təhlükəsizlik üçün baxın
Qeydiyyat zamanı
- OSI kağızı (aşağı və ya top-down) ilə iş üsulu
- Test zamanı bir neçə növbəti dəyişdirin
- Hər bir test və onun nəticəsi
- Daxili trafik davranış görmək üçün paket tutmaq
- müxtəlif üslublara qarşı
✓ Qaydadan sonra
- fix the the the
- Document Document Document Document
- İnformasiya bazası
- Konfiqurasiya dəyişikləyir
- Consider: monitorinq bu əvvəl başa düşməyə bilər?
Conclusion
Ağ problemləri hər iki elm və sanatdır. Elm sistemli bir metodoloji aşağıdakıdır, diqqqoriyaları düzgün istifadə etmək və protokolları anlamaq. Sanat, ilk simptomlar tərəfindən işləyən testlər bilir, təcrübə nümunələrin tanınması və qaldırılması zamanı bilmək.
Bu məhsulda yerləşdirilmiş sistematik yanaşma aşağıdakılar - doğru suallar, OSI model vasitəsilə iş üsullub, addımları qazanmaq və hər hansı bir məhsuldan öyrənmək - Siz problemləşdirilməsi daha effektiv olacaq və boşa zaman və yanlış düzeltmelər qarşısına yol açan ümumi pisliklər qarşısını almaq.
Oxunub: məqsədi yalnız xidmət dəyişdirmək deyil, lakin N-i anlamaq ola bilər ki, onu bir daha çıxa bilərsiniz.
Son Güncelleme: Fevral 2, 2026 | Author: Baud9600 Texniki Komissiyası