Ahoj,
tak přináším report po cca 2 měsících od nasazení doporučeného server Supermicro s kartou STGN-i2S.
První co musím podotknout, tak nám před 14 dni havaroval zdroj a jelikož jsme neměli zaplacené next business day náhradní díly, trvalo asi týden než přišel zdroj nový, takže do té doby a vlastně dodnes jedeme přes původní CCR a neshapujem. Důvod jsou problémy s DHCP, které se projevili už jednou, ale teď po přepojování provozu zpět se objevili znovu a nemají zatím řešení.
Jak jsem psal v zadání, máme FTTH síť point-to-point, postavenou do hvězdy a každého zákazníka máme v separátní VLAN. Na routeru je tedy vytvořeno 1000 VLAN a na nich běží 1000 DHCP serverů, každý zákazník má 10.XX.XX.0/24 subnet. Na CCR fungovalo vše bez problémů. Na x86 mašině po přepojení se v DHCP leases téměř nic neobjevilo. Nejprve naběhlo cca 70 zařízení a pak to přestalo. Nejspíš to byly rádia co ve VLAN jsou na interface uplink a vracejí se zpět na barák ze kterého bereme konektivitu. Na optice nenaběhlo nic, ani mě notebook, který jsem měl zapojený přímo do agregačního switche, což je první prvek za routerem.
Minule jsme si mysleli, že problém může způsobovat link aggregation (který používáme na propojení přístupových switchů a agregačního) protože po jeho vypojení se to tenkrát rozjelo, případně galvanické spojení dvou racků SFP copper kabelem a špatné uzemnění. Od té doby jsem vyměnil propojovací kabel za optiku a switche ve vedlejším racku uzemnil.
Poté co jsem dnes zjistil že to nefunguje, tak jsem vypnul všechny access switche a agregační restartoval, bohužel to nepomohlo. Po opakovaném restartu routeru a switchů naběhly v DHCP leases zákazníci ale jen od VLAN 213 výš. To už mi vůbec hlava nebrala a tak jsem se rozhodl po vyčerpání všech možností (factory reset agregačního switche) provoz vrátit zpět na CCR.
Na něm jsem ještě aktualizoval software z 6.32.3 na 6.37. Vše ihned naběhlo i včetně IP adresy na mém notebooku, což vypadalo jako dobrá zpráva. Pak jsem ale zjistil, že zákazníci na jednom vzdálenem baráku připojeným rádiem (přes uplink v QinQ) v DHCP leases nejsou, přitom jiný barák stejně zapojený fungoval. Pomohlo zakázat a povolit příslušnou VLAN, pod kterou jsou ty zákaznické VLAN. Najednou v leases naběhli a zdá se, že už jsou všichni.
Nevím jak si to vysvětlit, proč na CCR to funguje a na x86 to dělá tyto problémy. Napadá Vás někoho něco ?
Díky.