liquidcz: Pokud Pardubice, tak na to bez dalšího otevři ticket s providerem, ať je to kdokoli. Přilož tam ten popis co jsi doposud nasbíral, jednak aby bylo jasné že nechceš radit restart routeru, jednak aby se to co nejdříve dostalo na CETIN. Přiložením exportu konfigurace (s hide-sensitive parametrem) nic nepokazíš. (Ne že by byla důležitá, ale urychlí to doputování problému na správný stůl).

@nosek_tomas2004 : Opatři si i traceroute z mikrotiku na nix.cz a potom na default gw pppoe tunelu. A moc prosím tu limitní velikost paketu. (I když poznatek že z některých sítí ano, z některých ne je pro mne nový. O to důležitejší je znát limitní velikost paketu (i na IPv6), tím se vyloučí jedna varianta, třeba ty pakety žere ještě něco jiného než žrávalo ty moje).

IPv6 vs IPv4 bych vysvětlit dokázal, různé sítě na IPv4 už ne. Budu nad tím přemýšlet. Co říká traceroute (oběma směry)?

Restart PPPoE při změne komentáře - ano, to mne také zlobí. Píšu si tam CaseID, které se mnohdy dozvím až při zřízení linky, a kazí mi to potom uptimy.

Downgrade na longterm není důvod se bát (pokud to není hAP lite r1).

Restartování je potřeba rodinu odnaučit - standardně není nic stabilnějšího než CETIN VDSL a pokud se přecijen hryzlo, je potřeba to dořešit s CETINem proč, jinak to budou restartovat do smrti. Panický restart akorát znehodnotí možnost diagnostiky a oddálí řešení.

Tak jsem z toho docela zmatený 🤨 🤯.

Hraniční hodnotu velikosti PINGu na veřejku jsem nenašel ☹️. I na paket o velikost 1400 (odeslaný z mobilních dat Vodafone, bez fragmentace) dostanu odpověď (také o velikosti 1400).

Nicméně mě napadlo zkusit ještě něco.
Na NTB, připojeným za telefonem na VF datech, jsem si nainstaloval jakýsi generátor paketů. Když jsem jej pustil na mou IP (na port 80) s rychlostí 1 MB/s, tak jsem na PPPoE interface na RX směru viděl tok opravdu něco okolo 9 Mbit/s. Na základě toho jsem si udělal představu jako "směrem dovnitř je cesta v pořádku, ale po cestě ven je někde problém"

Z toho mě napadla další věc:
Povolil jsem jsi input accept all ve FW. Na NTB na mobilních datech jsem si rozjel Wireshark a zkusil jít na {V.IPv4}:80, kde běží webfig.
Ve WireSharku byl vidět HTTP get požadavek, na MikroTikovi bylo vidět, že paket "docestoval". V tuto chvíli to začlo být zajímavé:

Na TX směru PPPoE interfacu najednou "vyskočil" datový tok (na chvíli). Z toho usuzuju, že MK odesílal HTML přihlašovací stránky. Nicméně na NTB do Wiresharku nedorazilo ani ň. Po chvíli NTB pokus zopakoval a stejná situace se zopakovala také.

Z tohoto usuzuju, že mi něco asi "žere" pakety po cestě ode mě do internetu, vyjma pingů z intenetu dovnitř(což mi hlava úplně nebere 🤔)

Ping z vnitřních sítí do internetu, nebo na "Remote Address" jsou vždy bez odezvy....

Dneska jsem mluvil s podporou MetroNetu - čekám než se mi ozve technik, takže to zatím v tomto "havarijním" stavu nechávám 😀.

Tak nějak jsem ještě zapomněl @jchudoba odespsat na "Active AC Name" - moc se omlouvám 😭. Posílám tedy teď:
"Active AC Name: PA77B01OLOMST01".

Díky moc všem 🤗😊

PS: O tom bugu s commentem jsem taky nevěděl 😁

Odvedl jsi kus dobré práce, je radost vidět že tu někdo umí udělat něco víc než blábolit o imaginárních chybách verzí.

Pokud jsi nenašel hraniční hodnotu, tak máš malinko jiný problém než jsem původně předpokládal, i když zárodek může být společný (ale to již spekuluji). Navíc AC je Olomouc, tam nedosáhnu.

Nicméně paketožravá hypotéza tam zůstává, byť má paketožravý démon jiné chutě. Začíná se mi rýsovat v hlavě teorie, ale není zralá na publikaci. (Dělá to někomu bez Terminátoru, jen s bridge modemem?)

Hele Tome když už jsi to takhle rozjel, co si sniffnout drát mezi terminátorem a Mikrotikem? Buď mezito switch s portmirroringem, nebo alespoň tool/packet sniffer. (nebo další mikrotik, dva porty do bridge a na něm tool/packet sniffer) Tím definivně potvrdíš že z MK to odchází OK (což si sice myslím, ale tvrdá data jsou tvrdá data). Tím bys mi jakoukoli pochybnost prokázal že pakety jsou sežrány v Terminátoru nebo CETINu (nebo bys to vyloučil, a potom by to bylo na ticket na support Mikrotiku). Ale pokud to teď máš v tom závadném stavu, zkus alespoň teď ten packetsniffer na stávajícím mikrotiku - zapojovat teď cokoli mezi by znamenalo rozbít závadný stav.

Také ten input lze logovat, stejně jako output, tedy můžeš toho pozovat více než jen objem dat.

    jchudoba Doma, v jiné lokalitě než Pardubicko (PA77B01PRAHKZ0), mám také vdsl jako záložní linku, jiný ISP, bez terminatoru, stařičký modem Comtrend první verze v bridge modu, za tím opět Mikrotik, tentokráte bez definice vlan, pouze pppoe, ROS 6.48.2, nyní long term 6.47.9 ;-) , měsíce a měsíce stabilní, bez problémů.

      No jo, Praha je Praha. Půl roku není problém.
      https://imgur.com/a/afBVqg2

      Pravda je že paketožravý démon když řádil v Brně tak to bylo na non-Terminátor linkách. (Ale přesně od doby kdy se v lokalitách zaváděl bonding, což tehdy nebylo nepodstatné). Ty a Tom máte velmi podobný (v malých detailech ovšem jiný) problém, ale na bondingu. Hmhm. Kdybych teď chtěl vypouštět laciné nepromyšlené výkřiky jako nejmenovaní matadoři, řekl bych že bonding za určitých okolností rozbíjí pořadí nebo obsah paketů a pak jsou rozbité (a že je třeba downgradovat na single linku (tohle už vůbec neberte nikdo vážně, jen trollím zdejší "matadory s letitou praxí"). Je to syrový blábol po dvou deci, zítra se nad tím zamyslím s čistou hlavou.

      Vážně - je potřeba dotáhnout tu Tomovu diagnostiku, když to má teď dobře rozehrané i s domluveným technikem. I když i ten technik nejspíše jen poslouží jako odrazový můstek k předání na CETIN-nemám v tuto chvíli jediný důvod myslet si že by to bylo operátorem.

        jchudoba Upřímně - ani jsem nevěděl, že něco takového (PacketSniffer) v MK je 😄. Tak jsem si o rom přečetl pár řádků na WiKině a zkusil jsem to nastavit 😀. Pokud jsem to udělal blbě, tak mě prosím nekamenujte - studuju první ročník střední školy, takže zjišťuji a učím se neustále nové věci 🤭🤗.

        Každopádně packet-sniffer jsem hodil na ten PPPoE iface a pak z toho vyfiltroval provoz z/na IP 46.135.91.199, což byla v tu chvíli IP přidělená telefonu na datech. Vylezlo z toho toto:

        Jestli se tedy nemýlím, tak opravdu pakety z MK odcházejí, ale nedoputují.
        V této chvíli je to ale packet-sniff na té "problémové" GW 110AHx2. Jak jsi psal, tak se bojím, že pokud bych do cesty 1100AHx2 --- Terminator mrskl další zařízení, tak by mohla "paketožravá mrška" zmizet 😀 a já bych na ní musel s otevřenou náručí čekat další týden, abych jí mohl "zakroutit krkem" 😁.

        Uvidím, co na to MetroNeťáckej technik. Sice od něj nějaké velké očekávání nemám, ale je to "vstupní krok" právě do řešení s CETINem.

        Až se rozhodnu tento "závadný stav" zrušit (=restartovat MK), tak zkusím mezi MK GW a Terminátora vložit dalšího MikroTika, abych opravdu ověřil, zda tam ty pakety lítají. Ale momentálně si ještě chci nechat žravého démona na laborování 😁.

        jchudoba Dělá to někomu bez Terminátoru, jen s bridge modemem?

        Před tím, než jsem dělal upgrade na 250/25, tak jsem měl též nějakého Comtrenda (tuším VR-3031eu) v bridge (taky bez vlany, jak liquidcz) a vše běželo víceméně jako na drátkách (až na to, že se šíleně hřál).
        Ještě před tím byl ale v "Router módu" a to byla katastrofa, každej měsíc vythul a musel se restartovat, proto jsem ho pak přepl do bridge - ale to do tohoto válkna nepatří 😉. Upgrade na Terminátora proběhl, neboť ten Comtrend má jenom 100Mbit porty (což se úplně neslučuje s 250tkou přípojkou)

        jchudoba Ty a Tom máte velmi podobný (v malých detailech ovšem jiný) problém, ale na bondingu.

        Teď nevím, jestli jsem špatně pochopil větu, nebo došlo k menšímu nedorozumění 😀. Já mám určitě přípojku bez bondingu (výš než na 50 Mbit ani bonding nedělají, ne 🤔?). I na Terminátorovi mi svítí jenom ledka "1", ledka "2" je zdechnutá 😉.

        Ještě jednou Vám všem (zejména @jchudoba) děkuju za pomoc 😊

        Nemám co dodat, máš dobrý plán.

        Jen před restartem mikrotiku prosím napřed udělej ten test s mezizařízením doprostřed cesty - tím se sice restartuje pppoe link a démon nejspíš tak jako tak zmizí, ale získáš možnost vysledovat chování před restartem mikrotiku (který na to podle mne nemá vliv, ale takto získáš tvrdá data). Restartovat můžeš potom a chování porovnat, když už vůbec restartovat.

        To že máš bonding jsem si vyfabuloval já, moje chyba, příště budu číst pozorněji.

        Dej vědět jak bude další posun.

          Tak to máte oba linku bez bondingu (@liquidcz to tu nenapsal, ale má jednopárovou linku s terminátorem).

          Ano, to jsem nezmínil, problémová přípojka v Pardubicích je NONbonding, jeden link, jeden pár drátů s terminátorem.

          jchudoba
          Tak člověk míní, bůh mění ☹️.

          Včera u nás asi 8* bliknula elektrika (a protože děláme menší rekonstrukci sklepa, tak byl celý rack odpojený od UPSky ☹️).
          Takže to ve finále "vynutilo" restart a nyní vše (asi zase jen na chvíli) běží jak má. Nestihnul jsem zkusit tam vložit "meziRB" ještě před restartem.

          Zítra tam připojím dalšího MikroTika mezi hlavní RB a Terminátora, ať to můžu (až to znovu nastane) ještě zkusit vysledovat tam.
          K tomu bych měl ale ještě menší dotaz - Když dám na tom "meziRB" PacketSniffer na bridge (ve kterém budou všechny fyzické ETH porty), tak na něm uvidím ten provoz toho PPPoE tunelu? Bez toho aniž by to "meziRB" o nějakém PPPoE vůbec vědělo?

          Uvažuji tak na základě myšlenky, že i ten tunel se ve finále (asi) skládá z nějakých paketů/rámců, takže bych měl Sniffnout právě ty PPPoE pakety/rámce (ve kterých jsou zabaleny opravdové pakety/rámce) 😀? Je tato úvaha správná?

          Díky moc 😊

            Můj report.

            Situace se zhoršila natolik, že se výpadky začaly pravidelně opakovat každý den ráno mezi 5 a 7 hodinou ráno. A to i přes to, že mám nasazený ROS long term 6.47.9.

            Abych kompletně vyloučil chybu na mém zařízení, Mikrotik a jakákoliv verze ROS, nasadím náhradní router, Turris MOX.

              iTomB Taky si to myslím, ale potřebuju mít své doměnky potvrzené praktickou zkušeností.

                liquidcz tak si dej restart mikrotiku na 4 rano a uvidis ... 😉

                nosek_tomas2004 Neptej se a vyzkoušej si to ... je to pět minut práce a i kdyby byla odpověď "ne", znalost jak funguje ten sniffer se ti bude v životě ještě mnohokrát hodit při dalších diagnostikách, ušetří ti to spoustu wiresharků. Nemůžeš na tom prodělat. Čímž nijak neříkám ani že to jde, ani že to nejde-jen tě nechci rozmazlovat informací kterou zvládneš zjistit sám.

                iTomB Velmi přínosný příspěvek - to říkám od začátku.

                liquidcz Dotáhni to do konce s providerem. To je jediné systémové řešení.

                  jchudoba ty tu mas registraci 18 dni a budes tu o necem takovem kecat? 😃 LOOL Pokud by byla chyba v mikrotiku, tak po restartu a stane se to znova, tak je pravdepodobnost, ze je to mikrotik 0,000prd %.

                  Po týdnu pravidelného zasekávání linky, každé ráno, jsem na sprosťáka předřadil Turris MOX, jen proto, aby pppoe klientem byl jiný systém než mikrotik. A taky proto, že se mi nechtělo celou síť za mikrotikem překonfigurovat (vpn, routing, pravidla, rezervace, DNS...). Výsledkem jsou dvě rána, kdy se spojení nezaseklo a stále jede. Nechám to běžet týden a uvidím zda-li se něco stane, zopakuje se situace.

                  Pokud bude vše stabilní, zkusím zase nasadit napřímo mikrotik a uvidím, zda-li se situace bude opakovat. Tím budu chtít vyvrátit možnou náhodnou součinnost na straně Cetinu. (...že by si toho někdo všimnul a sám od sebe "to" opravil ve stejný čas jako já vyměnil HW) :-)

                  Pokud se rozpadání spojení opět vyskytne při zapojení mikrotiku jako pppoe klienta, tak ještě zkusím prohodit mikrotik HW kus za kus. Tím se mi podaří potvrdit nebo vyvrátit, že zakopaný pes je někde v ROS nebo v mojí konfiguraci. I když si myslím, že se na tom nedá nic zkazit tak, aby se mi to spojení takto zasekávalo.

                  Tak jsem mezi RB1100AHx2 a Terminátora vložil RB800 (která se mi tu válela).....

                  Dneska jsem se do "onoho" záhadného stavu dostal znovu, takže jsem udělal ještě diagnostiku na tom "mezi RB". O výsledek se potvrdil. Z hlavního MK (ze kterého je vytáčeno PPPoE) pakety odchází. Při "zaseklém" stavu, vidím v PacketSnifferu na RB800 PPPoE jak RX, tak TX provoz.

                  Ještě jsem udělal jeden "potvrzující" test:

                  • Přepnul jsem si konektivitu na záložní --> internet funkční.

                  • Z PC v lokální sítí jsem pustil packet-generator (s malou velikostí) na jednu veřejnou IP (X.X.X.X) (která je úplně mimo infrastrukturu MetroNetu/CETINu) na které mám MikroTik SXT.

                  • Paket generátor jsem pustil a na tu veřejku X.X.X.X a požadovaný datový tok, který jsem vygeneroval se objevil na fyzickém interface SXTčka. Tím jsem si ověřil, že to generování funguje a je "vidět"

                  • Nyní jsem přepnul konektivitu zpět na nefunkční VDSL a packet generátor opět pustil. V tuto chvíli to začlo býti trošku zajímavější:

                  • Požadovaný datový rok směrem VEN (cca 20Mbit/s) jsem viděl jak na PPPoE, tak i na ETH interface hlavní RB1100AHx2

                  • Tok byl vidět i na tom mezikusu tvořeným RB800 (jak na fyzických iface, tak i ve snifferu). Z toho usuzuji, že pakety ode mne odcházejí. Co s tím dělá Terminátor už ale asi nezjistím. ....

                  • Každopádně na tom veřejném SXTčku bylo "ticho po pěšině". Přestože od mne to "valilo" 20Mbit/s, tak na vzdáleném SXTčku po nějakém takovém provozu nebylo ani vidu, ani slechu.

                  Z toho usuzuji že to záhadné "ono/něco", žere pakety, které putují směrem ode mne.

                  Pokud packet-generátor udělám opačným směrem (možná jsem to už výše popisoval) - tj. z internetu na moji Metronet veřejnou IP, tak i v nefunkčním stavu datový tok ta PPPoE interface dorazí.

                  Z tohoto zase usuzuji, že cesta ke mě je (zjevně) v pořádku.

                  Už to mám v řešení s technikem od Metronetu, uvidím(e), jak to dopadne 😀.

                  Každopádně moc děkuju všem za pomoc, rady, nasměrování a i za naučení některých (pro mne) nových věcí 😊😀

                    nosek_tomas2004 Super, to zcela vylučuje problém na Mikrotiku (jak jsem ostatně předpokládal, ale sniffnutí komunikace to postavilo najisto). Zkus tedy dotáhnout toho Metronet technika, předpokládám že takto sesbírané podklady mu nedovolí to zamést pod koberec. Rozhodně dej vědět jak jsi dopadl-i kdyby to neklaplo s Metronetem, stálo by za to to sepsat a poslat na CETIN rovnou.

                    📡 Telekomunikace.cz