Ahoj všichni,
jdu zde poprosit o radu se situací, ve které si už vůbec nevím rady ☹️.

Stávající situace:

  • RB1100AHx2 jako hlavní domácí GW
  • RoS i FW je 6.48.1
  • Přípojka VDSL 250/25 od MetroNetu s Terminátorem a veřejkou
  • WAN je klasicky PPPoE tunel nad VLANou 848

Ještě dva týdny fungovalo vše v pořádku, jak má. MK měl uptime skoro měsíc (aktualizace), Terminátor běžel snad 5 měsíců v kuse, od té doby, co ho CETIN nainstaloval.

Týden zpět, v sobotu, zničehonic "vypadl internet", tak jsem začal zjišťovat, co se děje. Nezjistil jsem nic - přehodil jsem se na záložní konektivitu s tím, že se to přes noc určitě vyřeší, že jde o "standartní" výpadek. Avšak přes noc se nic nezměnilo, tak jsem začal lítat, co se děje. Restartoval jsem Terminátora - to nepomohlo. Poté jsem (po hodině procházení configu MK) už "ze zoufalosti" restartovat MikroTika a ejhle.... ono to zafungovalo 😀 !
Tak si říkám - "asi se něco zašmodrchalo" a nějak jsem tomu nevěnoval větší pozornost.

Ale ejhle....teď v sobotu se to stalo znova, ale protože jsem neměl čas se tomu věnovat, tak jsem opět restartoval MK - a opět to pomohlo. V tu době mi to už zasadilo brouka do hlavy, že to asi nebude úplně v pořádku.

A třešničku na dortu to vyrobilo dneska - po dvou dnech od posledního "rozpojení" se to stalo zase ☹️. Teď jsem se tomu chvíli věnoval a pokusil se zjistit co nejvíce informací.

Na routeru mám několik LT2P VPNek , které v dobu "výpadku" rozpojí. Nedokážu to asi úplně popsat, ale mám pocit, jako by se PPPoE tunel stal "poloprůchodný" - data jedním směrem chodí, ale druhým ne. Ale možná je to blbost.

V logu není absolutně vůbec nic. Jediné, co tam začne skákat je toto (to má souvislost s těma VPNkama)
the packet is retransmitted by XXX.XXX.XXX.XX[500].

Co jsem vysledoval:

  • PPPoE interface se nerozpojí - při výpadku je neustále "R-runing"
  • Všechny VPNky se (pochopitelně) rozpojí
  • Ping (a jakákoliv jiná komunikace) z vnitřní sítě kamkoli do internetu nejde
  • Ping na Veřejnou IP na Mikrotiku ale jde (nechápu 🥴)
  • Ping z MK do světa též nic, tracert to samé
  • Pokud se zkusím připojit VPNkou na NAS doma z mobilu (na datech) tak countery na DST-NATovském pravidlu se točí
  • Pokud PPPoE interface disablnu a potom enablnu, znovu se naváže, ale stav je pořád stejný

Už opravdu nevím, co to může být 😥. Dokážete mě někdo nakopnout, čeho se mám chytnout ?
Může to být nějaký HW problém (což bych slyšel nerad 😀), či něco takového?
Má cenu to řešit s podporou MetroNetu?

Díky moc všem za pomoc

nosek_tomas2004 změnil název na Problém s PPPoE - "rozpojování"/"poloprůchodnost" .

Vzhledem k tomu, že nemáme přístup do sítě metronetu, tak budeme jak bez ruky. Zkusil jsi napsat na metronet? Když jsem měl nějaké problémy, tak technik metronetu byl vždy ochotný a na ranní mail reagoval ještě ten den.

    1) Je to na Moravě nebo v Čechách? Pokud Morava, Brno?
    2) Píšeš že ping jde. Protože to je malý paket. Zkoušej postupně větší a větší pakety, metodou půlení intervalu. Na jakém čísle to ještě jde a kde už ne? Pokud nějakou hranici najdeš, k čemu tě to nalezené číslo dovede?

      Mám obdobný problém na X86 MK , je to asi bug v mikrotiku verze 6.48 a verze kolem , ale já to mám zase ve spojení s huawei ont a x86 MK při zatížení více jak 300Mb/s ihned spadne port přesně jak popisujete do reboot MK prostě data přes tento port netečou, zkuste ponížit RouterOS a pak následně testnout jestli problém zmizel. Mě to pomohlo, Běžný problém u lotyšů skoro při každé aktualizaci nějak pomrvené ovladače buď wifin nebo lanek ...

      Je to problém v Tiku, u Metronetu žádné problémy s PPPoE nejsou - mám u nich pár přípojek s Terminátorem a nikde jsem toto nezaznamenal. Na žádné z přípojek Tika nemám.

        Je uplne jasne, ze je to bug mikrotiku...zas a opat 😃 keby tam je tupy tplink ktory ma na wanku nastavenu vlan tak by to bolo spolahlivejsie nez hovnotiky....par mesiacov dozadu sme si lamali hlavu z niecim podobnym, nebolo to pppoe ale podobny problem. Po 300 dnoch uptimu si to povedalo,ze to nebude prepustat traffic z niektorych rozsahov, po reboote to fungovalo max 15 hodin. Potom znova reboot aby to slo, upgrade na vyssiu verziu pomohol a zatial to ide. 6.48 je na vela veciach shit, radsej 6.47.9 Vtedy sme ten problem mali na ros tusim 6.44 alebo 6.45 daco...ale proste klasicky, neupgradujeme nieco co funguje dlho ak to fakt neni moc stare.

        Ohledně všelijakých PPP bylo u 6.48.x hlášení docela dost. Takže za úvahu stojí downgrade, možná až na 6.46.8

        Tazatel se neptal na vaše hejty na Mikrotik (které v 99% znamenají "neumím to nastavit/diagnostikovat, ale je jednodušší svést to na imaginární bug").

        @nosek_tomas2004 změř jak velký ping ještě proleze, pokud se potvrdí moje hypotéza, napíšu ti co po kom chtít aby to zmizelo.

          Mimochodem, když už bych chtěl řešit verze, poslední longterm je 6.47.9.
          6.48.x nikdy nebyla longterm, co je na ní tak sexy že nepoužijete longterm?

          Mám na stovkách míst mnoho let zásadně longterm/bugfix verze a pokud byl s PPPoE někdy problém, nikdy nesouvisel s routerem zákazníka.

          Ale o verzi to beztak není, to je jen takový folklor radit rok staré verze, v roce 2023 tu budete radit verzi 6.48.x a psát jak je skvělá.

            jchudoba
            To není hejt na Mikrotik , to je jeho vlastnost vždy něco aktualizují a debagují jednu věc ale rozbijou další tři, jinak na forum.mikrotik.com je spousty takových problémů od více lidí, vždy pomůže downgrade na nižší verze, a jestli myslíš že půlka fora neumí nastavit mikrotik tak se můžeš ukázat a nastavit nám to tak aby to fungovalo na bugfix verzi 6.48 , když to přeci není bug mikrotik a je to jen špatně nastavený ....
            Jinak i v longterm verzích jsou taky někdy nějaké chyby

              kadlcikales ad "vždy pomůže downgrade na nižší verze," - prostou extrapolací tohoto tvého výroku mi vychází: Odstranění chyby vždy stačí downgradovat -> Limitně tedy stačí downgradovat na verzi 1.00 a tam žádná chyba nebude. Takto to ovšem nefunguje, jen to prokazuje nesmyslnost tvého výroku.

              ad " na forum.mikrotik.com je spousty takových problémů od více lidí": Prosím konkrétní odkazy na fórum na problém se stejnými symptomy. Bude mi stačit jeden. Díky.

              • gemb replied to this.

                jchudoba ach zas nejaky mikrotik fan boy co sa pripojil na toto forum pred jednym dnom a uz ide hlasat zazraky

                  gemb Zato staří zkušení harcovníci se zmůžou leda tak na generické rady typu "máš moc novou verzi", což je jen o trochu lepší variace na "have you tried turning it off and on again?". Potom se zmůžou na to aby tvrdili že na Mikrotik fóru je cosi, co ovšem existuje pouze v jejich hlavách, a na co sem nelze dát link.

                  Tím je jejich potenciál vyčerpán. Potom je zde potřeba nová krev, rady "máš moc novou verzi" nikoho neobohatí.

                    jchudoba
                    Takže tu máme pár problémů třeba s výkonem a PPPOE
                    https://forum.mikrotik.com/viewtopic.php?t=172468

                    tu máme další
                    https://forum.mikrotik.com/viewtopic.php?f=2&t=173810

                    Problémy s voip telefony
                    http://forum.odorik.cz/viewtopic.php?f=14&t=4968

                    Problémy s vlan
                    https://forum.mikrotik.com/viewtopic.php?t=172370

                    Problémy s bridge a PPP
                    https://forum.mikrotik.com/viewtopic.php?t=171509

                    Hele nechytej za slovo , prostě mikrotik je jak na houpačce jednou se jim povede vše vychytat a pak zase půl roku mají ve firmwarech bugy , pak je zase vyladí a vše jede jak má a tak pořád dokola

                    Jinak nejvíce bug věcí je v ROS V7 kde jim na nějakých routerbordech nejdou lanky nebo se rebootují a další, ale tuhle verzi ani nepočítám je to beta tam se to i očekává že něco nepojede

                    Jinak proti mk nic nemám jen mě sere že je pořád nějaký problém .... když tupé a levné třeba tp-linky nemají problém třeba s wifi která na mk jede jednou dobře a aktualizuje se ROS a jede to pak nanic ....

                    My staří harcovníci používáme mikrotik nějaký pátek a víme že je to bag , a máme ho nasazený ve svých sítích a víme že to jede napi#u jinak by jsme ani o tom nepsali že ...

                    gemb
                    Přesně 🙂

                    A který z těch odkazů přesně je přiléhavý na problém se kterým nosek_tomas2004 toto téma otevřel?

                    Žádný, přesně jak jsem čekal. Hodil jsi sem kvantum zcela nesouvisejících témat.

                    A obalil jsi to (opakovanou) omáčkou bludů o chybovosti, které jsi ale stále nedoložil. Pár výkříků do tmy, kterým jejich autorům ani nestálo za to přibalit tam export konfigurace, jak sluší a patří.

                    Z mé praxe je 99% problémů údajně "způsobených moc novou verzí" vyřešeno v okamžiku kdy se podaří ze stěžovatele vylomit konfiguraci. Zbývající 1% se vyřešilo se supportem. A kdyby lidi četli dokument "https://wiki.mikrotik.com/wiki/Manual:Layer2_misconfiguration", polovina dotazů ktaré jsi sem linkoval by vůbec nevznikla. (Kdykoli si mi někdo stěžuje že mu nejde něco na Mikrotiku a zazní tam slovo VLAN, už odpovídám jen odkazem na odstavec z tohoto dokumentu,aby věděl co si má opravit. Ale chápu, downgradovat je pohodlnější)

                      Fůůůha...... 😀. To jsem netušil (a ani nechtěl), že rozpoutám tak "výbušnou" diskuzi. No nic, dám se do odpovídání 😄 😀

                      sidi Na MetroNet jsem ještě nepsal, chtěl jsem se zeptat tady, jestli se s tím nikdo nepotkal. A jak to tak vypadá z diskuze, tak je bug MK a s tím MetroNet nic neudělá, tak nemá asi ani cenu je otravovat.

                      jchudoba Je to Morava, Brno, blíže Prostějov, konkrétně Dobromilice. S těma PINGama je to složitější. Pokud je to v tom "rozbitém" režimu, tak (jak píšu v původním příspěvku) z lokální sítě a ani MikroTika ping kamkoli do intenetu neprojde.
                      Ale na PING odněkud z internetu (mobil na datech) mířící na veřejku, která leží na tom MK (na PPPoE interface) dostanu odpověď. Jako by se nechumelilo. Jakmile se to do tohoto stavu znova dostane, tak zkusím tu hraniční hodnotu najít (ale jak pochodím, to netuším 😄)

                      jcltm Na ostatních přípojkách, které "spravuju" jsem právěže taky žádné problémy nezaznamenal. Akorát víceméně na všech mám Tiky. Proto jsem taky víceméně problém u Metronetu vyloučil a škebrám/žebrám o radu tady 🤭.

                      jchudoba Ohledně těch verzí - je tady ještě jedna věc, kterou jsem nenapsal. Když to udělalo poprvé, tak byla nainstalovaná verze 6.47.8 (z edice stable). Když to udělalo podruhé, tak jsem to zkusit upgradovat na, v tu dobu nejnovější, 6.48.1. Ale nepomohlo to.
                      Dneska jsem zaznamenal, že vyšla 6.48.2 u které je v chanelogu u PPP nějaká změna. Má cenu to zkusit 🤔?
                      Koukám že v "testing" 6.49beta27 je:
                      *) ppp - improved stability when receiving bogus response on modem channel; mohlo by to na to mít taky vliv 🤔?
                      Nebo to mám zkusit downgradovat na momentální "longterm" - tj. 6.47.9 ?

                      Teď trošku obecně - že MikroTik funguje tak, jak funguje, víceméně nějak vím (právě ze zdejších, obdobně "emotivních" diskuzí 😁), ale ještě jsem se tím nikdy nepotkal. Toto je nějaká první potyčka s tím, že něco nefunguje tak jak by mělo. O problémech na s WiFi vím, ale s těma jsem tak nějak OK.
                      Základní kámen úrazu je v tom, že nic obdobného na trhu není, tak je potřeba nějak vyjít s tím co je. Pro mě jakožto nadšence jsou ty zařízení finančně dostupné a umožní mi doslova cokoliv si zamanu, všlijaké kejkle (s tím bych u TP-Link, UniFi pochodil asi těžko). Vím že profi řešení, ala Cisco, HP atd. by to možná zvládly lépe, ale taky za desetinásobnou cenu. Vím, že ještě existuje pFsense, ale to jsem v ruce nikdy neměl. A navíc bych to asi do domácností těžko nastazoval (ale možná se pletu). Takže je třeba tak nějak vyjít s tím co je - MikroTik 😀. Sice mě to "nevyzpytatelné" chování hodně mrzí, jinak by to bylo dle mého perfektní zařízení, ale co se dá už dělat 😭.

                      Chtěl bych tímto moc poděkovat všem, co se zapojili jak do pomoci, tak do diskuze. Všech nápadů/názorů si velice vážím. Ještě jednou děkuji 😊.

                      Jakmile se to objeví znovu, zkusím zjisit co nejvíce dalších informací, které jste mi tu poradili.

                      Díky moc 🤗👌😀

                        jchudoba Mám na několika DSL přípojkách mikrotika za Terminátorem. Čistý config (domácí přípojka), není co podělat a některé verze mají s PPPoE problém. Popírat to nemá smysl. Jednou za čas udělám update 1 MK, otestuju a podle výsledků upgradnu ostatní/verzi přeskočím.

                        99% chyb je v konfiguraci v případě, že MK konfiguruje BFU. Ale tady jsme na trochu jiném levelu (aspoň většina z nás).

                        Netvrdíme, že MK je shit (jinak bychom ho neměli na core částech sítě), jako budget router je super. Ale bugy tam jsou, občas se opraví, občas se objeví znova, .... některé specifické konfigurace s některými verzemi prostě nejdou. Některé bugy jsou i docela šílený (třeba když podělají OSPF, případně cokoliv v 60Ghz pásmu, kdy jednu dobu byl update solidní hazard a šance 50:50 že funkční spoje zkolabují)

                        Sranda je v7 beta a PPPoE. Chápu, že to je beta, ale je vtipný, že PPPoE funguje jen na každé druhé verzi. Nejdřív nefunguje (nefunguje IPv4, jet IPv6 only nejde), pak to opraví, v další verzi stejný bug zpět, pak to opraví a na aktuální v5 PPPoE zase nejde 😃

                          sidi Netvrdíme, že MK je shit

                          Co netvrdíme?! 😎 Mikrotik je shit, switche naprd, domácí WiFi naprd, routery naprd, naprostá většina HW naprd. Ale používáme to všichni, protože to stojí pár korun, nějak to "funguje" a dá se tam nastavit všechno možné i nemožné. Bugů 3 prdele, co se opraví to se zásahem programátorů může se v další verzi rozbít. Co taky čekat za těch pár Kč.

                            sidi No právě , pociťuji to podobně
                            jchudoba Máš tam plno odkazů co jsou k tématu a ještě jsem ti tam přihodil pár které jsou vyloženě Bag verzí 6.48 , ale jak vidíš a píše Sidi že mikrotik má Bagy a velmi často a že nejsem sám kdo to pociťuje. Vlastně půl ispfora je jen o MK Bug 😃

                            nosek_tomas2004 Sorry takhle jsem taky nechtěl aby to bylo směřované , ale někteří prostě nesnesou kritiku na MK který má vyloženě něco nefunkční

                            petrbacina Lépe bych to nenapsal 😃 Asi tak

                              📡 Telekomunikace.cz