Možná QT (tedy HTB) též trochu optimalizovali (také bude nejspíš závislost na typu leaf třídy). Ale nic to nemění na tom, že prakticky nezáleží na množství SQ (jen logicky na množství dat), kdežto složitému QT roste náročnost na CPU podstatně rychleji (zvlášť když k tomu potřebuji mangle a nemám target CLASIFY).
Nevím kde končí použitelnost CCR pro shaping. Takto to nepoužívám. Někde bude to jedno jádro mít strop a bude určitě níže, než jedno x86. Ale zase jich je víc. Pak jde o to si rozhodnout, jestli to stačí ... Já bych to jako centrální shapper nepoužil.
Optimalizace mangle spočívá v "index stromu" jak tomu říkal xChaos :-) Paket postupně skáče po větvích stromu tak, aby žádný nešel přes víc jak pár pravidel. Pro síť /16 to bylo optimální tak, aby poslední chain v cestě byl /29.