O zbytečné práci

Zbytečná práce je něco, co opravdu nemusím, ale to asi nikdo. Jedna taková se vyklubala z pokusu o zprovoznění serveru jednoho kamaráda.

Jak to vzniklo

Se Zdenkem se známe už dlouho, ještě z mého bývalého zaměstnání. Začlo to tím, že potřeboval pro svého zaměstnavatele nový server, protože starý dosloužil a tak se zeptal na cenu. Protože firma, v níž jsem pracoval, byla vždy jedna z nejlevnějších, nabídka, kterou jsem tvořil uspěla a server se skládal a dodával. S drobnými obtížemi fungoval doteď, kdy po letech práce se začal dožadovat zaslouženého počítačového důchodu.

I vznikla potřeba serveru nového. Zdenek mě ze staré známosti požádal o návrh konfigurace a pomoc s kompletací a instalací. Měl nějaké obavy, že by to snad nezkopletovali pořádně, přestože navenek se tváří, že servery skládat umí. Protože to, že se mi kvalita výrobků mého bývalého zaměstnavatele nelíbila, byl jeden z důvodů, proč jsem hledal jiné místo, ale o tom je jiný příspěvek, souhlasil jsem.

Protože je Zdenek dobrý kamarád, po kterém občas něco potřebuju i já, tak jsem mu slíbil, že mu pomůžu. Dala se dohromady konfigurace slušného Intel serveru, poměrně kvalitní, ne to nejlevnější, co se dá složit, a pustili jsme se do práce.

Zdenek díly objednal a pro urychlení je mechanicky smontoval. Sešli jsme se večer u něj, zkontroloval jsem, jak to má složené, prošel zběžně nejčastější chyby bývalých kolegů, když se to učili skládat, zapli jsme nový server a zkusili. Napoprvé jsme bohužel úspěch neměli, z objektivních důvodů.

Pokračování

Další den jsme se sešli vyzbrojeni firmwary a disketami a vše vypadalo velmi nadějně, instalce Windows Serveru 2003 byla za hodinu za námi, spokojeně jsme naložili server, zapli na místě a jeli domů…

Po jednom dnu se rozpadl RAID-5 oddíl z velkých SATA disků – šlo o modely určené pro trvalý provoz v serverech, Zdenek se rozhodl, že vypadlý disk vymění za nový, pro jistotu, přece jen SATA disk není až taková položka.

Vyměnil, a domluvili jsme se, že o víkendu data přeneseme na nový server a pojede se na něm naostro. Byla zrovna v Olomouci Flóra, vzal jsem sebou holky, a šly na Flóru, my jsme řešili data. Odpoledne vše hotovo a jeli jsme spokojeně domů.

Do pondělka padlo RAID-5 pole. Neměl jsem čas a Zdenek zkoušel sám, občas zavolal, zkusil snad všechno. Nakonec jsem ho požádal, ať dá disky do něčeho jiného, než RAID-5, prozatím ať je dá jen jako RAID-1, měl jsem podezření na řadič, případně něco kolem něj. I když tento bord používá polosoftwarový jakoraid (CPU assisted RAID nebo tak nějak tomu říkají) – dělá to celé procesor, výkonu má stejně nadbytek.

Výsledek se dostavil – pole se přestalo rozpadat a po dalším víkendu to vypadalo nadějně. Uživatelé už byli naštvaní, že nemůžou pořádně dělat, ale dělali jsme, co se dalo.

Server se dál choval divně, občas se zastavil a nic, občas se vypnul, v logu nebyly sebemenší náznaky problému – Windows báječně logují.

Včera jsme se sešli znovu, že nějak poléčíme ten starý, ať se dá dělat aspoň trochu. Zdenek je dobrý kamarád, tak jsem se nechal ukecat, i když se mi do toho moc nechtělo. Co se mi ale vůbec nechtělo bylo další přehazování Windows Active Directory, prohazování hlavního a záložního Domain Controleru, prostě hromada konfigurací potom. Navíc už jsem dlouho přemýšlel, co by chybu mohlo dělat a měl jsem podezření na první procesor onoho serveru, i když pravděpodobnost vadného procesoru je velmi nízká.

Na druhou stranu chyby paměti to umí detekovat na hardwarové úrovni a problémy s procesorem také, jedinou výjimkou můžou za určitých okolností být problémy prvního procesoru ve víceprocesorovém stroji. Ukecal jsem Zdenka, že tomu serveru dáme poslední šanci, že z něj vyndám 1. procesor a druhý dám na jeho místo, do konce týdne to necháme jet s jedním a uvidíme.

Viděli jsme dřív

Když Zdenek díly koupil, oba procesory byly rozbalené, ale nevěnoval tomu zvýšenou pozornost. Já taky ne, po zapnutí fungovaly a nic zvláštního se nedělo.

Ale skrytě se dělo až moc. Nějaký – nevím, jak to slušně napsat – prohodil chladiče na procesorech, podle kódu na krabici šlo o procesory s aktivním chladičem, ale Zdenek kupoval s pasivním, které taky dostal. Po sundání chladičů z procesorů po třech týdnech zbytečné práce bylo jasno. Na jednom procesoru byla chladici mezivrstva otisknutá na celé ploše procesoru, na druhém jen v rožku – procesor prakticky neměl kontakt s chladičem. Při zatížení se přehřál a napřed dělal chyby – to byl ten rozpad RAID-5 pole – pak se sekal úplně – nevysvětlitelné pády serveru.

Podíval jsem se na chladiče, na jednom byla nálepka, že jde o chladič pro patici LGA771, na druhém ne, taky se mi trošku nezdály sloupky, které chladič drží. Vyrazil jsem do auta pro kufřík s nářadím, ktré pro servisy PC potřebuju – mám tam plno nesmyslů. kromě jiného i posuvné měřidlo, které mou pochybnost o chladiči potvrdilo – sloupky byly o 1.5mm vyšší, procesor se chladiče vůbec nedotýkal, jen kouskem teplovodivé pasty v rohu. Divím se, že neodešel úplně, asi to má Intel dobře udělané. Intel za to nemůže, ten chladič byl dobrý, ale na předchozí generaci procesoru, která měla ještě nožičky a v patici byla vyšší – zhruba o ten 1.5mm. Při chvilce to napíšu do blogu o počítačích i s obrázkama – tady, tady na to není prostor.

Zdenka to překvapilo, v pondělí půjde onen chladič s procesorem dotyčnému dodavateli vrátit. Mě to dost naštvalo. Kvůli cizí chybě jsme strávili tři týdny hledáním chyby, která vůbec neměla nastat. Někdo prohodil chladiče a nějak u toho nemyslel. To, že způsobil, že se pak tři týdny snažilo několik lidí se serverem a několik desítek lidí hlasitě nadávalo, že se s tím nedá dělat a pořád to nejede, to je asi jedno.

Každopádně příště Zdenek bude asi hodně dávat pozor, co mu dávají, pokud tam ještě bude nakupovat. Bohužel to celé jen vypovídá o tom, že firma, která je velká, levná, navenek kvalitní, má ISO na kdeco, nemusí vůbec ve skutečnosti být dobrá, spolehlivá, kvalitní a uspořádaná. Jen je pořád hodně zákazníků, kteří pro nízkou cenu všechno ostatní jaksi přehlížejí, takže vedení firmy je rádo, že obrat roste a dobře to funguje, protože už dávno netuší, jak to vypadá z druhé strany.

Příspěvek byl publikován v rubrice Nezařazeno. Můžete si uložit jeho odkaz mezi své oblíbené záložky.

1 komentář u O zbytečné práci

  1. Cube3d napsal:

    De ja vu:o)

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *