Jedná se o nejrozšířenější a nejpoužívanější typ pracovní paměti na světě. Prakticky všudypřítomné nebo téměř. A to i přesto, že má za sebou téměř 50 let čestné služby. Tam paměti DRAM (zkratka pro dynamický paměť s náhodným přístupem, dynamická paměť s náhodným přístupem), spuštěná v roce 1971 společností Intel, patří mezi nejdéle používané a nejpoužívanější hardwarové komponenty v historii. Jeho dlouhá cesta se zjevně neobešla bez chyb: v průběhu desetiletí DRAM paměti byli často ve středu oka bouře za to, že ji způsobili chyby různého charakteru a dokonce i dnes jsou zodpovědné za většinu hardwarových problémů, kterými trpí počítačové systémy po celém světě.
Chybný start
První problém s pamětmi DRAM byl objeven pár let po jejich uvedení na trh. Namísto přísného respektování pokynů přicházejících ze spuštěného programu, dynamické paměti RAM občas upravili, zřejmě svévolně, některé datové bity, které si náhodou ponechali. To vedlo ke kompatibilitě a chybám čtení během provádění programu a v některých případech to vyžadovalo a restartovat celého systému. Původ problému, jak se zjistilo po měsících výzkumu, byl v keramice přítomné v elektrických obvodech paměti. Radioaktivní částice přirozeně přítomné v těchto materiálech emitovaly částice alfa (prostřednictvím jevu známého jako rozpad alfa), což skončilo poškozením dat. Jakmile byl tento problém objeven, byl tento problém snadno vyřešen tím, že jsme věnovali pozornost snižování množství radioaktivních prvků přítomných v použité keramice prostřednictvím rafinačních procesů. To ale neznamenalo konec problémů s DRAM.
Velké měřítko
I dnes jsou dynamické paměti RAM základem mnoha problémů IT, kterým čelí většina uživatelů. Klasickým příkladem je modrá obrazovka smrti: každý den jsou postiženy desítky tisíc uživatelů, ale jen málokdo zná jeho skutečný původ. Přečtením několika řádků zobrazených na obrazovce zjistíte, že příčinou všeho je často chyba čtení nebo zápisu na konkrétní adresu úložiště paměti RAM počítače. A pokud jsou pro domácí uživatele takové problémy nepříjemné a nic víc, pro velké společnosti jako Google, Facebook nebo Twitter mohou chyby DRAM paměti vést ke ztrátě velmi důležitých dat a informací s následnými obrovskými ekonomickými ztrátami.
Z tohoto důvodu, ve snaze minimalizovat škody způsobené případnými chybami DRAM, používají všichni protagonisté webové scény více počítačů a serverů, než je skutečně nutné. Tímto způsobem, i kdyby se jeden z počítačových systémů náhle zastavil, mohl být bez větších problémů nahrazen záložním strojem. Taková taktika, tzv nadbytekmá samozřejmě velmi vysoké ekonomické náklady, ale je to nejjednodušší implementace pro potlačení závažných chyb (co to znamená brzy vysvětlíme) pamětí DRAM.
Problém s hardwarem
Výzkumníci z University of Toronto zdůraznili, že ačkoliv software nebo malware jsou obvykle prvním a hlavním podezřelým, většina problémů IT, s nimiž se setkávají uživatelé, je způsobena poruchami hardwaru. Výzkum provedený kanadskými vědci v datovém centru v Los Alamos ve Spojených státech odhalil, že 60 % zaznamenaných problémů je hardwarové povahy. Když půjdeme do detailu, většina je způsobena těžkými chybami v pamětích DRAM. To je empiricky potvrzeno i v dalších velkých datových centrech, kde je RAM nejčastěji nahrazovanou komponentou.
Jak funguje paměť DRAM
Dnes používaný paměťový čip RAM se skládá z a kondenzátor to je tranzistor. K zápisu dat dochází, když kondenzátor získá elektrický náboj nebo ne: pokud je „nabitý“, nabude logické hodnoty „1“, jinak bude jeho hodnota „0“. Na rozdíl od statické RAM, ve které si paměťové buňky uchovávají informace tak dlouho, dokud jsou elektricky napájeny, v dynamické RAM buňka pomalu ztrácí svůj náboj (a informace, které obsahuje) a systém potřebuje periodicky aktualizovat náboj všech paměťových buněk. Odtud pochází název dynamické paměti. Výhoda DRAM oproti statickým pamětem spočívá ve velikosti kondenzátoru: u dynamických pamětí je výjimečně malý a umožňuje tedy zmenšení velikosti RAM banky (tedy zvýšení úložné kapacity na stejně obsazený prostor).
Chyba paměti
U pamětí DRAM dochází k chybě, když je jedna nebo více informací zapsáno jedním způsobem, ale systém je čte jiným způsobem. A navzdory tomu, čemu byste mohli věřit, chyby DRAM jsou velmi časté. Jak poznamenali kanadští učenci, procento v rozmezí od 15 % do 45 % počítačů v datových centrech Google má problémy s DRAM alespoň jednou ročně a ve 4 % případů čelíme problémům dostatečného rozsahu, aby systém způsobil náhle vypnout. Nebýt výše zmíněných zásad redundance, byly by služby nabízené velkými internetovými hráči (Google, Facebook atd.) značně nespolehlivé a mohly by kdykoli a bez varování přestat fungovat.
Měkká chyba, tvrdá chyba
Chyby DRAM se obvykle dělí do dvou kategorií maker: na jedné straně měkké chybyna druhou stranu těžké chyby. O softwarových chybách hovoříme, když je poškození dat způsobeno faktory mimo RAM (například radioaktivní emise), zatímco hardwarové komponenty (kondenzátor a tranzistor) jsou dokonale neporušené. Závažná chyba na druhé straně přímo ovlivňuje materiální součást modulu RAM, což často způsobuje trvalou chybu: paměťová „buňka“ by byla zablokována na přesné logické hodnotě (“0” nebo “1”), aniž by mohou být dále upravovány, a proto způsobují chyby v zápisu a/nebo čtení dat.
Stejný řádek, stejný sloupec
Pokud je většina problémů s DRAM běžně připisována softwarovým příčinám, statistiky ukazují, že pravý opak je pravdou. Data shromážděná výzkumníky z University of Toronto ukazují, že většina problémů s DRAM je hardwarové povahy. Analýzou rozložení chyb ve skutečnosti kanadští vědci zjistili, že obvykle ovlivňují buňky ve stejném řádku nebo sloupci. V mnoha případech je to vlastně ta samá buňka, která způsobuje poruchu systému. Vzhledem k tomu, že je nepravděpodobné (ne-li nemožné), že záření vždy zasáhne stejný bod RAM při různých příležitostech, teorie těžkých chyb a tedy trvalého problému s fyzickými součástmi paměti nabývá na síle. Problém s chybami této povahy je v tom, že je zpravidla nelze opravit.
Jak opravit problémy s pamětí
Analýza provedená kanadskými vědci však také zdůrazňuje praktické a snadno použitelné řešení. Pokud se problém opakuje vždy ve stejné buňce, jednoduše ji označte a poté vylučte z alokační tabulky dat. V nejzávažnějších a nejrozsáhlejších případech se můžete rozhodnout označit celý řádek nebo celý sloupec, abyste zajistili funkčnost RAM banky za cenu (více či méně) malé ztráty kapacity paměti. Toto řešení, i když zdánlivě jednoduché, je docela důmyslné: umožňuje nám nadále používat paměti DRAM s poškozenými nebo již nefunkčními buňkami, což umožňuje manažerům velkých datových center ušetřit tisíce a tisíce eur ročně.
Od společnosti Cultur-e