Zosieťované počítače prostriedkom na rast výskumu
7.6.2011 11:39:11 | * q| Počet zobrazení: 2693x
Hovoríme s riaditeľom Ústavu informatiky SAV doc. Ing. Ladislavom
Hluchým, CSc.
Aj slovenská vedecká komunita využíva pri svojej práci okrem moderného prístrojového vybavenia čoraz častejšie veľmi výkonnú a vysokorýchlostnú počítačovú techniku, ktorej význam v celom svete výrazne rastie. Využívajú ju
najmä tam, kde treba rýchlo urobiť rozsiahle matematické výpočty. Okrem matematiky tam patrí aj simulácia vedecko- -technických problémov vo fyzike, astronómii, biochemických procesoch, modelovaní predpovedí počasia či v automobilovom a astronautickom priemysle.
Ide o extrémne výkonné počítanie, ktoré je schopné riešiť aplikácie, v ktorých prevládajú matematické výpočty. Treba si však uvedomiť, že tento pojem nemá presnú hodnotu, lebo závisí od existujúceho technického vývoja. Dnes sa napríklad za vysokovýkonný počítač považuje ten, ktorý je schopný urobiť 100 miliónov operácií v plávajúcej desatinnej čiarke za sekundu. V tabuľke rekordov superpočítačov sa ako prvý uvádza nemecký Zuse Z1, ktorý bol schopný v roku 1938 urobiť 1 operáciu za sekundu. Éra superpočítania sa začala až v 60. rokoch minulého storočia, keď Seymour Cray skonštruoval prvý skutočný superpočítač CDC 6600 s výkonom 3 MFLOPS, teda 3 milióny operácií v plávajúcej desatinnej čiarke za sekundu. A to je už pekný rozdiel v porovnaní so súčasnými 100 miliónmi.
Ktoré sú najväčšie supervýkonné počítače vo svete?Najnovšie vydanie zoznamu najvýkonnejších superpočítačov uvádza, že na čele je čínsky systém Tianhe-1A, ktorý sa nachádza v Národnom superpočítačovom centre v Tianjine. Jeho výkon je 2,57 petaflopov za sekundu, teda 2,57 triliónu operácií v plávajúcej desatinnej čiarke za sekundu. To je o 30 % viac, než má druhý najväčší superpočítač Cray XT5 Jaguar v stredisku amerického ministerstva energetiky v Oak Ridge v Tennessee. Na treťom mieste sa umiestnil ďalší čínsky superpočítač Nebulae v národnom počítačovom centre v Šenžene. Najmocnejší európsky počítač je Bull patriaci francúzskej Komisii pre jadrové a alternatívne energie (CEA). Tianhe-1A si až ťažko predstaviť. Obsahuje viac ako 21 000 počítačových jednotiek. Pre tých, ktorým výpočtové hodnoty nič nehovoria, len na prirovnanie: má hmotnosť 155 ton a spotrebuje 4,04 MW elektrickej energie. Prudký vývoj superpočítačov, ktorý som spomínal, možno najlepšie priblížiť údajom, že v rebríčku TOP 500 skončil na poslednom 500. mieste počítač, ktorý bol ešte pred šiestimi mesiacmi na 305. mieste.
Takéto vysokovýkonné a súčasne aj drahé stroje si však môže dovoliť len niekoľko krajín sveta. Čo robiť?Budovať gridové prepojenia, ktoré sú lacnejšie. Ide totiž o prepojenie už existujúcich počítačov, ktoré vo svojom voľnom čase ezaháľajú, ale riešia spoločne veľké matematické úlohy. Môže ísť pritom nielen o počítače vedeckovýskumných inštitúcií, štátnych organizácií či súkromného sektoru a dokonca aj jednotlivcov. Na grid sa preto možno pozerať ako na nejakú globálnu sieť počítačov, ktoré reprezentujú jedno obrovské výpočtové prostredie. Pojem grid sa prvýkrát objavil v septembri roku 1997, keď ho Ian Foster a Carl Kesselman použili na označenie novej infraštruktúry pre vedu 21. storočia. Hneď v nasledujúcom roku vyšla ich publikácia The Grid: Blueprint for a New Computing Infrastructure, často nazývaná aj ako Biblia gridového počítania.
Od kedy existuje gridová infraštruktúra v Európe?Superpočítačové gridové centrá sa začali budovať v 90. rokoch minulého storočia v ekonomicky rozvinutých krajinách vrátane susedných krajín: Poľsku, Rakúsku, Maďarsku a Česku. Na Slovensku sme evidovali niekoľko pokusov o vytvorenie takýchto centier v rokoch 2001 až 2007. Všetky pokusy narazili na nedostatok finančných prostriedkov a nedostatočné organizačné zabezpečenie. Prvé kroky k Európskej gridovej infraštruktúre sa nesmelo objavili v januári 2001, keď odštartoval Európsky dátový gridový projekt. Nuž a od roku 2010 je to projekt Európskej gridovej iniciatívy(EGI.eu) so sídlom v Amsterdame.
Pre slovenskú vedu zrejme neexistuje iná cesta prístupu k vysokovýkonnému počítaniu než účasť na takomto sieťovom prepojení.Určite nie. A dôvodom nie je iba vysoká cena superpočítačov. Nejaký by sa totiž možno dal za pomoci európskych peňazí aj kúpiť. Nákupom sa však problémy nekončia. Takýto superpočítač vyžaduje vysokokvalifikovaných odborníkov, ktorí budú udržiavať jeho prevádzku. A tých, pravdu povediac, nemáme. Navyše, samotná prevádzka nie je lacnou záležitosťou. Zoberme si len elektrickú energiu, ktorú superpočítač spotrebuje. Existuje prepočet, že každý rok jej minie v hodnote asi 6 % svojej ceny. A to je pri obrovskej nadobúdacej cene poriadny balík peňazí.
Priekopníkom v účasti Slovenska na projektoch budovania paneurópskej gridovej infraštruktúry je váš Ústav informatiky SAV. Odkedy sa na nej podieľate?Ústav informatiky SAV sa zúčastňuje na tvorbe európskej gridovej infraštruktúry od roku 2002, keď sa zapojil do projektu CROSSGRID riešeného v rámci 5. rámcového programu. Špecifickým nástrojom účasti Ústavu informatiky na budovaní európskej gridovej infraštruktúry sú medzinárodné vedecké konferencie pod názvom Gridové počítanie pre riešenie komplexných problémov, ktorých 6. ročník bol v novembri minulého roku. Umožňuje odborníkom oboznámiť sa s rôznymi národnými stratégiami pri budovaní gridových infraštruktúr i s medzinárodnými projektmi.
Čo sa už v rámci Európy podarilo dosiahnuť?Už projekt EGEE mal gridovú infraštruktúru, ktorú tvorilo 40 000 počítačov v 250 výskumných centrách s celkovým výpočtovým výkonom viac než 150 000 jadier a s úložným priestorom 100 petabajtov (100 × 1015 bajtov). V septembri minulého roku Európska únia odštartovala projekt novej Európskej gridovej infraštruktúry, ktorú má tvoriť 200 000 počítačov vo vyše 300 centrách na celom svete.
A čo slovenská gridová infraštruktúra?Máme ju. Do Národnej gridovej infraštruktúry (NGI) sa zapojili štyri centrá, ktorými sú Ústav informatiky SAV, Technická univerzita Košice, Ústav experimentálnej fyziky SAV v Košiciach a Fakulta matematiky, fyziky a informatiky UK v Bratislave. Jej celková kapacita je 550 výpočtových jadier a 100 terabajtov (100 × 12 bajtov) úložného priestoru. V rámci projektu Slovenska infraštruktúra pre vysokovýkonné počítanie, ktorý teraz realizujeme, chceme dosiahnuť, aby naša národná gridová infraštruktúra mala aspoň 2 500 jadier. V porovnaní so susedmi je to oveľa menej, ale umožní nám to udržať si krok s nimi. To môžeme dosiahnuť nielen zvýšením kapacity súčasných štyroch centier, ale aj zapojením nových v STU Bratislava, UMB v Banskej Bystrici a v Žilinskej univerzite. Slovenskí špičkoví vedeckí pracovníci tak majú príležitosť využívať vlastnú superpočítačovú infraštruktúru a nebudú už odkázaní len na zahraničné príležitosti.
Aké projekty sa už podarilo prostredníctvom našej gridovej infraštruktúry realizovať?Národná gridová infraštruktúra poskytla výpočtové prostriedky na výskumné projekty z oblasti astronómie a fyziky, simulácie z oblasti vied o Zemi, najmä pokiaľ ide o predpoveď hmly a počasia, biomedicíny či aplikácií v oblasti fyziky vysokých energií, ktoré sa robia v ženevskej Európskej organizácii pre jadrový výskum (CERN) v rámci projektov Atlas, Alice a ďalších. Medzi naše najvýznamnejšie výsledky však patrí aj podiel na rýchlom vyhľadávaní zlúčením schopných blokovať činnosť jedného z enzýmov na povrchu vírusu vtáčej chrípky H5N1, keď laboratóriá v Ázii a Európe analyzovali až 300-tisíc možných zložiek liekov. Vďaka zosieťovaniu sa mohlo za štyri týždne použiť naraz 2 000 počítačov, čo predstavovalo prácu, akú by robil jeden počítač 100 rokov.
Kde sú naše najväčšie problémy v budovaní gridovej infraštruktúry?Zhrnul by som to do dvoch slov – peniaze a byrokracia. Peňazí na financovanie rozvoja a prevádzky gridového prepojenia je žalostne málo. Národný projekt SIVVP umožňuje iba nákup hardvéru a softvéru a aj to zdĺhavým administratívno-byrokratickým procesom. Ako som už spomenul, treba myslieť aj na prevádzku gridovej infraštruktúry, ktorá, opakujem, nie je lacná. Navyše byrokracia vedie k tomu, že pre zdĺhavý proces schvaľovania sa nákup odkladá. A tak sa môže stať, že dobrý zámer získať najmodernejšie zariadenia vyjde napokon navnivoč, lebo pokým sa všetko schváli a kúpi, uplynie veľa času a jednotlivé zariadenia už do špičky nepatria. Celkovo preto platí, že Slovensko je len na začiatku budovania vysokovýkonnej gridovej infraštruktúry. Máme čo doháňať. Stačí sa pozrieť na našich susedov. Poľská gridová iniciatíva je považovaná za prvú fungujúcu národnú gridovú iniciatívu (NGI) v rámci Európy. Veľmi dobre sú na tom Česko i Maďarsko.
Čo treba v prvom rade urobiť?Oveľa rýchlejšie realizovať budovanie slovenskej gridovej infraštruktúry. V prvom rade sa musí vytvoriť stratégia na budovanie trvalo udržateľnej národnej gridovej infraštruktúry, ktorá nám doteraz chýba. Na to musí nadviazať aj zvýšený záujem našich vedeckých inštitúcií o využívanie jej služieb vo všetkých oblastiach výskumu, kde ju možno využiť. Preto treba trénovať používateľov, aby mohol toto sieťové prepojenie využívať čo najširší počet ľudí. Treba mať pritom na pamäti, že gridová infraštruktúra poskytuje odrazový mostík na rast výskumu a vývoja.