Artiklit tuleb tõlkida ja kohandada!

Superarvuti on arvuti, mis kuulub esimeste hulka oma töötlusvõimsuse, eriti arvutuskiiruse poolest.

IBM Roadrunner oli esimene superarvuti, mis suutis teha üle petafloppi ehk kvadriljoni arvutuse sekundis

Superarvuteid hakati looma 1960. aastatel, Seymore Cray oli üks peamisi superarvutite väljatöötajaid Control Data Corporationis (CDC)[1]. 1972. aastal lahkus Cray CDC-st, et luua oma firma Cray Research, mis võttis üle superarvutite turu, hoides superarvutamise esikohta 5 aastat (1985–1990). 1980. aastatel tuli turule hulk väiksemaid konkurente, kuid paljud neist kadusid 1990. aastate keskel toimunud "superarvutituru krahhi" käigus. Tänapäeva superarvutid on tavaliselt ainulaadsed lahendused, mis on loodud selliste "traditsiooniliste" firmade poolt nagu Cray, IBM ja Hewlett-Packard, kes ostsid paljud 1980. aastate arvutitega tegelevatest firmadest ja omandasid sellega vajalikud kogemused.

2011. aasta keskpaigast on maailma kiireim superarvuti K Computer, mis asub Jaapanis ja ületab eelmist rekordiomanikku (Tianhe-I) kolmekordselt.

Mõiste superarvuti on aja jooksul palju muutunud ja tänane superarvuti kipub olema homne tavaarvuti. CDC varased masinad olid lihtsalt väga kiired skalaarprotsessorid, mõned kümme korda kiiremad kui teiste firmade pakutavad. 1970. aastatel enamus superarvuteid olid loodud töötama vektorprotsessoril. 1980. aastate esimesel poolel loodi masinad, kus paralleelselt töötas mitu, tavaliselt 4–6, vektorprotsessorit. 1980. aastate lõpus ja 1990. aastatel pöördus tähelepanu vektorprotsessoritelt massiivsetele paralleeltöötlussüsteemidele, mis sisaldasid tuhandeid "tavalisi" protsessoreid. Tänapäeva paralleelsüsteemid põhinevad tavakasutuses olevatel serveriklassi mikroprotsessoritel nagu PowerPC, Opteron või Xeon ja kaasprotsessoritel nagu NVIDIA Tesla GPGPUs, AMD GPUs, IBM Cell, FPGAs. Enamik tänapäeva superarvutitest on kõrgtasemel seadistatud klastrid, mis kasutavad tavakasutuses olevaid protsessoreid eriotstarbeks loodud omavaheliste ühendustega.

Superarvuteid kasutatakse väga palju arvutusi nõudvate ülesannete lahendamiseks, näiteks kvantfüüsikas, ilmaennustamises, kliimauuringutes, molekulide modelleerimiseks ja füüsikaliste simulatsioonide jaoks.[2]

Riistvara ja tarkvara superarvutites

muuda

Kohandatud protsessoreid kasutavad superarvutid saavutasid traditsiooniliselt suurema kiiruse üle tavaarvutite innovaatiliste disainidega, mis lubasid neil teha mitut ülesannet paralleelselt. Tavaliselt on superarvutid spetsialiseeritud teatud tüüpi arvutustele, tavaliselt numbrilistele arvutustele, ning tänu sellele töötavad halvemini üldisemate andmetöötlus ülesannete puhul. Nende mälu hierarhia on väga hoolikalt välja töötatud, et tagada, et protsessor saaks pidevalt infot ja juhendeid – tegelikult, suur erinevus aeglasemate arvutite ja superarvutite vahel tuleneb mälu hierarhiast. Nende sisend/väljund süsteemid on tavaliselt konstrueeritud toetama suurt ribalaiust ning latentsus ei ole nii tähtis, sest superarvuteid ei kasutata transaktsiooniliseks andmetöötluseks.

Superarvutite väljakutsed ja tehnoloogiad

muuda

Superarvuti toodab suurtes kogustes soojust ja seetõttu tuleb seda jahutada. Tüüpiline TOP500 superarvuti kasutab elektrit 1 ja 10 megavatti ning muudab peaaegu kõik selle soojuseks. Elektrikulu ja jahutus on tavaliselt üks teguritest, mis seab süsteemi suurusele piirid. (Näiteks Tianhe-1A võiks kulutada iga aasta mitme miljoni dollari väärtuses elektrit.)

Informatsiooni kahe arvuti vahel ei ole võimalik liigutada kiiremini kui valguse kiirus. Seetõttu superarvuti, mille osad on üksteisest palju meetreid eemal, peab omama latentsust vähemalt kümneid nanosekundeid. Seymore Gray superarvutis üritati seetõttu hoida kaableid nii lühikesena kui võimalik. Modernsetes superarvutites, mis on ehitatud paljudest paralleelselt töötavatest tavaprotsessoritest, on tavaline latentsus kahe protsessoril vahel 1–5 mikrosekundit.

Superarvutid tarvitavad ja toodavad väga lühikese aja jooksul väga suurtes kogustes andmeid. Ken Batcher on öelnud: "Superarvuti on seadeldis, millega pöörata arvutuspiirangud sisend-/väljundpiiranguteks." Palju tööd on vaja teha andmekandjate ribalaiuse kallal, et teha kindlaks, et informatsioon saab kiiresti toimetatud ja talletatud või korrektselt vastu võetud.

Tehnoloogiad, mis on välja töötatud superarvutite jaoks, sisaldavad:

  1. vektortöötlust;
  2. vedelikjahutust;
  3. NUMA-t (Non-Uniform Memory Access);
  4. andmete paigutamist korraga kahele füüsilisele kettale, et neid kiiremini kasutada (esimene etapp sellest, mida hiljem hakati kutsuma RAID-iks);
  5. paralleelseid failisüsteeme.

Töötlemistehnikad

muuda

Vektortöötluse tehnikad olid esmalt arendatud superarvutitele ja edaspidi olid spetsiaalsetes kõrgvõimsusega programmides. Vektortöötluse tehnikad on jõudnud massina turule DSP arhitektuurina ja SIMD (Singe Instruction Multiple Data) töötlemisjuhenditena tavaarvutitele.

Eriti tänapäeva videomängukonsoolid kasutavad SIMD-d ja seetõttu mõned tootjad väidavad, et nende mängumasinad on superarvutid. Mõnedel graafikakaartidel on arvutusvõimsus isegi kuni mõni teraflops. Koht, kus seda võimsust kasutada saab, oli piiratud varase videotöötluse iseloomu pärast. Videotöötlus on arenenud, graafikaprotsessor (GPU ehk graphics processing unit) on edasi arenenud ning nüüd on nad kasulikumad tavaliste vektorprotsessoritena. Sellest on välja arenenud täiesti uus arvutiteaduse alaliik: tavaotstarbeline arvutus graafikaprotsessoritel (GPGPUGeneral-Purpose Computing on Graphics Processing Unit).

Operatsioonisüsteemid

muuda
 
Superarvutite operatsioonisüsteem on enamasti Linux

Tänapäeval kasutavad superarvutid kõige enam Linuxi eri variante.[3] 1980. aastate esimeses pooles ohverdasid superarvutid juhendite ühilduvuse ja koodi teisaldatavuse, et saada paremaid tulemusi (töötlus- ja mälu kättesaamise kiirusi). Selle ajani olid superarvutitel enamasti väga erinevad operatsioonisüsteemid. Cray-1'l üksi oli vähemalt 6 erinevat operatsioonisüsteemi, mis olid tavalisele arvutikogukonnale enamasti tundmatud. Samamoodi olid olemas erinevad ja mitteühilduvad vektoriseerivad ning paralleeliseerivad kompilaatorid Fortranilt. Selline trend lõppes, kui loodi ühilduv juhendite komplekt Cray-1 ja Cray X-MP vahel ja võeti kasutusele sellised arvutisüsteemid nagu Cray' Unicos või Linux.

Programmeerimine

muuda

Paralleelse arhitektuuri tõttu superarvutites kasutati tihti spetsiaalseid programmeerimistehnikaid, et kasutada ära superarvutite kiirust. Baaskeel superarvutite jaoks on üldiselt Fortran või C, kasutades spetsiaalseid teeke, et jagada infot sõlmede vahel. Kõige tavalisemal juhul, keskkonnad nagu PVM ja MPI, olid kasutuses lõdvalt ühendatud klastrite vahel ja OpenMP tihedalt koordineeritud jagatud mäluga masinates. Märkimisväärseid jõupingutusi on vaja teha, et optimeerida probleem antud ühenduste iseloomu jaoks, millel arvuti jooksma hakkab. Eesmärk on hoida ära võimalus, et mõni protsessor kulutab aega andmetele teistest sõlmedest. Uued massiivselt paralleelsed GPGPU-d omavad sadasid protsessorituumi ja on programmeeritud kasutades programmeerimismudeleid nagu CUDA ja OpenCL.

Kiireimad superarvutid

muuda

Superarvuti kiiruste mõõtmine

muuda

Üldiselt kasutatakse superarvuti kiiruse mõõtmiseks ühikut "FLOPS" (Floating Point Operations Per Second ehk ujuvkoma arvutuste arv sekundis). Kiiruse mõõtmiseks kasutatakse üldiselt jõudlustesti LINPACK, kus tuleb arvutil lahendada tihe lineaarvõrrandite süsteem.

TOP500 nimekiri

muuda

1993. aastast alates on superarvutid pandud järjekorda nende LINPACK-jõudlustesti tulemuste alusel ja avaldatud TOP500 nimekirjas. Kuna LINPACK näitab vaid ühte sorti arvutuste kiirust, ei pruugi see nimekiri olla täpne, kuid tihti nimetatakse kiireimaks hetke superarvutiks just seda nimekirja juhtivat superarvutit.

Hetke kiireimad superarvutid

muuda

Jack Dongarra on väitnud, et Tianhe-1A superarvuti Hiina Rahvuslikus Superarvutuskeskuses Tianjinis on 1,4 korda kiirem kui AMD-Opteronil põhinev Cray XT5 Jaguar. Nvidia väidab, et Tianhe-1A on saavutanud töötlemiskiiruse 2,507 petaflops LINPACK'i jõudlustestis. Tianhe-1A koosneb 14336 Intel Xeon Protsessorist ja 7168 Nvidia Tesla M2050 GPU'st koos uute Hiinast pärit ühendustega. Tianhe-1A asub 103 korpuses, kaalub 155 tonni ja tarvitab 4,04 megavatti elektrit. Eelmine kiirem superarvuti Cray XT5 Jaguar on saavutanud kiiruse 1,759 petaflops'i.

Ettevõtte Fujitsu ja Jaapanis paikneva RIKEN-i instituudi teadlaste loodud superarvuti K Computer saavutas aga 2011. aastal kiiruseks juba 8,162 petafloppi ning kukutas sellega hiinlaste superarvuti maailmas teisele kohale. K Computeri kokkupanekut alustati 2010. aasta oktoobris ja plaanide kohaselt peaks superarvuti valmis olema 2012. aasta juunikuuks. Fujitsu ja RIKENi pressiteate kohaselt koosneb superarvuti 672 arvutikapist, milles on kokku 68 544 keskprotsessorit.[4]

Omamoodi superarvutid

muuda

Mõned väga suuremahulised hajussüsteemid, mis on ehitatud probleemide jaoks, mida on väga lihtne paralleelselt erinevate masinate vahel lahendada, viivad klastris superarvutamise mõiste äärmusteni. Kõige kiirem klaster, Folding@home, on detsembri 2009 seisuga saavutanud arvutusvõimsuse 7,8 petaflopsi. Sellest 2,3 petaflopsi andsid arvutid, mis kasutasid NVIDIA GeForce GPU-sid, AMD GPU-sid või PlayStation 3 süsteeme ja ülejäänud 5,1 petaflopsi tuli nende hiljuti väljalastud GPU2 kliendist.

Üks teine hajussüsteemarvutuse projekt on BOINC platvorm, mis majutab nii mõndagi hajussüsteemarvutuste projekti. 2010. aasta aprilli seisuga on BOINC saavutanud arvutusvõimsuse üle 5 petaflopsi läbi 580 000 aktiivse võrgus oleva arvuti. Kõige aktiivsem projekt (mõõdetuna arvutusvõimsuse järgi) BOINC-is on MilkyWay@home, mille võimsuseks on teatatud 1,4 petaflopsi 30 000 aktiivse arvuti kaudu.

Aprill 2010 seisuga on GIMPS-i Mersenne'i algarvude otsing saavutas umbes 45 teraflopsi.

Ka Google'i otsingumootori süsteem on "omamoodi superarvuti", mille arvutusvõimsus jäi aprilli 2004 seisuga hinnanguliselt 126 ja 316 teraflopsi vahele[5]. Juunis 2006 hindas New York Times Googleplexi ja selle serveriparkide serverite hulgaks 450 000.[6] Mai 2008 hinnati Google'i arvutusvõimsuseks 20–100 petaflopsi.[7]

PlayStation 3 "Gravity Grid" kasutab võrku, mis koosneb 16 masinast ja kasutab ära Cell protsessorit täitmaks ülesandeid, milleks on astrofüüsikalised simulatsioonid suurtest supermassiivsetest mustadest aukudest, mis neelavad väiksemaid kompaktseid objekte. Celli protsessoril on põhiprotsessor ja 6 ujukoma-vektorprotsessorit, andes masinale võrgu, mis koosneb 16 tavaarvutist ja 96 vektorprotsessorist. See klaster ehitati 2007. aastal Dr. Guarav Khanna poolt ja seda toetas Sony Computer Entertainment; see on esimene PlayStation 3-dest koosnev klaster, mis andis numbrilisi tulemusi, mis avaldati teaduslikus kirjanduses.

Teadustöö ja arendus

muuda

IBM arendab Cyclops64 arhitektuuri, millega loodetakse luua "superarvutit kiibil".

Mais 2008 teatati NASA, SGI ja Inteli koostööprojektist ehitada 1-petaflopsine superarvuti Pleiades aastaks 2009 ning aastaks 2012 suurendada arvutusvõimsus 10 petaflopsini.[8]. IBM ehitab Lawrence Livermore'i Rahvuslaboratooriumisse 20-petaflopsist arvutit Sequoia, mis peaks tööle hakkama aastal 2011.

Praegust arengukiirust arvestades peaksid superarvutite kiirused jõudma exaflopsni (1018 flopsi) aastal 2019.[9]

Erik P. DeBenedictis Sandia Rahvuslaboratooriumist arvab, et täieliku ilmamodelleerimise jaoks, millega oleks võimalik täpselt ennustada kahe nädala ilma, on vaja zettaflopsist (1021 flopsi) superarvutit. Praegust arengukiirust arvestades luuakse selline süsteem aasta 2030 paiku[10]

Superarvutite kiirused ajas

muuda
 
Kiireimad superarvutid: kiiruse sõltuvus ajast

See on nimekiri kiireima superarvuti tiitlit hoidnud superarvutitest läbi aegade koos aastaga, millal vastav arvuti rekordi tegi. Tabeli andmed aastani 1993 pärinevad eri allikatest[11]. Aastast 1993 alates pärinevad andmed TOP500 nimekirjast[12] ja tabelis on esitatud suurim kiirus nagu seda näitab Rmax hinnang.

Aasta Superarvuti Suurim kiirus
(Rmax)
Asukoht
1938 Zuse Z1 1 OPS Konrad Zuse, Berliin, Saksamaa
1941 Zuse Z3 20 OPS Konrad Zuse, Berliin, Saksamaa
1943 Colossus 1 5 kOPS Post Office Research Station, Bletchley Park, Suurbritannia
1944 Colossus 2 (Üks protsessor) 25 kOPS Post Office Research Station, Bletchley Park, Suurbritannia
1946 Colossus 2 (Paralleelne protsessor) 50 kOPS Post Office Research Station, Bletchley Park, Suurbritannia
1946
 
UPenn ENIAC
(enne 1948. aasta muudatusi)
5 kOPS Department of War
Aberdeen Proving Ground, Maryland, USA
1954 IBM NORC 67 kOPS Department of Defense
U.S. Naval Proving Ground, Dahlgren, Virginia, USA
1956 MIT TX-0 83 kOPS Massachusetts Inst. of Technology, Lexington, Massachusetts, USA
1958 IBM AN/FSQ-7 400 kOPS 25 USA õhujõududele kuuluvat paika USA-s ja üks Kanadas (kokku 52 arvutit)
1960 UNIVAC LARC 250 kFLOPS Atomic Energy Commission (AEC)
Lawrence Livermore National Laboratory, California, USA
1961 IBM 7030 "Stretch" 1,2 MFLOPS AEC-Los Alamos National Laboratory, New Mexico, USA
1964 CDC 6600 3 MFLOPS AEC-Lawrence Livermore National Laboratory, California, USA
1969 CDC 7600 36 MFLOPS
1974 CDC STAR-100 100 MFLOPS
1975 Burroughs ILLIAC IV 150 MFLOPS NASA Ames Research Center, California, USA
1976 Cray-1 250 MFLOPS Energy Research and Development Administration (ERDA)
Los Alamos National Laboratory, New Mexico, USA (80+ müüdud üle maailma)
1981 CDC Cyber 205 400 MFLOPS (~40 süsteemi üle maailma)
1983 Cray X-MP/4 941 MFLOPS U.S. Department of Energy (DoE)
Los Alamos National Laboratory; Lawrence Livermore National Laboratory; Battelle; Boeing
1984 M-13 2,4 GFLOPS Scientific Research Institute of Computer Complexes, Moskva, Nõukogude Liit
1985 Cray-2/8 3,9 GFLOPS DoE-Lawrence Livermore National Laboratory, California, USA
1989 ETA10-G/8 10,3 GFLOPS Florida State University, Florida, USA
1990 NEC SX-3/44R 23,2 GFLOPS NEC Fuchu Plant, Fuchū, Tokyo, Jaapan
1991 INFN APE 100 (hiljem Quadrics) 100 GFLOPS INFN, Rooma, Itaalia
1993 Thinking Machines CM-5/1024 59,7 GFLOPS DoE-Los Alamos National Laboratory; NSA
1993 Fujitsu Numerical Wind Tunnel 124,50 GFLOPS National Aerospace Laboratory, Tōkyō, Jaapan
1993 Intel Paragon XP/S 140 143,40 GFLOPS DoE-Sandia National Laboratories, New Mexico, USA
1994 Fujitsu Numerical Wind Tunnel 170,40 GFLOPS National Aerospace Laboratory, Tōkyō, Jaapan
1996 Hitachi SR2201/1024 220,4 GFLOPS University of Tokyo, Jaapan
Hitachi/Tsukuba CP-PACS/2048 368,2 GFLOPS Center for Computational Physics, University of Tsukuba, Tsukuba, Jaapan
1997 Intel ASCI Red/9152 1,338 TFLOPS DoE-Sandia National Laboratories, New Mexico, USA
1999 Intel ASCI Red/9632 2,3796 TFLOPS
2000 IBM ASCI White 7,226 TFLOPS DoE-Lawrence Livermore National Laboratory, California, USA
2002 NEC Earth Simulator 35,86 TFLOPS Earth Simulator Center, Yokohama, Jaapan
2004 IBM Blue Gene/L 70,72 TFLOPS DoE/IBM Rochester, Minnesota, USA
2005 136,8 TFLOPS DoE/U.S. National Nuclear Security Administration,
Lawrence Livermore National Laboratory, California, USA
280,6 TFLOPS
2007 478,2 TFLOPS
2008 IBM Roadrunner 1,026 PFLOPS DoE-Los Alamos National Laboratory, New Mexico, USA
1,105 PFLOPS
2009 Cray Jaguar 1,759 PFLOPS DoE-Oak Ridge National Laboratory, Tennessee, USA
2010 Tianhe-IA 2,507 PFLOPS National Supercomputing Center, Tianjin, Hiina
2011 K Computer 8,162 PFLOPS RIKEN, Kōbe, Jaapan
2012 Cray Titan 17,59 PFLOPS DoE-Oak Ridge National Laboratory, Tennessee, USA
2013 NUDT Tianhe-2 33,86 PFLOPS National University of Defense Technology, Guangzhou, Hiina
2016 NRCPC Sunway TiahuLight 93,1 PFLOPS National Supercomputing Center in Wuxi, Wuxi, Hiina

Viited

muuda
 
Cray 2 s/n 2013
  1. Bradley Mitchell: "Supercomputers – A Brief History"
  2. "What Are the Uses of a Supercomputer?" ehow.com
  3. Top500 OS tabel Top500.org
  4. "Jaapanlaste superarvuti sai maailma kiireimaks" Novaator, 21. juuni 2011
  5. How many Google machines 30. aprill 2004
  6. John Markoff, Saul Hensell: "Hiding in Plain Sight, Google Seeks More Power" New York Times, 14. juuni 2006
  7. "Google Surpasses Supercomputer Community, Unnoticed?" 20. mai 2008
  8. "NASA collaborates with Intel and SGI on forthcoming petaflops super computers" Heise online, 8. mai 2008
  9. Patrick Thibodeau: "IBM breaks petaflop barrier" InfoWorld, 10. juuni 2008
  10. DeBenedictis, Erik P. (2005). "Reversible logic for supercomputing". Proceedings of the 2nd conference on Computing frontiers. Lk 391–402. ISBN 1595930191.
  11. CDC ajaline järjestus Computerhistory.org
  12. TOP500 nimekirjad alates aastast 1993 Top500.org

Välislingid

muuda