Power10 Performance Abiatzeko Gidak
(Power10 QSGak)
2021eko azaroa
Gutxieneko Memoria
- Prozesadorearen socket bakoitzeko, 8 DIMMetatik 16 gutxienez betetzen dira
- Nodo batean, 32tik 64 gutxienez DIMM-ak betetzen dira
- 4 nodoko sistema batean, 128 DIMMetatik 256 gutxienez betetzen dira
DDIMM entxufearen arauak
- Bete baimendutako gutxieneko memoria (prozesadorearen entxufe bakoitza gutxienez 8 DIMMetatik 16 beteta daude)
- Prozesadore bakoitzaren azpian dauden DIMM guztiek edukiera bera izan behar dute
- Ezaugarrien bertsio-berritzeak 4 DDIMM-en gehikuntzan eskainiko dira, guztiek edukiera bera dute.
- Prozesadore-modulu jakin batera konektatutako guneetan konektaturiko DDIMM baliozko kopuru bakarra 8 edo 12 edo 16 da.
Memoria Errendimendua
- Sistemaren errendimendua hobetzen da memoria kopurua DDIMM zirrikitu gehiagotan zabaltzen den heinean. Adibidezample, Nodo batean 1TB behar bada, hobe da 64 x 32 GB DIMM izatea 32 x 64 GB DIMM izatea baino.
- Tamaina berekoak diren DIMMak konektatzeak errendimendu handiena emango du
- Sistemaren errendimendua hobetzen da quad gehiago elkarren artean bat datozen heinean
- Sistemaren errendimendua hobetzen da prozesadore DDIMM gehiago elkarren artean bat datozen heinean
- Sistemaren errendimendua tiradera anitzeko sistema batean hobetzen da tiradera arteko memoria-ahalmena orekatuta badago.
Memoria banda zabalera
DDIMM edukiera | Gehieneko banda zabalera teorikoa |
32 GB, 64 GB (DDR4 @ 3200 Mbps) | 409 GB/s |
128 GB, 256 GB (DDR4 @ 2933 Mbps) | 375 GB/s |
Laburpena
- Ahalik eta errendimendu onena lortzeko, oro har, memoria uniformeki instalatzea gomendatzen da sistemako nodoen tiradera guztietan eta sistemako prozesadore-entxufe guztietan. Instalatutako sistemako txartel planoetan memoria orekatzeak memoria atzitzea ahalbidetzen du modu koherentean eta normalean zure konfiguraziorako errendimendu hobea lortzen du.
- Memoriaren banda-zabalera maximoa memoria zirrikitu guztiak betez lortzen den arren, etorkizuneko memoria gehitzeko planak kontuan hartu behar dira sistemaren hasierako ordenaren unean zein memoria eginbide-tamaina erabili erabakitzeko.
P10 Konputazioa eta MMA Arkitektura
- 2x banda-zabalera bat datorren SIMD*
- 8 SIMD motor finko eta flotatzaile independente Core bakoitzeko
- 4 – 32x Matrix Matematikako Azelerazioa*
- 4 512 biteko motorra nukleo bakoitzeko = 2048b emaitzak / zikloak
- Matrix matematikako kanpoko produktuak zehaztasun bakarrekoa, bikoitza eta murriztua.
- MMA arkitektura euskarria POWER ISA v3.1-en sartu da
- SP, DP, BF16, HP, Int-16, Int-8 eta Int-4 doitasun-mailak onartzen ditu.
P10 MMAaplikazioak eta lan-kargaren integrazioa
- ML eta HPC aplikazioak aljebra lineal trinkoko kalkuluekin, matrizeen biderketak, konboluzioak eta FFT MMArekin bizkor daitezke.
- GCC bertsioak >= 10 eta LLVM bertsioak >=12 MMA onartzen dute integratuen bidez.
- OpenBLAS, IBM ESSL eta Eigen Liburutegiak dagoeneko optimizatuta daude P10-rako MMA argibideekin.
- MMA integrazio erraza enpresa aplikazioetarako, ML esparruetarako eta Open Community paketeetarako, goiko BLAS liburutegien bidez.
PowerPC Matrix-Multiply Assist integratutako funtzioak https://gcc.gnu.org/onlinedocs/gcc/PowerPC-Matrix-Multiply-Assist-Built-in-Functions.html
Matrix-Multiply Assist Praktika Egokien Gida https://www.redbooks.ibm.com/Redbooks.nsf/RedpieceAbstracts/redp5612.html?OpenProzesadore birtualak
- Partekatutako partizio guztien eskubidedun nukleoen baturak ezin du gainditu partekatutako igerilekuko nukleoen kopurua.
- Ziurtatu fotograma batean partekatutako edozein partizioren konfiguratutako prozesadore birtualen kopurua ez dela igerileku partekatuko nukleoen kopurua baino handiagoa.
- Konfiguratu partekatutako partizio baterako prozesadore birtualen kopurua ahalmen-eskari gorenari eusteko
- Konfiguratu partekatutako partizio baterako eskubidedun nukleoen kopurua partizio horren batez besteko erabilerarako, errendimendu hobea izateko
- Memoria eta CPU afinitate hobea ziurtatzeko (prozesadore birtualaren alferrikako prebentzioak saihesteko), ziurtatu partekatutako partizio guztien nukleoen batura partekatutako igerilekuko nukleoen kopurutik hurbil.
Prozesadorearen bateragarritasun modua
- 2 prozesadore bateragarritasun modu daude eskuragarri AIX-erako: POWER9 eta POWER9_base. Lehenetsia POWER9_base modua da.
- Linuxerako 2 prozesadore bateragarritasun modu daude eskuragarri: POWER9 eta POWER10 modua. Lehenetsia POWER10 modua da.
- LPM partizioen ondoren, itzali egin behar da prozesadorearen bateragarritasun modua aldatzean
Prozesadorea tolesteko gogoetak
- Power9-n AIX exekutatzen duen partekatze-partizioan, vpm_throughput_mode = 0 lehenetsia, Power10-n, vpm_throughput_mode = 2 lehenetsia. Lan-kargak iraupen luzeko lanak dituztenean, oinarrizko erabilera murrizten lagun dezake.
- AIX exekutatzen duen partizio dedikaturako, vpm_throughput_mode lehenetsia = 0 Power9 eta Power10-n.
LPAR Orrialde Taularen Tamainaren Kontuan izan
• Radix orri-taula onartzen da Linux exekutatzen duen Power10-n hasita. Lan-kargaren errendimendua hobetu dezake.
Erreferentzia:
Lan-karga IBM POWER Systems-era migratzeko aholkuak eta aholkuak: https://www.ibm.com/downloads/cas/39XWR7YM
IBM POWERVirtualization Praktika Onenen Gida: https://www.ibm.com/downloads/cas/JVGZA8RW
Ziurtatu sistema eragilearen maila unekoa dela
Fix Central-ek AIX, IBM i, VIOS, Linux, HMC eta F/W-ren azken eguneraketak eskaintzen ditu. Horrez gain, FLRT tresnak H/W eredu bakoitzerako gomendatutako mailak eskaintzen ditu. Erabili tresna hauek zure sistema eguneratuta mantentzeko. Ezin bazara igo gomendatutako mailara, jo IBM POWER10 prozesadoreetan oinarritutako sistemen dokumentura Lan-karga migratzeko Aholkuak eta aholkuak atala.
AIX CPU erabilera
POWER10-n, AIX OS sistema optimizatuta dago gordinen errendimendu onena lortzeko CPU erabilera handiagoan prozesadore dedikatuekin exekutatzen denean. Partekatutako prozesadoreekin exekutatzen denean, AIX OS sistema optimizatuta dago PUZaren erabilera (pc) murrizteko. Bezeroak PUZaren erabilera (pc) gehiago murriztea eskatzen badu, erabili pm_throughput_mode programazio sintonizagarria lan-karga doitzeko eta errendimendu gordinaren eta CPU erabileraren onurak ebaluatzeko.
NX GZIP
Aurrera ateratzekotagPOWER10 sistemetan NX GZIP azelerazioan LPARak POWER9 bateragarritasun moduan egon behar du (ez POWER9_base moduan) edo POWER10 bateragarritasun moduan.
IBM i
Ziurtatu IBM I sistema eragilearen maila unekoa dela. Fix Central-ek IBM I, VIOS, HMC eta firmwarerako azken eguneraketak eskaintzen ditu. https://www.ibm.com/support/fixcentral/
Firmwarea
Ziurtatu sistemaren firmware maila unekoa dela. Fix Central-ek IBM I, VIOS, HMC eta firmwarerako azken eguneraketak eskaintzen ditu. https://www.ibm.com/support/fixcentral/
Memoria DIMMak
Jarraitu memoria-plugin-arau egokiak. Ahal izanez gero, bete memoria DIMM zirrikituak guztiz eta erabili antzeko tamainako memoria DIMMak.
Prozesadorearen SMT maila
Guztiz aurrera ateratzekotagPower10 CPUen errendimenduaren arabera, bezeroei IBM i prozesadore lehenetsitako ataza anitzeko ezarpenak erabiltzea gomendatzen dugu, SMT maximizatuko duena.
LPAR konfiguraziorako maila.
Zatiketa Kokatzea
Egungo FW mailak partizioen kokapen ezin hobea bermatzen dute. Hala ere, CECko partizioetan DLPAR eragiketak maiz egiten badira, DPO erabiltzea gomendatzen da.
kokapena optimizatzeko.
Prozesadore birtualak - prozesadore partekatuak vs dedikatuak
Erabili prozesadore dedikatuak partizio-mailako errendimendu optimorako.
EnergyScale
PUZaren prozesadorearen abiadura onena lortzeko, ziurtatu Maximum Performance ezarrita dagoela (lehenetsia IBM Power E1080-rako). Ezarpen hau ASMIn konfigura daiteke.
Biltegiratze eta sareko I/O
VIOS-ek biltegiratze eta sareko funtzionaltasun malguak eskaintzen ditu. Ahalik eta errendimendu onena lortzeko, erabili jatorrizko IBM i interfazeak I/Orako.
Informazio zabalagoa
Ikusi esteka: IBM I on Power - Performance FAQ https://www.ibm.com/downloads/cas/QWXA9XKN
Linux enpresa-sistema eragilea (OS) oinarri sendoa da zure hodei hibridoaren azpiegiturarako eta enpresa-software-soluzioen eskalatzeko. Azken bertsioak Power10 Enterprise sistema onenetarako optimizatuta daude
Boterea 10
- SLES15SP3, RHEL8.4-ek Power10 jatorrizko modua onartzen dute
- Iparrorratza-moduaren euskarria bezeroei belaunaldi zaharragoetako potentzia sistemetatik (P9 eta P8) migratzeko aukera emateko
- Radix-en itzulpen-laguntza lehenetsia Power10 moduan
- Enkriptazio-errendimenduan hobekuntza nabarmena
Linux + PowerVM
- PowerVM enpresa-funtzioetarako laguntza: LPM, CPU Pools partekatuak, DLPAR
- Irtenbide berritzaileak: SAP HANA etorkizuneko aplikazioen hazkundea 4PB helbide birtualeko espazioarekin
- Datuak birkargatzeko denbora murriztu: PMEM birtualaren euskarria SAP HANArako
- Mundu mailako laguntza eta zerbitzua
Onartutako banaketak:
- Power9-tik hasita RedHat eta SUSE bakarrik onartzen dira PowerVM partizioetan
- Belaunaldi zaharragoko HW estaltzen duen banaketa-laguntza matrizeari buruzko informazio zehatza
LPM laguntza:
- Mugitu Linux partizio logikoak belaunaldi zaharragoetako Power sistemetatik aplikazioen geldialdi-denbora ia zerorekin
- Erreferentzia: LPM Gida eta erlazionatutako informazioa
Potentzia Pakete Espezifikoak:
- PowerPC-utils paketea: IBM PowerPC LPARak mantentzeko utilitateak ditu. Distroaren zati gisa eskuragarri.
- Advance Toolchain for Linux on Power: azken konpiladoreak eta exekuzio-liburutegiak ditu.
Praktika onak:
- RHEL-ek aurrez definitutako sintonizazioak eskaintzen ditu sintonizatutako zerbitzuaren zati gisa.
- SAP aplikazioetarako gomendatutako OS ezarpenak ikusteko, kontsultatu SAP-en azken oharrak. Normalean sintonizatua RHEL-en erabiltzen da eta capture edo sapconf SLES-en
- Maiztasuna PowerVM-k kudeatzen du. Erreferentzia: Energia Kudeaketa
- Power8 Huge Dynamic DMA Window abiarazteak I/O errendimendua hobetzen laguntzen du.
- Power9 abiarazte 24×7-Monitoring perf tresnarekin integratuta dago. Sistema osoa kontrolatzeko aukera ematen du.
- Ziurtatu sistemaren firmware maila unekoa dela.
- PowerPC-utils-en lparnumascore-k LPAR-en egungo afinitate puntuazioa erakusten du. DPO erabil daiteke LPAR afinitate puntuazioa hobetzeko.
Irakurketa gehiago:
- Power for SLES eta ezaugarri sinesgarri batzuk.
- Hasi Linux on Power Systems, Linux on Power Systems zerbitzariekin
- Enterprise Linux komunitatea
- IBM Power sistemek hainbat sare-egokigailu onartzen dituzte abiadura eta ataka-kopuru desberdinetakoak.
- Zure aurreko sistemaren sare-egokitzaile berdinak erabiltzen ari bazara, hasiera batean, sintonizazio bera erabili beharko litzateke sistema berrian.
- Ethernet egokitzaile gehienek jaso eta igortzeko ilara anitz onartzen dituzte, zeinen buffer tamaina alda daiteke pakete kopurua handitzeko.
- Ilararen ezarpen lehenetsiak desberdinak dira egokitzaile ezberdinekin eta baliteke bezero-zerbitzari eredu batean mezuen tasa maximoak lortzeko optimoak ez izatea.
- Ilara gehigarriak erabiltzeak sistemaren PUZaren erabilera areagotuko du; beraz, lan-karga zehatz baterako ilararen ezarpen optimoa erabili behar da.
Abiadura handiagoko egokigailuaren gogoetak
- Abiadura handiagoko sareek 25 GigE eta 100 GigE sare-egokigailuekin hainbat hari paralelo eta kontrolatzaile-atributuak doitzea behar dute.
- Gen4 egokitzailea bada, ziurtatu egokitua Gen4 zirrikitu batean eserita dagoela.
- Konpresioa, enkriptatzea eta bikoiztea bezalako funtzio gehigarriek latentzia gehi dezakete
AIX-en ilararen ezarpenak aldatzea
AIX-en jaso/bidaltzeko ilara kopurua aldatzeko
- ifconfig enX deskonektatu behera
- chdev -l entX -a ilarak_rx= -a ilarak_tx=
- chdev -l enX -a egoera=gora
Linux-en ilararen ezarpenak aldatzea
Linux ethtool -L ethX konbinatuta ilara kopurua aldatzeko
AIX-en ilararen tamaina aldatzea
- ifconfig enX deskonektatu behera
- chdev -l entX -a rx_max_pkts = -a tx_max_pkts =
- chdev -l enX -a egoera=gora
LinuxP-en ilararen tamaina aldatzea: ethtool -G ethX rx tx
Birtualizazioa
- Sare birtualizatuak SRIOV, vNIC, vETH moduan onartzen dira. Birtualizazioak latentzia gehitzen du eta jarioa murrizten du jatorrizko I/Orekin alderatuta.
- Backend hardwareaz gain, ziurtatu VIOS memoria eta CPU kopurua nahikoa dela behar den errendimendua eta erantzun denborak emateko
- IBM PowerVM praktika onak oso lagungarriak izan daitezke VIOS dimentsionatzeko
- Aurreko sistemaren biltegiratze-egokigailu berdinak erabiltzen ari bazara, hasiera batean, sintonizazio bera erabili beharko litzateke sistema berrian. Lehendik dagoen sistematik errendimendu gehigarria nahi bada, sintonizazio normala egin beharko litzateke.
- Biltegiratze-azpisistemak aurreko sisteman baino sistema berriagoan nabarmen desberdinak badira, honako gogoeta zerrenda honek aplikazioen hautematen den abiaduran eragin negatiboa izan dezake:
- Zuzeneko erantsitako biltegiratzetik (DAS edo barneko) biltegiratze eremuko sarera (SAN) edo sarean atxikitako biltegiratzetik (NAS) (edo kanpoko biltegiratze) latentzia handitu daiteke.
- Konpresioa, enkriptatzea eta desduplicazioa bezalako funtzio gehigarriek latentzia gehi dezakete.
- Biltegiratze LUN-kopurua murriztean, beharrezkoak diren errendimenduak onartzeko behar diren zerbitzariaren baliabideak murriztu daitezke.
- Eragin horiek ulertzeko, jo gailu berrien sintonizazio edo konfigurazio gidak».
- Birtualizazioak latentzia gehitzen du eta jarioa murriztu dezake jatorrizko I/Orekin alderatuta. Backend hardwareaz gain, ziurtatu VIOS memoria eta CPU
- VIOS-en abiadura handiagoko egokitzaile birtualizatuetara pasatzeko, VIOSen konfigurazioa PUZetan eta memorian doitu beharko da. IBM PowerVM praktika onak oso lagungarriak izan daitezke VIOS dimentsionatzeko.
Tuning jarraibideak – ikusi IBM Knowledge Center for AIX eta Linux gidalerroetara.
PCIe3 12 GB cache RAID + SAS egokitzailea Quad-port 6 Gb x8 egokitzailea Linux:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=availability-ha-asymmetricaccess-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=linux-common-sas-raidcontroller-tasks
AIX:
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-multi-initiator-highavailability
- https://www.ibm.com/docs/en/power9/9223-42H?topic=aix-common-controller-diskarray-management-tasks
IBM
- https://www.ibm.com/docs/en/power9/9223-42H?topic=configurations-dual-storageioa-access-optimization
- https://www.ibm.com/docs/en/power9/9223-42H?topic=i-common-controller-diskarray-management-tasks
PCIe3 x8 2 atakako Fibre Channel (32 Gb/s) egokitzailea
- https://www.ibm.com/docs/en/aix/7.2?topic=iompio-device-attributes
- https://www.ibm.com/docs/en/power9?topic=channel-npiv-multiple-queue-support
AIX-en doikuntza gehigarria errendimendurako:
- SCSI bidez Fibre Channel (MPIO): ezarri bide anitzeko algoritmoa round_robin gisa disko bakoitzeko
- NVMe Fibre Channel bidez: aurkikuntza fasean sortutako NVMe Fibre Channel bidezko kontrolagailu dinamiko bakoitzeko 7ri egotzi diezaioke.
NVMe Adapter AIX sintonizatzea errendimendurako
Multzoak 8ri eman diezaioke NVMe gailu bakoitzeko
IBMren hurrengo belaunaldiko C/C++/Fortran konpilatzaileak, IBMren optimizazio aurreratuak kode irekiko LLVM azpiegiturarekin konbinatzen dituztenak.
![]() |
|
LLVM Moneta handiagoa C/C++ hizkuntzarako Eraikitzeko abiadura azkarragoa Komunitatearen optimizazio komunak LLVMn oinarritutako hainbat utilitate |
IBM optimizazioak Power arkitektura erabat ustiatzea Sektoreko optimizazio aurreratuak Mundu mailako laguntza eta zerbitzua |
Eskuragarritasuna
- 60 eguneko kargarik gabeko proba: deskargatu Open XL produktuaren orrialdetik
- Lortu IBM mundu-mailako Zerbitzua eta Laguntza lizentzia-aukera malguen bidez, kanalizazio bikoitzetik (AAS eta PA)
- Betiko lizentzia (baimendutako erabiltzaile bakoitzeko edo aldibereko erabiltzaile bakoitzeko)
- Hileroko lizentzia (Prozesu Birtualeko Nukleo bakoitzeko): hodeiko erabilera-kasuak bideratu, adibidez, PowerVR instantzian
Gomendatutako errendimendua doitzeko aukerak
Optimizazio Maila | Erabilera gomendioak |
-O2 eta -O3 | Abiapuntu tipikoa |
Estekaren denboraren optimizazioa: -flto (C/C++), -qlto (Fortran) | Funtzio-dei txiki asko dituzten lan-kargak egiteko |
Profile optimizazio gidatua: -fprofile-sortu, -fprofile-erabiltzea (C/C++) -qprofile-sortu, -qprofile-erabiltzea (Fortran) |
Adarkatze eta funtzio-dei asko dituzten lan-kargak egiteko |
Informazio gehiago lortzeko, bisitatu: https://www.ibm.com/docs/en/openxl-c-and-cpp-aix/17.1.0
https://www.ibm.com/docs/en/openxl-fortran-aix/17.1.0
Power10 arkitektura osoa ustiatzea Open XL 17.1.0-rekin
- '–mcpu=pwr10' konpilatzaile aukera berria Power10 instrukzioak baliatzen dituen kodea sortzeko eta Power10-rako optimizazioak automatikoki doitzeko
- Power10 funtzionalitate berriak desblokeatzeko integratutako funtzio berriak, adibidez, Matrix Multiply Accelerator (MMA)
- Power10-rako MASS SIMD eta liburutegi bektorial berriak gehitu ziren. MASS liburutegiko funtzio guztiak (SIMD, bektoriala, eskalarra) Power10erako sintonizatuta (Power9 ere).
Oharra: Aurreko Power prozesadoreetan exekutatzeko XL Konpiladoreen (adibidez, XL 16.1.0) aurreko bertsioekin konpilatutako aplikazioak bateragarriak izango dira Power10-n.
AIX-en bateragarritasun bitarra
Oharra: XL C/C++ AIX 16.1.0-rako dagoeneko xlclang++ deialdi berria sartu zuen, LLVM proiektuko Clang frontend-a aprobetxatzen duena ü xlC-rekin eraikitako C++ objektuak.
- AIX (IBM-ren frontend-ean oinarrituta) ez dira bitar bateragarriak AIX-erako xlclang++ 16.1.0-rekin eraikitako C++ objektuekin.
- AIXerako xlclang++ 16.1.0-rekin eraikitako C++ objektuak AIX 17.1.0rako Open XL C/C++ berriarekin bateragarriak izango dira.
- C bateragarritasuna AIX konpilatzaile guztietan mantentzen da (aurreko XL bertsioak AIXentzat, Open XL C/C++ AIX 17.1.0rako)
- Fortran-en bateragarritasuna mantentzen da AIX-rako aurreko XLF bertsioaren eta Open XL Fortran AIX 17.1.0-rako.
Eskuragarritasuna
GCC konpilatzaileak Enterprise Linux banaketa guztietan daude eskuragarri
AIX.
- Instalatutako GCC bertsioa 8.4 RHEL 8-n eta 7.4 SLES 15-en da. RHEL 9-k GCC 11.2 bidaltzea espero da.
- GCCren bertsio berriki nahikoa lortzeko hainbat modu daude banaketarako konpiladore lehenetsiak Power10 onartzeko zaharregiak direnean.
- Red Hat-ek GCC Toolset [1] onartzen du horretarako.
- SUSEk Garapen Tresnen Modulua eskaintzen du. [2]
- IBMk azken konpiladoreak eta liburutegiak eskaintzen ditu Advance Toolchain-en bidez. [3]
IBM Advance Toolchain
- Advance Toolchain-ek Power-en optimizatutako sistema-liburutegiak eskaintzen ditu konpiladore, arazketa eta beste tresnekin batera.
- Advance Toolchain-ekin eraikitzeko kodeak ahalik eta kode optimizatuena sor dezake azken prozesadoreetan.
Hizkuntzak
- C (GCC), C++ (g++) eta Fortran (gfortran), Go (GCC), D (GDC) eta Ada (gnat) bezalako beste batzuekin batera.
- GCC, g++ eta gfortran bakarrik instalatu ohi dira lehenespenez.
- Golang konpilatzailea [4] Go programak Power-en eraikitzeko alternatiba hobetsi da.
Bateragarritasuna eta eginbide berriak Power10-n
- POWER8 edo POWER9 prozesadoreetan exekutatzeko GCCren aurreko bertsioekin konpilatutako aplikazioak bateragarriak izango dira Power10 prozesadoreetan.
- GCC 11.2 edo berriagoa gomendatzen da Power ISA 3.1-n eskuragarri dauden eta Power10 prozesadoreetan inplementatutako eginbide berri guztiak ustiatzeko.
- GCC 11.2-k Power10 prozesadoreek eskaintzen duten Matrix Multiply Assist (MMA) funtziorako sarbidea eskaintzen du. [5]
- MMA programak GCC, LLVM eta Open XL konpiladoreetako edozein erabiliz konpila daitezke, baldin eta nahikoa azken bertsioak erabiltzen badituzu.
IBM-k gomendatutako eta onartutako konpiladore-markak [6]
-O3 edo -Ekialdea | Optimizazio oldarkorra. -East funtsean -O3 -fast-math-ren baliokidea da, IEEE koma mugikorreko aritmetikaren murrizketak ere lasaitzen dituena. |
-mcpu=potentzia | Konpilatu Power prozesadoreak onartzen dituen argibideak erabiliz. Adibidezample, Power10-n soilik dauden argibideak erabiltzeko, hautatu -mcpu=power10. |
-ra | Aukerakoa. Egin "link-time" optimizazioa. Honek funtzio-deietan kodea optimizatzen du, non deitzaileak eta deitutako funtzioak konpilazio-unitate desberdinetan dauden, eta askotan errendimenduaren hobekuntza nabarmena eman dezake. |
-unroll-loops | Aukerakoa. Egin begizta-gorputzen bikoizketa erasokorragoa konpilatzaileak normalean baino. Orokorrean, hori baztertu beharko zenuke, baina kode batzuetan, honek errendimendu hobea eman dezake. |
Oharra:
-mcpu=power10 GCC 10.3 bezain laster onartzen bada ere, GCC 11.2 hobesten da, lehenagoko konpilatzaileek ez dituztelako onartzen Power10 prozesadoreetan inplementatutako funtzio guztiak. Gainera, -mcpu=power10 erabiliz sortutako objektuak ez dira POWER9 edo lehenagoko prozesadoreetan exekutatuko! Hala ere, prozesadore bertsio desberdinetarako optimizatuta dagoen kodea sortzeko moduak daude. [7] [1] Red Hat: GCC Toolset erabiliz. https://access.redhat.com/documentation/enus/red_hat_enterprise_linux/8/html/developing_c_and_cpp_applications_in_rhel_8/gcc-toolset_toolsets.
[2] SUSE: Garapen tresnen modulua ulertzea. https://www.suse.com/c/suse-linux-essentialswhere-are-the-compilers-understanding-the-development-tools-module/.
[3] Advance Toolchain for Linux-en IBM Power Systems-en. https://www.ibm.com/support/pages/advancetoolchain-linux-power.
[4] Joan Hizkuntza. https://golang.org. [5] Matrix-Multiply Assist Praktika Egokien Gida. http://www.redbooks.ibm.com/redpapers/pdfs/redp5612.pdf
[6] GNU Konpiladore bilduma erabiliz. https://gcc.gnu.org/onlinedocs/gcc.pdf
[7] Helburu zehatzeko optimizazioa GNUZeinzuzeneko Funtzio Mekanismoarekin. https://developer.ibm.com/tutorials/optimized-libraries-for-linux-on-power/#target-specific-optimization-
© 2021 IBM Corporation-ekin-gnu-zeharkako-funtzio-mekanismoarekin.
Java aplikazioek aurrera egin dezaketetagP10 ISA funtzio berrien P10 moduan exekutatzen diren sistema eragileetan behean zerrendatutako Java exekuzio-denbora bertsioak edo berriagoak erabiliz:
Java 8
- IBM SDK 8 SR6 FP36
- IBM Semeru Runtime Open Edition 8u302: openj9-0.27.1
Java 11
- IBM Semeru Runtime Certified Edition 11.0.12.1: openj9-0.27.1
- IBM Semeru Runtime Open Edition 11.0.12.1: openj9-0.27.1
Java 17 (baliteke kontrolatzaileak oraindik erabilgarri ez egotea)
- IBM Semeru Runtime Certified Edition 17: openj9-0.28
- IBM Semeru Runtime Open Edition 17: openj9-0.28
- OpenJDK 17
Errendimenduaren sintonizazio erreferentziak:
IBM WebSphere Application Server Performance Cookbook
Orrialdearen Tamaina
AIX-eko Oracle datu-base gehienentzako gomendio orokorra 64KB orriaren tamaina erabiltzea da, eta ez 16MB orriaren tamaina SGArako. Normalean, 64 KB-ko orrialdeek ia berdina dute
errendimendu onura 16 MB orrialde gisa kudeaketa berezirik gabe.
TNS Entzulea
Oracle 12.1 datu-baseak eta ondorengo bertsioek lehenespenez 64 orrialde erabiliko dituzte testurako, datuetarako eta pilarako. Hala ere, TNSLISTENER-ek 4k orrialde erabiltzen ditu oraindik testu, datu eta pilarako. To
gaitu 64k orrialde entzulearentzat esportazio komandoa erabiltzen du entzule-prozesua hasi aurretik. Kontuan izan entzuleak agortzen dituen ASM oinarritutako ingurune batean exekutatzen dela
GRID_HOME eta ez ORACLE_HOME.
"Strictly setenv" komandoaren dokumentazioa 12.1 edo ondorengo bertsioetan aldatu da. -t edo -T kendu zen -env edo -envs-en alde. Oracle Listener ingurunean ezarri eta esportatu:
– LDR_CNTRL=DATAPSIZE=64K@TEXTPSIZE=64K@STACKPSIZE=64K - VMM_CNTRL=vmm_fork_policy=COR (gehitu 'Kopiatu irakurtzean' komandoa)
Sintaxia partekatua
LDR_CNTRL=SHARED_SYMTAB=Y ezarpena ez da 11.2.0.4 edo ondorengo bertsioetan berariaz ezarri behar. Konpiladore-lokatzaile-aukerek ezarpen hau zaintzen dute eta jada ez dute berariaz ezarri behar. Ez da gomendagarria LDR_CNTRL=SHARED_SYMTAB=Y 12c edo ondorengo bertsioetan berariaz ezarrita izatea.
Prozesadore birtuala tolestea
Ezarpen kritikoa da RAC ingurune batean LPARak erabiltzean prozesadorea tolestea gaituta. Ezarpen hau doitzen ez bada, datu-basearen lan-karga baldintzetan RAC nodoak kanporatzeko arrisku handia dago. Scheda -p -o vpm_xvcpus=2
VIOS eta RAC interkonexioa
10G (hau da, 10G Ethernet egokitzailea) konexio dedikatu bat gomendatzen da gutxienez banda-zabalera nahikoa eskaintzeko klusterren denboraren araberako trafikorako. RAC kluster trafikoa - interkonexioaren trafikoa dedikatu behar da eta ez partekatu. Interkonexioa partekatzeak denbora-atzerapenak eragin ditzake nodoak zintzilikatzeko/desalojatzeko arazoak sor ditzakete.
Sarearen errendimendua
Aspaldiko sarea doitzeko iradokizuna da Oracle-n AIX-en, nahiz eta lehenetsia 0-n geratzen den. TCP ezarpena rfc1323=1
Informazio zabalagoa
Ikus esteka: AIX exekutatzen duten Oracle Database bertsioen egonkortasuna eta errendimendua kudeatzea Power Systems-en POWER9 barne.
https://www.ibm.com/support/pages/node/6355543
Orokorra
- Erabili SMT8 modua
- Erabili CPU LPAR dedikatuak
Db2 Biltegia
- Ziurtatu abiadura handiko sare pribatu bat existitzen dela nodo guztien artean
- Mugatu MLN konfigurazioa socket bakoitzeko nodo batera
CP4D
- Erabili PCIe4 OCP nodoen sarerako
- OCP 4.8 baino lehen, ezarri nukleoaren parametroa slub_max_order=0
Db2 Praktika Egokienak
https://www.ibm.com/docs/en/db2/11.5?topic=overviews-db2-best-practices
Sarea
- Pod sarerako, erabili SRIOV jatorrizkoan oinarritutako sare pribatua LPM beharrezkoa ez bada, bestela, erabili VNIC
- Banda zabalera handia edo latentzia txikia behar duten aplikazioetarako, kontuan hartu SR-IOV sare-operadorea erabiltzea VF zuzenean pod bati esleitzeko.
- Denbora-muga baxua behar duten zerbitzuetarako, konfiguratu lehendik dagoen ibilbide baterako denbora-muga lehenetsiak
- Doitu OCPren kluster sarearen nahi duzun MTU tamaina
Sistema eragilea
- Demagun u-mugak handitzea CoreOS Instalatu ondorengo aldaketetan
- Ikusi OCP instalazioaren gutxieneko eskakizunak Power plataformako OCP4.8 Power-en instalatzeko
Hedapena
- Aplikazioak zabaltzean, kontuan izan vCPU bat nukleo fisiko baten baliokidea dela aldibereko hari anitzeko (SMT) edo hiperharia gaituta ez dagoenean. SMT gaituta dagoenean, VCPU bat hardware-hari baten baliokidea da.
- Ikusi langileen eta nodo nagusientzako gutxieneko neurrien gidalerroak Gutxieneko baliabideen eskakizunak
- Esleitu biltegiratze dedikatu bereizi bat edukiontzien irudien erregistro integratuan
- Erabili OpenShift Container Platform-eko osagaiek datuak idazten dituzten OCP-ren direktorio nagusien direktorio nagusietarako dimentsio jarraibide hauek.
Dokumentuak / Baliabideak
![]() |
IBM Power10 Performance [pdfErabiltzailearen gida Power10, Performance, Power10 Performance |