In einem flotten Ritt durch das Land der aktuellen Storage-Buzzwords erläutere ich kurz ein paar technische Hintergründe zu den Begriffen und versuche, nach Sinn und Unsinn zu unterscheiden. Mitreisende werden am Ende der halben Stunde ein grobes Verständnis für Dinge wie Storage Class Memory, Persistent Memory oder Computational Storage haben, und können ein paar Begriffe mit nach Hause nehmen, die beim selbständigen weiterforschen helfen.
5. Persistent Memory / Storage Class Memory
❖ Phase Change Memory – “Kernspeicher”
Intel Optane DC, 3D XPoint (Micron/Intel)
❖ schneller als NAND, langsamer als DRAM
❖ längere Lebensdauer als NAND
❖ adressierbar als Bit/Byte
vs. Pages @ NAND
❖ billiger als DRAM
➛ sehr viel größere Kapazitäten werden erschwinglich
6. Persistent Memory / Storage Class Memory
❖ DCPMM – Data Center Persistent Memory Module
❖ HW (BIOS) muss das supporten
❖ Support in allen aktuellen OS vorhanden
❖ Betriebsarten
➛ “RAM-Disk” bzw. schnelles Storage
➛ DIMM
➛ persistente “RAM-Disk” (FSDAX)
➛ Character Device
❖ ipmctl/ndctl
PMDK – Persistent Memory Developer Kit (http://pmem.io)
Bild:IntelCorp.
9. Computational Storage / Computational Memory
❖ CPU kommt zum Storage
❖ ARM vs. FPGA
Flexibilität vs. Performance
❖ (verteilte) Datenbanken
z. B. Hadoop
❖ Deep Learning / Machine Learning
Anlernen/trainieren eines neuronalen Netzes
❖ Erasure Coding?
Bild: ScaleFlux, Inc.
10. NVMe over Everything
❖ NVMe bisher nur Peer-to-Peer
Infiniband, RDMA
❖ NVMe-oF, NVMe-oF/TCP, FC-NVMe
multihosted, “SAN”
erfordert schnelles Ethernet (40Gb/s, 100Gb/s, 200Gb/s)
❖ NVMe-Appliance
❖ https://nvmexpress.org/
13 Promoters
❖ Freitag – morgen – 12:15
NVMe over Fabrics – die Zukunft des SANs?
FibreChannel
Infiniband
RoCE
iWARP
TCP
NextGeneration
Fabric
NVMe Host Software
Transport-Abstraktion Host
Transport-Abstraktion Storage Controller
NVMe SSDs
11. Composable Infrastructure
❖ ≙ Disaggregated Infrastructure
≙ Software Defined Infrastructure
❖ ≈ flexibles HCI
❖ Auftrennung von Compute und Storage
❖ erfordert leistungsfähige, latenzarme Interconnects/Protokolle
Infiniband, RDMA, RoCE
❖ Single Namespace im Storage
Distributed Filesystems – Ceph, Quobyte, BeeGFS, LizardFS u. a.
❖ Automatisierung und Infrastructure as Code
Ansible, Puppet, SaltStack, Terraform
12. Erasure Coding
❖ RAID on Steroids
nothing new, Begriff etabliert sich
❖ notwendig in verteilten Dateisystemen und Distributed Computing
❖ Lineare Algebra, z. B. Reed-Solomon
Repair Problem
❖ Locally Repairable Codes (LRC)
Mischung aus lokaler und globaler Parity
❖ Open-Source und kommerziell
Scality RING, PoINT, HadoopFS, Ceph, Quobyte,
LizardFS, Rubrik, Backblaze, Datrium, Hedvig,
RozoFS, Nyriad (GPU) u. a.
A2+B1
A2+B2
A1+B1B1
B2
A1
A2
A1➛?
A2➛?
B2
A2+B2
A1+A2+B2
A1+A2+B2