นักวิจัยจาก MIT และ Tufts University ได้พัฒนาระบบการจัดการที่ช่วยเพิ่มประสิทธิภาพสำหรับ SSD แบบรวมกลุ่ม ซึ่งช่วยลดปัญหาประสิทธิภาพที่ลดลงอันเนื่องมาจากการดำเนินการลบและเขียนบล็อก รวมถึงการรวบรวมขยะ (garbage collection)
ระบบนี้มีชื่อว่า Sandook โดยแยกคุณลักษณะที่จำกัดประสิทธิภาพทั้งในระยะสั้นและระยะยาวของ SSD ออกจากกัน โดยใช้โครงสร้างการควบคุมแบบสองชั้นที่ได้รับข้อมูลจากซอฟต์แวร์เอเจนต์ที่ทำงานบนเซิร์ฟเวอร์จัดเก็บข้อมูล
ประสิทธิภาพของ SSD อาจผันผวนอย่างมาก ขึ้นอยู่กับส่วนผสมของคำขออ่านและเขียน เนื่องจากงานเขียนต้องใช้รอบการลบและเขียนบล็อกใหม่ ซึ่งช้ากว่างานอ่านมาก และปริมาณงานเขียนที่มากเกินไปอาจทำให้ประสิทธิภาพการอ่านโดยรวมลดลง ประสิทธิภาพยังอาจแตกต่างกันไปในชุดการตั้งค่า SDS จากผู้จำหน่ายที่แตกต่างกัน และแม้แต่ใน SSD จากผู้ผลิตและชุดเดียวกัน เมื่อตัวควบคุม SSD กู้คืนเซลล์ที่ถูกลบภายในบล็อก จะต้องคัดลอกข้อมูลที่ถูกต้องออก ลบบล็อก และส่งกลับไปยังพูลว่าง ซึ่งเป็นกระบวนการที่เรียกว่าการรวบรวมขยะ การดำเนินการนี้มักจะถูกจัดการโดยตัวควบคุม SSD แต่ละตัวอย่างอิสระ และอาจนำไปสู่การลดลงของประสิทธิภาพอย่างกะทันหันและมีนัยสำคัญ
นักวิจัยได้จินตนาการถึงคลัสเตอร์การประมวลผลที่ประกอบด้วยโหนดประมวลผลและเซิร์ฟเวอร์จัดเก็บข้อมูล ตัวควบคุมกลางจะทำงานภายในคลัสเตอร์การประมวลผล ควบคู่ไปกับซอฟต์แวร์ไคลเอ็นต์บนเซิร์ฟเวอร์ประมวลผล และซอฟต์แวร์เอเจนต์บนเซิร์ฟเวอร์จัดเก็บข้อมูล เซิร์ฟเวอร์จัดเก็บข้อมูลใช้ SSD มาตรฐานที่มีจำหน่ายทั่วไป โดยแต่ละตัวมีตัวควบคุมดั้งเดิมของตัวเอง
Sandook Controller จะดูแลทะเบียนของ SSD ทั้งหมด โดยได้ทำการโปรไฟล์แต่ละตัวเพื่อกำหนดเกณฑ์มาตรฐานประสิทธิภาพ เช่น ความสามารถ IOPS มันจะกำหนดโหมดการอ่านหรือเขียนให้กับไดรฟ์แต่ละตัว และรับการอัปเดตประสิทธิภาพแบบเรียลไทม์ทุกๆ 200 มิลลิวินาทีจาก Sandook agents บนเซิร์ฟเวอร์จัดเก็บข้อมูล โดยใช้ข้อมูลนี้ มันจะคำนวณน้ำหนักการอ่านและเขียนที่ปรับให้เข้ากับความต้องการ I/O ทั่วโลกของคลัสเตอร์ และแบ่งปันการตัดสินใจการจัดตารางเวลานี้กับซอฟต์แวร์ไคลเอ็นต์ Sandook บนเซิร์ฟเวอร์ประมวลผล
สำหรับการอ่าน Sandook ใช้ประโยชน์จากการจำลองบล็อกที่มีอยู่ ซึ่งใช้สำหรับการทนทานต่อความผิดพลาดอยู่แล้ว เพื่อกำหนดเส้นทางการร้องขอการอ่านไปยังสำเนาบน SSD ที่แตกต่างกันได้อย่างยืดหยุ่น สำหรับการเขียน มันใช้การออกแบบแบบ log-structured ที่ช่วยให้สามารถเขียนไปยัง SSD ใดก็ได้ โดยไม่คำนึงถึงตำแหน่งของบล็อกเชิงตรรกะ ระดับความยืดหยุ่นสูงนี้ช่วยให้มั่นใจได้ว่านโยบายการจัดตารางเวลาสามารถนำไปใช้ได้โดยไม่มีข้อจำกัด
ซอฟต์แวร์ไคลเอ็นต์ Sandook จะเปิดเผยอินเทอร์เฟซอุปกรณ์บล็อกมาตรฐานให้กับแอปพลิเคชัน โดยกำหนดเส้นทางการร้องขอ I/O ไปยัง SSD ที่เหมาะสมที่สุดโดยอัตโนมัติ โดยอิงตามกฎการจัดตารางเวลาของคอนโทรลเลอร์ นอกจากนี้ยังรับสถานะ SSD แบบเรียลไทม์จากเอเจนต์ฝั่งจัดเก็บข้อมูล และสามารถลดลำดับความสำคัญของ SSD ในระหว่างการรวบรวมขยะได้ จากนั้นคำขออ่านและเขียนจะถูกเปลี่ยนเส้นทางไปยังไดรฟ์อื่น เพื่อป้องกันความล่าช้าที่มากเกินไปในระบบจัดเก็บข้อมูลโดยรวม
Sandook agents (1) ประมวลผลคำสั่งอ่านและเขียนจากไคลเอ็นต์และส่งต่อไปยัง SSD เป้าหมาย (2) ให้การตรวจสอบที่ไม่ขึ้นกับฮาร์ดแวร์ รวมถึงการโปรไฟล์เป็นระยะและสัญญาณสถานะแบบเรียลไทม์ เพื่อสนับสนุนการจัดตารางเวลาของคอนโทรลเลอร์ และ (3) ส่งสัญญาณความแออัดของ SSD ไปยังไคลเอ็นต์ เพื่อให้เหตุการณ์ระยะสั้น เช่น การรวบรวมขยะ สามารถจัดการได้ในระดับท้องถิ่นและทันที โดยการเปลี่ยน I/O ไปยัง SSD อื่นๆ ในเซิร์ฟเวอร์
การใช้หน่วยความจำและ CPU ของการตรวจสอบ SSD หลายสิบตัวต่อเซิร์ฟเวอร์จัดเก็บข้อมูลนั้นน้อยมาก
นักวิจัยได้ประเมิน Sandook ภายใต้เวิร์กโหลดสี่ประเภท:
- LeanStore: เอนจิ้นจัดเก็บข้อมูล OLTP ประสิทธิภาพสูงที่ปรับให้เหมาะสมสำหรับ CPU แบบมัลติคอร์และ NVMe SSD
- การเรียนรู้ของเครื่อง: การฝึกโมเดล Unet3D CNN ด้วย PyTorch บนชุดข้อมูลขนาด 180GB
- LZ4: การบีบอัดรูปภาพบนชุดข้อมูล ImageNet ILSVRC2015
- เซิร์ฟเวอร์จัดเก็บข้อมูล: เซิร์ฟเวอร์จัดเก็บข้อมูลบล็อกโอเพนซอร์สประสิทธิภาพสูงที่ให้บริการแอปพลิเคชันที่ไวต่อความหน่วง
โดยรวมแล้ว Sandook ปรับปรุงปริมาณงาน I/O ดิบได้ 30-82% เมื่อเทียบกับระบบที่มีอยู่ซึ่งจัดการกับแหล่งที่มาของความผันผวนของประสิทธิภาพเพียงแหล่งเดียว ในขณะที่ยังคงรักษาความหน่วงหาง (tail latency) ที่ต่ำกว่ามิลลิวินาที สำหรับแอปพลิเคชันที่ไม่ได้แก้ไขซึ่งใช้พูล SSD ร่วมกัน ประสิทธิภาพแบบ end-to-end จะดีขึ้น 12-94%
โดยเฉพาะอย่างยิ่ง เมื่อเทียบกับระบบก่อนหน้า Sandook ให้ปริมาณงานจัดเก็บข้อมูลสูงขึ้น 1.7 เท่า ปริมาณงานแอปพลิเคชันสูงขึ้น 1.12-1.94 เท่า ความหน่วงลดลง 71-88% และการใช้งาน GPU สูงขึ้น 23% โดยไม่จำเป็นต้องใช้ฮาร์ดแวร์ที่กำหนดเองหรือการเปลี่ยนแปลงแอปพลิเคชัน
เอกสาร Sandook ที่มีชื่อว่า “Unleashing The Potential of Datacenter SSDs by Taming Performance Variability” สามารถดาวน์โหลดได้ในรูปแบบ PDF งานนี้จะนำเสนอในงาน USENIX Symposium on Networked Systems Design and Implementation (NSDI 2026) ที่เมือง Renton รัฐวอชิงตัน ระหว่างวันที่ 4 ถึง 6 พฤษภาคม
บริษัท ปักกิ่ง เฉียนซิง เจียทง เทคโนโลยี จำกัด
แซนดี้ หยาง / ผู้อำนวยการฝ่ายกลยุทธ์ระดับโลก
WhatsApp / WeChat: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
ธุรกิจหลัก:
การจัดจำหน่ายผลิตภัณฑ์ ICT / การรวมระบบและบริการ / โซลูชันโครงสร้างพื้นฐาน
ด้วยประสบการณ์ด้านการจัดจำหน่ายไอทีมากกว่า 20 ปี เราเป็นพันธมิตรกับแบรนด์ชั้นนำระดับโลกเพื่อส่งมอบผลิตภัณฑ์ที่เชื่อถือได้และบริการระดับมืออาชีพ
“ใช้เทคโนโลยีสร้างโลกอัจฉริยะ” ผู้ให้บริการผลิตภัณฑ์ ICT ที่คุณไว้วางใจ!