ในระหว่างงาน GTC 2026 VDURA ได้จัดแสดงการอัปเดตที่สำคัญสำหรับแพลตฟอร์มข้อมูล ซึ่งออกแบบมาเพื่อเพิ่มประสิทธิภาพการใช้งาน GPU และประสิทธิภาพการจัดเก็บข้อมูลในสภาพแวดล้อม AI การประกาศดังกล่าวประกอบด้วยไฮไลท์สำคัญ 3 ประการ ได้แก่ ความพร้อมใช้งานทั่วไปของ Remote Direct Memory Access (RDMA) การแสดงตัวอย่างของเทคโนโลยี Context-Aware Tiering ที่เป็นนวัตกรรมใหม่ และการกำหนดค่าโครงสร้างพื้นฐานที่ได้รับการตรวจสอบซึ่งสร้างขึ้นโดยใช้ CPU ของ AMD EPYC Turin และส่วนประกอบเครือข่าย NVIDIA ConnectX-7
การอัปเดตเหล่านี้ได้รับการออกแบบมาเพื่อขจัดปัญหาคอขวดในการเคลื่อนย้ายข้อมูลระหว่างคลัสเตอร์ GPU และระบบจัดเก็บข้อมูล ขณะเดียวกันก็เพิ่มประสิทธิภาพการจัดวางข้อมูลข้ามชั้นพื้นที่จัดเก็บข้อมูล เพื่อรองรับการฝึกอบรม AI ขนาดใหญ่และการอนุมานปริมาณงานได้ดีขึ้น ซึ่งแก้ไขจุดบกพร่องที่สำคัญในโครงสร้างพื้นฐาน AI ที่ทันสมัย
RDMA เปิดใช้งานเส้นทางข้อมูล GPU-Direct
VDURA ได้รวมการสนับสนุน RDMA ไว้ในแพลตฟอร์มข้อมูลทั้งหมด ทำให้เซิร์ฟเวอร์ GPU สามารถเข้าถึงที่เก็บข้อมูลโดยตรงผ่านเครือข่ายโดยไม่ต้องเกี่ยวข้องกับ CPU ความก้าวหน้านี้ช่วยให้การถ่ายโอนข้อมูลระหว่าง GPU สู่พื้นที่จัดเก็บสามารถข้ามเคอร์เนลแบบดั้งเดิมและเส้นทางที่ใช้สื่อกลาง CPU ได้ ซึ่งช่วยลดความหน่วงลงได้อย่างมากและเพิ่มทรูพุต มอบเส้นทางข้อมูลที่มีความหน่วงต่ำและมีทรูพุตสูง ซึ่งการฝึกอบรม AI และการอนุมานต้องการปริมาณงานในวงกว้าง
เนมสเปซสากลของ VDURA
การใช้งาน RDMA ได้รับการบูรณาการอย่างแนบแน่นกับ VDURA DirectFlow ซึ่งเป็นเลเยอร์การเคลื่อนย้ายข้อมูลที่เป็นกรรมสิทธิ์ของบริษัท ทำให้มั่นใจได้ว่าการรับส่งข้อมูลเซิร์ฟเวอร์ GPU ทั้งหมดจะใช้ประโยชน์จาก RDMA ด้วยการขจัดโอเวอร์เฮดของ CPU ในพาธข้อมูล ทรัพยากรการประมวลผลยังคงทุ่มเทอย่างเต็มที่ให้กับงานฝึกอบรมโมเดลหลักและงานอนุมาน แนวทางนี้รักษาอัตราการใช้ GPU ที่สูงขึ้นในขณะเดียวกันก็ลดเวลาแฝงของไปป์ไลน์ในคลัสเตอร์ AI แบบกระจาย ซึ่งเป็นลำดับความสำคัญหลักสำหรับการปรับใช้ AI ขนาดใหญ่
การแบ่งระดับแบบ Context-Aware กำหนดเป้าหมายไปที่ประสิทธิภาพการจัดวางข้อมูล
นอกจากนี้ VDURA ยังให้รายละเอียดเกี่ยวกับระยะแรกของความสามารถ Context-Aware Tiering ซึ่งมีกำหนดเปิดตัวทั่วไปในช่วงปลายปี 2569 เทคโนโลยีนี้นำเสนอการจัดวางข้อมูลอัตโนมัติอัจฉริยะในระดับพื้นที่จัดเก็บข้อมูลตามพฤติกรรมปริมาณงานแบบเรียลไทม์และรูปแบบการเข้าถึง ซึ่งก้าวไปไกลกว่านโยบายคงที่เพื่อให้แน่ใจว่าข้อมูลอยู่ในตำแหน่งที่ต้องการมากที่สุด
ระยะเริ่มต้นจะขยายบัฟเฟอร์ DirectFlow ไปยัง NVMe SSD ภายในเครื่อง ซึ่งช่วยให้ข้อมูล “ร้อน” ที่เข้าถึงบ่อยครั้งอยู่ใกล้ทรัพยากรการประมวลผลมากขึ้น ซึ่งช่วยลดการพึ่งพาพื้นที่จัดเก็บข้อมูลที่ใช้ร่วมกันหรือเชื่อมต่อกับเครือข่ายสำหรับข้อมูลที่ใช้งาน ปรับปรุงเวลาตอบสนองสำหรับเวิร์กโหลดที่สำคัญ และเพิ่มประสิทธิภาพการทำงานให้ดียิ่งขึ้น
นอกจากนี้ แพลตฟอร์มนี้ยังแนะนำการควบคุมการเขียนกลับ KVCache ซึ่งเลือกคงเฉพาะข้อมูลการอนุมานที่สำคัญต่อการคงอยู่ไว้ในพื้นที่จัดเก็บข้อมูลที่คงทน สิ่งนี้จะช่วยลดกิจกรรม I/O ที่ไม่จำเป็นให้เหลือน้อยที่สุด ในขณะเดียวกันก็รับประกันความคงอยู่ที่จำเป็นสำหรับไปป์ไลน์การอนุมาน AI การผลิต ทำให้เกิดความสมดุลระหว่างประสิทธิภาพและความน่าเชื่อถือ
นอกจากนี้ VDURA ยังเปิดตัวเฟรมเวิร์ก Context Cache Tiering แบบรวมที่ครอบคลุม DRAM และ SSD ในเครื่อง เฟรมเวิร์กนี้ช่วยให้สามารถเข้าถึงการอ่านและเขียนด้วยความเร็วสูงเทียบได้กับประสิทธิภาพระดับ LMCache ทำให้เหมาะอย่างยิ่งสำหรับกรณีการใช้งาน เช่น การอนุมาน LLM ในบริบทแบบยาว และการสร้างการเรียกข้อมูลเสริม (RAG)
VDURA ตั้งข้อสังเกตว่าขั้นตอนในอนาคตของ Context-Aware Tiering จะขยายไปสู่การจัดวางข้อมูลที่รับรู้แอปพลิเคชัน การปรับปรุงการเชื่อมโยงแคชข้ามโหนด และการสนับสนุนส่วนประกอบโครงสร้างพื้นฐานที่เกิดขึ้นใหม่ เช่น NVIDIA BlueField-4 DPUs ซึ่งจะขยายขีดความสามารถของแพลตฟอร์มต่อไปในขณะที่ปริมาณงาน AI พัฒนาขึ้น
เพื่อเสริมการปรับปรุงซอฟต์แวร์เหล่านี้ บริษัทได้เปิดตัวการกำหนดค่าแพลตฟอร์มที่ได้รับการปรับปรุงซึ่งจับคู่โปรเซสเซอร์ AMD EPYC Turin กับอะแดปเตอร์เครือข่าย NVIDIA ConnectX-7 การกำหนดค่าเหล่านี้สร้างขึ้นโดยมีจุดประสงค์เพื่อเสริมเส้นทางข้อมูลที่เปิดใช้งาน RDMA โดยรองรับการสื่อสารที่มีปริมาณงานสูงและมีความหน่วงต่ำระหว่างคลัสเตอร์ GPU และระบบจัดเก็บข้อมูล ซึ่งเป็นการสร้างมาตรฐานใหม่สำหรับโครงสร้างพื้นฐาน AI ที่ใช้ GPU
ไปป์ไลน์ข้อมูล AI แบบเต็มสแต็ก
Ken Claffey ซีอีโอของ VDURA เน้นย้ำถึงความมุ่งมั่นของบริษัทในการนำเสนอแพลตฟอร์มการจัดเก็บข้อมูล AI ที่ครอบคลุมลำดับชั้นข้อมูลทั้งหมดตั้งแต่หน่วยความจำไปจนถึงการจัดเก็บข้อมูลระยะยาว โดยไม่กระทบต่อประสิทธิภาพการทำงาน เขาเน้นย้ำว่าแพลตฟอร์มดังกล่าวใช้ประโยชน์จาก RDMA สำหรับการเข้าถึงข้อมูลโดยตรงโดยไม่ต้องใช้ CPU และ Context-Aware Tiering เพื่อวางตำแหน่งข้อมูลข้ามชั้นพื้นที่จัดเก็บข้อมูลอย่างชาญฉลาด ซึ่งเป็นนวัตกรรมที่ช่วยให้องค์กรต่างๆ รองรับโมเดล AI ที่ใหญ่ขึ้น จัดการคำขอการอนุมานได้มากขึ้น และปรับขนาดโครงสร้างพื้นฐาน AI ในขณะที่ตอบสนองความต้องการความน่าเชื่อถือระดับการผลิต
วิธีการแบบผสมผสานนี้ได้รับการออกแบบมาโดยเฉพาะเพื่อรองรับขนาดโมเดลที่ใหญ่ขึ้น เพิ่มปริมาณการอนุมาน และปรับปรุงประสิทธิภาพของโครงสร้างพื้นฐานโดยรวม ทั้งหมดนี้ในขณะเดียวกันก็รักษามาตรฐานความน่าเชื่อถือและการปฏิบัติตามข้อกำหนดที่จำเป็นสำหรับการปรับใช้ AI ในการผลิต
ความพร้อมใช้งาน
ขณะนี้การสนับสนุน RDMA พร้อมใช้งานโดยทั่วไปแล้วบนแพลตฟอร์ม VDURA V5000 และ V7000 และพร้อมสำหรับการใช้งานทันที Context-Aware Tiering ระยะที่ 1 มีกำหนดจะพร้อมใช้งานทั่วไปภายในปี 2569 โดยขณะนี้โปรแกรมการเข้าถึงล่วงหน้าอยู่ระหว่างดำเนินการสำหรับลูกค้าที่ได้รับเลือกเพื่อทดสอบและเพิ่มประสิทธิภาพเทคโนโลยีก่อนที่จะเปิดตัวเต็มรูปแบบ
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/ผู้อำนวยการฝ่ายกลยุทธ์ระดับโลก
WhatsApp / WeChat: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
มุ่งเน้นธุรกิจ:
การจัดจำหน่ายผลิตภัณฑ์ ICT/บูรณาการระบบและบริการ/โซลูชั่นโครงสร้างพื้นฐาน
ด้วยประสบการณ์การจัดจำหน่ายด้านไอทีมากกว่า 20 ปี เราร่วมมือกับแบรนด์ชั้นนำระดับโลกเพื่อนำเสนอผลิตภัณฑ์ที่เชื่อถือได้และบริการระดับมืออาชีพ
“ใช้เทคโนโลยีเพื่อสร้างโลกอัจฉริยะ” ผู้ให้บริการผลิตภัณฑ์ ICT ที่เชื่อถือได้ของคุณ!
Sandy Yang/ผู้อำนวยการฝ่ายกลยุทธ์ระดับโลก
WhatsApp / WeChat: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
มุ่งเน้นธุรกิจ:
การจัดจำหน่ายผลิตภัณฑ์ ICT/บูรณาการระบบและบริการ/โซลูชั่นโครงสร้างพื้นฐาน
ด้วยประสบการณ์การจัดจำหน่ายด้านไอทีมากกว่า 20 ปี เราร่วมมือกับแบรนด์ชั้นนำระดับโลกเพื่อนำเสนอผลิตภัณฑ์ที่เชื่อถือได้และบริการระดับมืออาชีพ
“ใช้เทคโนโลยีเพื่อสร้างโลกอัจฉริยะ” ผู้ให้บริการผลิตภัณฑ์ ICT ที่เชื่อถือได้ของคุณ!



