logo
บ้าน กรณี

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

ได้รับการรับรอง
จีน Beijing Qianxing Jietong Technology Co., Ltd. รับรอง
จีน Beijing Qianxing Jietong Technology Co., Ltd. รับรอง
ความคิดเห็นของลูกค้า
พนักงานขายของ Beijing Qianxing Jietong Technology Co. , Ltd เป็นมืออาชีพและอดทนมาก พวกเขาสามารถให้ใบเสนอราคาได้อย่างรวดเร็ว คุณภาพและบรรจุภัณฑ์ของผลิตภัณฑ์ก็ดีมากเช่นกัน ความร่วมมือของเราเป็นไปอย่างราบรื่น

—— 《Festfing DV》 LLC

เมื่อฉันกำลังมองหา Intel CPU และ Toshiba SSD อย่างเร่งด่วน Sandy จาก Beijing Qianxing Jietong Technology Co., Ltd ให้ความช่วยเหลืออย่างมากและได้ผลิตภัณฑ์ที่ฉันต้องการอย่างรวดเร็ว ฉันชื่นชมเธอจริงๆ

—— คิตตี้ เยน

แซนดี้แห่งปักกิ่ง Qianxing Jietong Technology Co. , Ltd เป็นพนักงานขายที่ระมัดระวัง ซึ่งสามารถเตือนฉันถึงข้อผิดพลาดในการกำหนดค่าในเวลาที่ฉันซื้อเซิร์ฟเวอร์ วิศวกรมีความเป็นมืออาชีพมากและสามารถดำเนินการทดสอบให้เสร็จสิ้นได้อย่างรวดเร็ว

—— Strelkin Mikhail Vladimirovich

เรามีความสุขมากกับประสบการณ์การทำงานกับ Beijing Qianxing Jietong คุณภาพของผลิตภัณฑ์ยอดเยี่ยมและการจัดส่งตรงเวลาเสมอ ทีมขายของพวกเขามืออาชีพ อดทน และช่วยเหลือดีมากกับคำถามทั้งหมดของเรา เราขอขอบคุณการสนับสนุนของพวกเขาอย่างแท้จริงและหวังว่าจะได้ร่วมงานกันในระยะยาว แนะนำเป็นอย่างยิ่ง!

—— Ahmad Navid

คุณภาพ: ประสบการณ์ที่ดีกับผู้จําหน่ายของฉัน The MikroTik RB3011 ได้ถูกใช้แล้ว แต่มันอยู่ในสภาพที่ดีมาก และทุกอย่างทํางานอย่างสมบูรณ์แบบ การสื่อสารเร็วและเรียบร้อยและความกังวลทั้งหมดของฉันถูกแก้ไขอย่างรวดเร็วซัพพลายเออร์ที่น่าเชื่อถือมาก แนะนํามาก

—— เจรัน โคเลซิโอ

สนทนาออนไลน์ตอนนี้ฉัน

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

April 10, 2026
WEKA ประกาศการบูรณาการของแพลตฟอร์ม NeuralMesh กับสถาปัตยกรรมอ้างอิง NVIDIA STXที่จัดตั้งเครือข่ายความทรงจําที่ขยายขนาดเป็นก้อนก้อนสําคัญของโครงสร้างพื้นฐาน AI รุ่นต่อไปการแก้ไขที่รวมกันแก้ไขข้อจํากัดที่สําคัญที่สุดในสภาพแวดล้อมการสรุปขนาดใหญ่: ข้อจํากัดความจําที่ส่งผลกระทบต่อผลงานโดยตรง ค่าครบวงจรของเจ้าของและการเติบโตที่ปรับขนาดได้.

การทํางานผ่าน NeuralMesh, WEKA's Augmented Memory Grid ขยายความทรงจํา GPU โดยการส่งออกและรักษา key-value caches. เมื่อใช้กับ NVIDIA STX,สถาปัตยกรรมนี้ให้ความสามารถในการเก็บความทรงจําในแวดล้อมที่มีความเร็วสูง สําหรับหน่วยงาน AI, สนับสนุนการพิจารณาในแวดล้อมยาวข้ามการประชุม, เครื่องมือ, และการทํางานปลายไปปลาย.และ Spectrum-X Ethernet สามารถขยายความเร็วของเทคโนโลยีความทรงจํา 4x ถึง 10xแพลตฟอร์มนี้ยังคาดว่าจะให้ความสามารถในการอ่านอย่างน้อย 320 GB / s และ 150 GB / s การเขียน, มากกว่าสองเท่าของผลงานของสถาปัตยกรรมที่เก็บของ AI แบบดั้งเดิม.

กรณี บริษัท ล่าสุดเกี่ยวกับ WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI  0

โครงสร้างความทรงจํา กลายเป็นอุปสรรคการสรุป


WEKA ศูนย์รวมการบูรณาการนี้บนความท้าทายที่เพิ่มขึ้นของผนังความจําในการจัดจําหน่าย AI ที่ทันสมัยส่งผลให้มีการคํานวณใหม่ซ้ําๆ และลดประสิทธิภาพการดําเนินงานเมื่อการร่วมกันของระบบเพิ่มขึ้น ความไม่ประสิทธิภาพเหล่านี้เพิ่มขึ้นหลายเท่า เพิ่มต้นทุนโครงสร้างพื้นฐานและลดการคาดการณ์ผลงาน

บริษัทส่งเสริมโครงสร้างพื้นฐานแคช KV ที่แบ่งปันเป็นทางออก โดยการอนุรักษ์สภาพแวดล้อมที่คงอยู่ระหว่างผู้ใช้งานและการประชุมการแชร์แคชจะกําจัดการประมวลผลที่ไม่จําเป็น และทําให้การทํางานของท็อคเกนคงที่NVIDIA STX ให้สถาปัตยกรรมอ้างอิงที่ได้รับการรับรองสําหรับรุ่นนี้, ในขณะที่ WEKA ให้ชั้นการเก็บและการขยายความจํา.

NeuralMesh และอาร์คิเทคชั่นกรีดความจําที่ขยาย


NeuralMesh ทําหน้าที่เป็นแพลตฟอร์มการเก็บข้อมูลกระจายของ WEKA® สร้างขึ้นเพื่อบูรณาการได้อย่างต่อเนื่องใน NVIDIA STX สเตคเต็มขณะที่ Augmented Memory Grid ใช้เป็นชั้นขยายความจําที่มอบหมายที่รวม KV cache นอกความจํา GPU.

การออกแบบนี้ทําให้สภาพแวดล้อมการสรุปสามารถดําเนินการในช่วงเวลานานโดยไม่ต้องอ้วนทรัพยากร GPU โดยการรักษาภาวะแคชและทําให้การใช้งานใหม่ผ่านภาระงานแพลตฟอร์มบํารุงการใช้งานที่สูงและผลงานที่คงที่ในขณะที่การจัดจําหน่ายขนาด.

WEKA ระบุว่า Augmented Memory Grid ที่เปิดตัวครั้งแรกที่ GTC 2025 และตอนนี้มีให้บริการทั่วไป ได้รับการรับรองบน NVIDIA Grace CPU platforms ที่คู่กับ BlueField DPUsสถาปัตยกรรมนํามาซึ่งผลประโยชน์ที่สามารถวัดได้ในประสิทธิภาพการสรุป, รวมถึงการใช้เวลาที่เร็วขึ้นในครั้งแรกของท็อคเกน, ความสามารถในการใช้งานของท็อคเกนต่อ GPU ที่สูงขึ้น, และการทํางานที่มั่นคงภายใต้ความพร้อมที่เพิ่มขึ้นการอํานวยการเส้นทางข้อมูลไปยัง BlueField-4 ยังลดค่าใช้จ่าย CPU และบรรเทาปัญหา I/O.

ผลงานและประสิทธิภาพเพิ่มขึ้น


ในสภาพแวดล้อมที่คล้ายกับการผลิต แพลตฟอร์มถูกออกแบบเพื่อเพิ่มความสามารถในการตอบสนองและประสิทธิภาพของพื้นฐานWEKA ระบุว่า Augmented Memory Grid สามารถลดเวลาถึงท็อคเกนครั้งแรกได้ 4x ถึง 20xการปรับปรุงเหล่านี้มาจากอัตราการพบของแคช KV ที่สูงขึ้นและวงจรการคํานวณใหม่ที่น้อยลงทําให้ระบบสามารถรักษาการทํางานได้ เมื่อขนาดสภาพแวดล้อมและจํานวนผู้ใช้เพิ่ม.

Firmus ผู้ให้บริการโครงสร้างพื้นฐาน AI ได้ถูกยกย่องว่าเป็นผู้ใช้ NeuralMesh อย่างรวดเร็ว ด้วยโครงสร้างพื้นฐานที่ใช้ NVIDIA,ด้วยผลประโยชน์ที่มาจากการใช้งาน GPU ที่มีอยู่ได้อย่างมีประสิทธิภาพมากกว่าการนํา Hardware เพิ่มเติมมาใช้งาน

ผลลัพธ์สําหรับการออกแบบพื้นฐาน AI


การบูรณาการนี้เน้นการเปลี่ยนแปลงในการออกแบบระบบ AI โดยที่กลยุทธ์ความจําและการเก็บข้อมูลจะกําหนดผลงานรวมและประสิทธิภาพในราคามากขึ้นในขณะที่ภาระงานของตัวแทน AI เติบโตและหน้าต่างปัจจุบันขยาย, แนวทาง DRAM เท่านั้นจะกลายเป็นไม่ยั่งยืน เนื่องจากค่าใช้จ่ายการคํานวณใหม่ที่เพิ่มขึ้นและ GPU ที่ใช้งานน้อย

WEKA วางตําแหน่งการแชช KV ที่คงอยู่และแบ่งปันเป็นความสามารถพื้นฐานสําหรับโรงงาน AI องค์กรที่นํารุ่นนี้มาใช้งานสามารถบรรลุการใช้งาน GPU ที่สูงขึ้นการบริโภคพลังงานที่ต่ํากว่าต่องานสรุป, และการปรับขนาดที่สามารถคาดการณ์ได้มากขึ้น โดยตรงกันข้าม, สิ่งแวดล้อมที่พึ่งพาเฉพาะบนความจํา GPU ท้องถิ่นอาจต้องเผชิญกับค่าใช้จ่ายในการดําเนินงานที่เพิ่มขึ้นและผลตอบแทนที่ลดลงเมื่อภาระงานเพิ่มขึ้น

บริษัท เทคโนโลยีจีเทงจี (Beijing Qianxing Jietong Technology Co., Ltd.)
แซนดี้ แยง (Sandy Yang) ผู้อํานวยการยุทธศาสตร์โลก
วอทแอป / เวชแชท: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
เน้นธุรกิจ:
การจัดจําหน่ายสินค้า ICT/การบูรณาการระบบและบริการ/การแก้ไขพื้นฐาน
ด้วยประสบการณ์การจําหน่ายไอที 20 ปีขึ้นไป เราร่วมมือกับแบรนด์ชั้นนําระดับโลก เพื่อให้ผลิตภัณฑ์ที่น่าเชื่อถือและบริการมืออาชีพ
การใช้เทคโนโลยีเพื่อสร้างโลกที่ฉลาด ผู้ให้บริการสินค้า ICT ที่คุณไว้วางใจ
รายละเอียดการติดต่อ
Beijing Qianxing Jietong Technology Co., Ltd.

ผู้ติดต่อ: Ms. Sandy Yang

โทร: 13426366826

ส่งคำถามของคุณกับเราโดยตรง (0 / 3000)