บ้าน กรณี

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

ผลิตภัณฑ์ทั้งหมด

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค
(179)

Huawei เซิร์ฟเวอร์ฟิวชั่น
(31)

เซิร์ฟเวอร์ Dell Poweredge
(59)

เซิร์ฟเวอร์ H3C
(31)

สวิตช์ ดาต้าคอม
(96)

อุปกรณ์ WLAN
(21)

เราเตอร์ไร้สายอัจฉริยะ
(17)

ฮาร์ดไดรฟ์ HDD
(78)

ฮาร์ดไดรฟ์ภายใน SSD
(16)

การ์ดจอ Geforce
(27)

โปรเซสเซอร์ INTEL CPU
(20)

หน่วยความจำเซิร์ฟเวอร์ RAM
(6)

เซิร์ฟเวอร์จัดเก็บข้อมูลที่ตกแต่งใหม่
(6)

โมดูลตัวรับส่งสัญญาณ SFP
(4)

สวิตช์ช่องสัญญาณไฟเบอร์
(125)

ได้รับการรับรอง

จีน Beijing Qianxing Jietong Technology Co., Ltd. รับรอง

ความคิดเห็นของลูกค้า

พนักงานขายของ Beijing Qianxing Jietong Technology Co. , Ltd เป็นมืออาชีพและอดทนมาก พวกเขาสามารถให้ใบเสนอราคาได้อย่างรวดเร็ว คุณภาพและบรรจุภัณฑ์ของผลิตภัณฑ์ก็ดีมากเช่นกัน ความร่วมมือของเราเป็นไปอย่างราบรื่น

—— 《Festfing DV》 LLC

เมื่อฉันกำลังมองหา Intel CPU และ Toshiba SSD อย่างเร่งด่วน Sandy จาก Beijing Qianxing Jietong Technology Co., Ltd ให้ความช่วยเหลืออย่างมากและได้ผลิตภัณฑ์ที่ฉันต้องการอย่างรวดเร็ว ฉันชื่นชมเธอจริงๆ

—— คิตตี้ เยน

แซนดี้แห่งปักกิ่ง Qianxing Jietong Technology Co. , Ltd เป็นพนักงานขายที่ระมัดระวัง ซึ่งสามารถเตือนฉันถึงข้อผิดพลาดในการกำหนดค่าในเวลาที่ฉันซื้อเซิร์ฟเวอร์ วิศวกรมีความเป็นมืออาชีพมากและสามารถดำเนินการทดสอบให้เสร็จสิ้นได้อย่างรวดเร็ว

—— Strelkin Mikhail Vladimirovich

เรามีความสุขมากกับประสบการณ์การทำงานกับ Beijing Qianxing Jietong คุณภาพของผลิตภัณฑ์ยอดเยี่ยมและการจัดส่งตรงเวลาเสมอ ทีมขายของพวกเขามืออาชีพ อดทน และช่วยเหลือดีมากกับคำถามทั้งหมดของเรา เราขอขอบคุณการสนับสนุนของพวกเขาอย่างแท้จริงและหวังว่าจะได้ร่วมงานกันในระยะยาว แนะนำเป็นอย่างยิ่ง!

—— Ahmad Navid

คุณภาพ: ประสบการณ์ที่ดีกับผู้จําหน่ายของฉัน The MikroTik RB3011 ได้ถูกใช้แล้ว แต่มันอยู่ในสภาพที่ดีมาก และทุกอย่างทํางานอย่างสมบูรณ์แบบ การสื่อสารเร็วและเรียบร้อยและความกังวลทั้งหมดของฉันถูกแก้ไขอย่างรวดเร็วซัพพลายเออร์ที่น่าเชื่อถือมาก แนะนํามาก

—— เจรัน โคเลซิโอ

สนทนาออนไลน์ตอนนี้ฉัน

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

April 10, 2026

WEKA ประกาศการบูรณาการของแพลตฟอร์ม NeuralMesh กับสถาปัตยกรรมอ้างอิง NVIDIA STXที่จัดตั้งเครือข่ายความทรงจําที่ขยายขนาดเป็นก้อนก้อนสําคัญของโครงสร้างพื้นฐาน AI รุ่นต่อไปการแก้ไขที่รวมกันแก้ไขข้อจํากัดที่สําคัญที่สุดในสภาพแวดล้อมการสรุปขนาดใหญ่: ข้อจํากัดความจําที่ส่งผลกระทบต่อผลงานโดยตรง ค่าครบวงจรของเจ้าของและการเติบโตที่ปรับขนาดได้.

การทํางานผ่าน NeuralMesh, WEKA's Augmented Memory Grid ขยายความทรงจํา GPU โดยการส่งออกและรักษา key-value caches. เมื่อใช้กับ NVIDIA STX,สถาปัตยกรรมนี้ให้ความสามารถในการเก็บความทรงจําในแวดล้อมที่มีความเร็วสูง สําหรับหน่วยงาน AI, สนับสนุนการพิจารณาในแวดล้อมยาวข้ามการประชุม, เครื่องมือ, และการทํางานปลายไปปลาย.และ Spectrum-X Ethernet สามารถขยายความเร็วของเทคโนโลยีความทรงจํา 4x ถึง 10xแพลตฟอร์มนี้ยังคาดว่าจะให้ความสามารถในการอ่านอย่างน้อย 320 GB / s และ 150 GB / s การเขียน, มากกว่าสองเท่าของผลงานของสถาปัตยกรรมที่เก็บของ AI แบบดั้งเดิม.

โครงสร้างความทรงจํา กลายเป็นอุปสรรคการสรุป

WEKA ศูนย์รวมการบูรณาการนี้บนความท้าทายที่เพิ่มขึ้นของผนังความจําในการจัดจําหน่าย AI ที่ทันสมัยส่งผลให้มีการคํานวณใหม่ซ้ําๆ และลดประสิทธิภาพการดําเนินงานเมื่อการร่วมกันของระบบเพิ่มขึ้น ความไม่ประสิทธิภาพเหล่านี้เพิ่มขึ้นหลายเท่า เพิ่มต้นทุนโครงสร้างพื้นฐานและลดการคาดการณ์ผลงาน

บริษัทส่งเสริมโครงสร้างพื้นฐานแคช KV ที่แบ่งปันเป็นทางออก โดยการอนุรักษ์สภาพแวดล้อมที่คงอยู่ระหว่างผู้ใช้งานและการประชุมการแชร์แคชจะกําจัดการประมวลผลที่ไม่จําเป็น และทําให้การทํางานของท็อคเกนคงที่NVIDIA STX ให้สถาปัตยกรรมอ้างอิงที่ได้รับการรับรองสําหรับรุ่นนี้, ในขณะที่ WEKA ให้ชั้นการเก็บและการขยายความจํา.

NeuralMesh และอาร์คิเทคชั่นกรีดความจําที่ขยาย

NeuralMesh ทําหน้าที่เป็นแพลตฟอร์มการเก็บข้อมูลกระจายของ WEKA® สร้างขึ้นเพื่อบูรณาการได้อย่างต่อเนื่องใน NVIDIA STX สเตคเต็มขณะที่ Augmented Memory Grid ใช้เป็นชั้นขยายความจําที่มอบหมายที่รวม KV cache นอกความจํา GPU.

การออกแบบนี้ทําให้สภาพแวดล้อมการสรุปสามารถดําเนินการในช่วงเวลานานโดยไม่ต้องอ้วนทรัพยากร GPU โดยการรักษาภาวะแคชและทําให้การใช้งานใหม่ผ่านภาระงานแพลตฟอร์มบํารุงการใช้งานที่สูงและผลงานที่คงที่ในขณะที่การจัดจําหน่ายขนาด.

WEKA ระบุว่า Augmented Memory Grid ที่เปิดตัวครั้งแรกที่ GTC 2025 และตอนนี้มีให้บริการทั่วไป ได้รับการรับรองบน NVIDIA Grace CPU platforms ที่คู่กับ BlueField DPUsสถาปัตยกรรมนํามาซึ่งผลประโยชน์ที่สามารถวัดได้ในประสิทธิภาพการสรุป, รวมถึงการใช้เวลาที่เร็วขึ้นในครั้งแรกของท็อคเกน, ความสามารถในการใช้งานของท็อคเกนต่อ GPU ที่สูงขึ้น, และการทํางานที่มั่นคงภายใต้ความพร้อมที่เพิ่มขึ้นการอํานวยการเส้นทางข้อมูลไปยัง BlueField-4 ยังลดค่าใช้จ่าย CPU และบรรเทาปัญหา I/O.

ผลงานและประสิทธิภาพเพิ่มขึ้น

ในสภาพแวดล้อมที่คล้ายกับการผลิต แพลตฟอร์มถูกออกแบบเพื่อเพิ่มความสามารถในการตอบสนองและประสิทธิภาพของพื้นฐานWEKA ระบุว่า Augmented Memory Grid สามารถลดเวลาถึงท็อคเกนครั้งแรกได้ 4x ถึง 20xการปรับปรุงเหล่านี้มาจากอัตราการพบของแคช KV ที่สูงขึ้นและวงจรการคํานวณใหม่ที่น้อยลงทําให้ระบบสามารถรักษาการทํางานได้ เมื่อขนาดสภาพแวดล้อมและจํานวนผู้ใช้เพิ่ม.

Firmus ผู้ให้บริการโครงสร้างพื้นฐาน AI ได้ถูกยกย่องว่าเป็นผู้ใช้ NeuralMesh อย่างรวดเร็ว ด้วยโครงสร้างพื้นฐานที่ใช้ NVIDIA,ด้วยผลประโยชน์ที่มาจากการใช้งาน GPU ที่มีอยู่ได้อย่างมีประสิทธิภาพมากกว่าการนํา Hardware เพิ่มเติมมาใช้งาน

ผลลัพธ์สําหรับการออกแบบพื้นฐาน AI

การบูรณาการนี้เน้นการเปลี่ยนแปลงในการออกแบบระบบ AI โดยที่กลยุทธ์ความจําและการเก็บข้อมูลจะกําหนดผลงานรวมและประสิทธิภาพในราคามากขึ้นในขณะที่ภาระงานของตัวแทน AI เติบโตและหน้าต่างปัจจุบันขยาย, แนวทาง DRAM เท่านั้นจะกลายเป็นไม่ยั่งยืน เนื่องจากค่าใช้จ่ายการคํานวณใหม่ที่เพิ่มขึ้นและ GPU ที่ใช้งานน้อย

WEKA วางตําแหน่งการแชช KV ที่คงอยู่และแบ่งปันเป็นความสามารถพื้นฐานสําหรับโรงงาน AI องค์กรที่นํารุ่นนี้มาใช้งานสามารถบรรลุการใช้งาน GPU ที่สูงขึ้นการบริโภคพลังงานที่ต่ํากว่าต่องานสรุป, และการปรับขนาดที่สามารถคาดการณ์ได้มากขึ้น โดยตรงกันข้าม, สิ่งแวดล้อมที่พึ่งพาเฉพาะบนความจํา GPU ท้องถิ่นอาจต้องเผชิญกับค่าใช้จ่ายในการดําเนินงานที่เพิ่มขึ้นและผลตอบแทนที่ลดลงเมื่อภาระงานเพิ่มขึ้น

บริษัท เทคโนโลยีจีเทงจี (Beijing Qianxing Jietong Technology Co., Ltd.)
แซนดี้ แยง (Sandy Yang) ผู้อํานวยการยุทธศาสตร์โลก
วอทแอป / เวชแชท: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
เน้นธุรกิจ:
การจัดจําหน่ายสินค้า ICT/การบูรณาการระบบและบริการ/การแก้ไขพื้นฐาน
ด้วยประสบการณ์การจําหน่ายไอที 20 ปีขึ้นไป เราร่วมมือกับแบรนด์ชั้นนําระดับโลก เพื่อให้ผลิตภัณฑ์ที่น่าเชื่อถือและบริการมืออาชีพ
การใช้เทคโนโลยีเพื่อสร้างโลกที่ฉลาด ผู้ให้บริการสินค้า ICT ที่คุณไว้วางใจ

PREV: HP ขยายกลุ่มผลิตภัณฑ์ Z Workstation ด้วยระบบใหม่สำหรับ AI, การทำงานแบบเคลื่อนที่ และ Hybrid IT

NEXT: Veeam เปิดตัวเซิร์ฟเวอร์ MCP แบบโอเพนซอร์สสำหรับข้อมูลสำรองและการกู้คืน

รายละเอียดการติดต่อ

Beijing Qianxing Jietong Technology Co., Ltd.

ผู้ติดต่อ: Ms. Sandy Yang

โทร: 13426366826

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค

Huawei เซิร์ฟเวอร์ฟิวชั่น

เซิร์ฟเวอร์ Dell Poweredge

เซิร์ฟเวอร์ H3C

สวิตช์ ดาต้าคอม

อุปกรณ์ WLAN

เราเตอร์ไร้สายอัจฉริยะ

ฮาร์ดไดรฟ์ HDD

ฮาร์ดไดรฟ์ภายใน SSD

การ์ดจอ Geforce

โปรเซสเซอร์ INTEL CPU

หน่วยความจำเซิร์ฟเวอร์ RAM

เซิร์ฟเวอร์จัดเก็บข้อมูลที่ตกแต่งใหม่

โมดูลตัวรับส่งสัญญาณ SFP

สวิตช์ช่องสัญญาณไฟเบอร์

WEKA ผสานรวม NeuralMesh เข้ากับ NVIDIA STX เพื่อแก้ไขปัญหาคอขวดหน่วยความจำในการอนุมาน AI

โครงสร้างความทรงจํา กลายเป็นอุปสรรคการสรุป

NeuralMesh และอาร์คิเทคชั่นกรีดความจําที่ขยาย

ผลงานและประสิทธิภาพเพิ่มขึ้น

ผลลัพธ์สําหรับการออกแบบพื้นฐาน AI

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค

12 Bays 1U ที่วางแร็ค Server Lenovo ThinkSystem SR630 ชั้นวาง Server

Think System SR250 V2 4SFF เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค Intel Xeon E-2378G Processor

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค Intel C621A Inspur NF5180M6 1U ชั้นวาง Mount Server

Huawei เซิร์ฟเวอร์ฟิวชั่น

เซิร์ฟเวอร์ฟิวชั่น 5288 V6 4U แร็คเซิร์ฟเวอร์ 32 DDR4 DIMM 44 ฮาร์ดดิสก์ 3.5 นิ้ว

เซิร์ฟเวอร์จัดเก็บข้อมูลเครือข่าย Huawei Fusion 1U ความหนาแน่นสูงพิเศษ 1288H V5

ใหม่ Gen OceanStor 5310 Huawei ชั้นวาง Server Hybrid Flash Storage