บ้าน กรณี

IBM เปิดตัว Content-Aware Storage สำหรับเวิร์กโหลด RAG

ผลิตภัณฑ์ทั้งหมด

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค
(179)

Huawei เซิร์ฟเวอร์ฟิวชั่น
(31)

เซิร์ฟเวอร์ Dell Poweredge
(59)

เซิร์ฟเวอร์ H3C
(31)

สวิตช์ ดาต้าคอม
(96)

อุปกรณ์ WLAN
(21)

เราเตอร์ไร้สายอัจฉริยะ
(17)

ฮาร์ดไดรฟ์ HDD
(78)

ฮาร์ดไดรฟ์ภายใน SSD
(16)

การ์ดจอ Geforce
(27)

โปรเซสเซอร์ INTEL CPU
(20)

หน่วยความจำเซิร์ฟเวอร์ RAM
(6)

เซิร์ฟเวอร์จัดเก็บข้อมูลที่ตกแต่งใหม่
(6)

โมดูลตัวรับส่งสัญญาณ SFP
(4)

สวิตช์ช่องสัญญาณไฟเบอร์
(125)

ได้รับการรับรอง

จีน Beijing Qianxing Jietong Technology Co., Ltd. รับรอง

ความคิดเห็นของลูกค้า

พนักงานขายของ Beijing Qianxing Jietong Technology Co. , Ltd เป็นมืออาชีพและอดทนมาก พวกเขาสามารถให้ใบเสนอราคาได้อย่างรวดเร็ว คุณภาพและบรรจุภัณฑ์ของผลิตภัณฑ์ก็ดีมากเช่นกัน ความร่วมมือของเราเป็นไปอย่างราบรื่น

—— 《Festfing DV》 LLC

เมื่อฉันกำลังมองหา Intel CPU และ Toshiba SSD อย่างเร่งด่วน Sandy จาก Beijing Qianxing Jietong Technology Co., Ltd ให้ความช่วยเหลืออย่างมากและได้ผลิตภัณฑ์ที่ฉันต้องการอย่างรวดเร็ว ฉันชื่นชมเธอจริงๆ

—— คิตตี้ เยน

แซนดี้แห่งปักกิ่ง Qianxing Jietong Technology Co. , Ltd เป็นพนักงานขายที่ระมัดระวัง ซึ่งสามารถเตือนฉันถึงข้อผิดพลาดในการกำหนดค่าในเวลาที่ฉันซื้อเซิร์ฟเวอร์ วิศวกรมีความเป็นมืออาชีพมากและสามารถดำเนินการทดสอบให้เสร็จสิ้นได้อย่างรวดเร็ว

—— Strelkin Mikhail Vladimirovich

เรามีความสุขมากกับประสบการณ์การทำงานกับ Beijing Qianxing Jietong คุณภาพของผลิตภัณฑ์ยอดเยี่ยมและการจัดส่งตรงเวลาเสมอ ทีมขายของพวกเขามืออาชีพ อดทน และช่วยเหลือดีมากกับคำถามทั้งหมดของเรา เราขอขอบคุณการสนับสนุนของพวกเขาอย่างแท้จริงและหวังว่าจะได้ร่วมงานกันในระยะยาว แนะนำเป็นอย่างยิ่ง!

—— Ahmad Navid

คุณภาพ: ประสบการณ์ที่ดีกับผู้จําหน่ายของฉัน The MikroTik RB3011 ได้ถูกใช้แล้ว แต่มันอยู่ในสภาพที่ดีมาก และทุกอย่างทํางานอย่างสมบูรณ์แบบ การสื่อสารเร็วและเรียบร้อยและความกังวลทั้งหมดของฉันถูกแก้ไขอย่างรวดเร็วซัพพลายเออร์ที่น่าเชื่อถือมาก แนะนํามาก

—— เจรัน โคเลซิโอ

สนทนาออนไลน์ตอนนี้ฉัน

IBM เปิดตัว Content-Aware Storage สำหรับเวิร์กโหลด RAG

April 24, 2026

IBM ได้เปิดเผยถึงสถาปัตยกรรมการเก็บข้อมูลที่รู้ถึงเนื้อหา (CAS) ที่นําการประมวลผลข้อมูล AI เข้าไปในชั้นการเก็บข้อมูลโดยตรงแนวทางนี้ถูกปรับปรุงสําหรับการฟื้นฟู-เพิ่มการผลิต (RAG)การนําเอกสารเข้าสู่ระบบการเก็บข้อมูลเอง

CAS โอนฟังก์ชัน RAG ที่สําคัญ ลงเติมเอกสาร ผ่านวิธีที่ใช้แบบภาษาขนาดใหญ่ (LLM) ลงในพื้นฐานการเก็บข้อมูลทําให้บริษัทสามารถประมวลผลและอัตราฐานข้อมูลในสถานที่ที่มีอยู่, การสอดคล้องระบบเก็บข้อมูลกับภาระงานที่ขับเคลื่อนโดย AI และลดการเคลื่อนไหวของข้อมูลผ่านระดับพื้นฐานที่แตกต่างกันให้น้อยที่สุดIBM วางตําแหน่งนี้เป็นหนทางในการปรับปรุงการใช้งานโดยปรับปรุงการทํางานและปรับปรุงพื้นที่ของข้อมูลสําหรับแอปพลิเคชั่น AI.

ฐานข้อมูลเวกเตอร์ในขนาด

ใจกลางของการนํามาใช้ CAS ของ IBM อยู่ในฐานข้อมูลเวกเตอร์ที่ปรับปรุงให้กับการค้นหาเชิงสาระทําให้ระบบ AI สามารถค้นหาข้อมูลที่เกี่ยวข้อง โดยใช้เมตรความคล้ายคลึง เช่น ความคล้ายคลึงโคไซน์ หรือระยะทาง L2ความสามารถนี้เป็นพื้นฐานของ RAG โดยการค้นหาของผู้ใช้งานถูกแปลงเป็นเวกเตอร์และตรงกับข้อมูลขององค์กรที่ระดม เพื่อให้คําตอบที่รู้สากล

IBM CAS Chart แหล่งที่มา: IBM

IBM Research ร่วมกับ Samsung และ NVIDIA แสดงระบบต้นแบบที่สามารถปรับขนาดได้ถึง 100 พันล้านเวกเตอร์บนเซอร์เวอร์เดียวระบบได้ผลการเรียกคืนและความแม่นยํามากกว่า 90%ขนาดนี้ตอบสนองกับสภาพแวดล้อมขององค์กรที่ตัวกระจายข้อมูลสามารถครอบคลุมไฟล์หลายพันล้านไฟล์และเมื่ออัคดูรายการเต็มเติบโตเป็นร้อยๆ พันล้านเวกเตอร์.

การบูรณาการท่อ RAG

RAG กําลังกลายเป็นแนวทางที่ได้รับความนิยมสําหรับ AI องค์กร เนื่องจากมันเพิ่มความแม่นยําในการผลิตโดยไม่จําเป็นต้องมีการฝึกซ้อมแบบใหม่มันทํางานโดยการเติมข้อมูลออกด้วยข้อมูลเฉพาะธุรกิจที่นํามาจากฐานข้อมูลเวกเตอร์.

ไพปไลน์เริ่มต้นด้วยการรับข้อมูล โดยการวิเคราะห์เอกสาร เช่น PDF และการนําเสนอ แบ่งเป็นชิ้นๆ และแปลงเป็นการใส่การแทรกซ้อนเหล่านี้ถูกเก็บไว้ในฐานข้อมูลเวกเตอร์ ที่จัดเก็บข้อมูลเพื่อการค้นหาความคล้ายคลึงอย่างมีประสิทธิภาพ. ระหว่างการสอบถาม, การใส่ข้อมูลของผู้ใช้งานถูกฝังและตรงกับเวกเตอร์ที่เก็บไว้, โดยมีเนื้อหาที่เกี่ยวข้องผ่านไปยังรุ่นภาษาเป็นบริบทอุปกรณ์การติดพื้นดินนี้ ลดการหลอนและเพิ่มความไว้วางใจในผลิตที่เกิดจาก AI.

CAS ของ IBM ผสมผสานท่อทั้งหมดนี้โดยตรงเข้าสู่การเก็บข้อมูล โดยรวมการรับข้อมูล, การระบุข้อมูล และการค้นหาข้อมูลที่ใกล้เคียงกับข้อมูล

การแก้ปัญหาเรื่องขนาดและค่าใช้จ่าย

ระบบการเก็บข้อมูลขององค์กรทํางานในระดับเพทาไบทแล้ว เมื่อขยายไปยัง CAS แต่ละไฟล์สามารถสร้างเวกเตอร์หลายร้อยเอกสาร โดยขยายขนาดของข้อมูลอย่างรวดเร็วฐานข้อมูลเวกเตอร์แบบดั้งเดิมมักจะปรับขนาดผ่านเซอร์เวอร์หลายตัว, นํามาซึ่งค่าใช้จ่ายเพิ่มเติมและความซับซ้อนทางการปฏิบัติงาน การระดมและการระดมข้อมูลจํานวนมากยังกลายเป็นภารกิจที่ใช้เวลา

แนวทางของ IBM เน้นการปรับปรุงความหนาแน่นของเวกเตอร์และลดค่าใช้จ่ายในการอินเด็กซ์ เพื่อจํากัดการขยายพื้นฐานทําให้สามารถปรับขนาดทรัพยากรการเก็บข้อมูลและการคํานวณได้อย่างอิสระซึ่งทําให้เป็นไปได้ด้วย IBM Storage Scale และระบบไฟล์ปานกลางที่มีประสิทธิภาพสูง

อุปกรณ์ออมสินและอาร์คิทคัตช์ฮาร์ดแวร์

การดําเนินงาน CAS ใช้ IBM Storage Scale System 6000 (ESS 6000) เป็นแพลตฟอร์มที่ใช้ Flash ทั้งหมดที่ออกแบบมาเพื่อ AI และภาระงานที่มีประสิทธิภาพสูงระบบรองรับการขับเคลื่อน NVMe สูงสุด 48 หน่วยต่อกล่อง 4U, ด้วยความจุของไดรฟ์แต่ละตัวตั้งแต่ 7 TB ถึง 60 TB. มันรวมการเชื่อมต่อ PCIe Gen5, 400 Gb InfiniBand หรือ 200 Gb Ethernetให้ความเร็วในการอ่าน 340 GB/s และการเขียน 175 GB/s ต่อหน่วยรวมถึง 7 ล้าน IOPS

แพลตฟอร์มยังรองรับ NVIDIA GPUDirect Storage ทําให้สามารถใช้เส้นทางข้อมูลโดยตรงระหว่างการเก็บข้อมูลและ GPU รวมถึง BlueField-3 DPU เพื่อลดภาระงานด้านเครือข่ายและการประมวลผลข้อมูล

SSDs Samsung PM9D3a PCIe Gen5 NVMe ให้ความจุสูงและความหนาแน่นสูงมีความเร็วในการอ่านเรียงลําดับสูงสุด 12 GB/s และความเร็วในการเขียนสูงสุด 6.8 GB/s การใช้ SSD องค์กรที่มีในตลาดทําให้สถาปัตยกรรมสามารถปรับขนาดได้โดยใช้ส่วนประกอบมาตรฐาน

การระดมเรียงลําดับและการเร่ง GPU

เพื่อจัดการกับการระดมข้อมูลในขนาดใหญ่ IBM ได้พัฒนารุ่นการระดมข้อมูลแบบเรียงลําดับ ซึ่งประกอบด้วยอัตราการระดมข้อมูลส่วนย่อยหลายอันที่สามารถปรับปรุงได้อย่างอิสระโครงสร้างนี้ทําให้การอัพเดทเพิ่มเติมและการอัตราฐานใหม่ในท้องถิ่นได้โดยไม่ต้องขัดขวางข้อมูลทั้งหมด, ปรับปรุงความพร้อมและประสิทธิภาพการดําเนินงาน

การเร่ง GPU ลดเวลาการอัตราฐานลงอย่างมากเมื่อเทียบกับวิธีการ CPU เท่านั้น งานที่ใช้เวลาหลายชั่วโมงบน CPU สามารถทําสําเร็จภายในไม่กี่นาทีโดยใช้ GPU ของ NVIDIAการสร้างดัชนีสําหรับ 100 พันล้านเวกเตอร์ ใช้เวลา 4 วัน กับ 6 NVIDIA H200 GPUเมื่อเทียบกับการประมาณ 120 วันบนระบบ CPU สองซ็อต

เซตข้อมูลทั้งหมด รวมถึงเวกเตอร์และดัชนี ใช้เวลาในการเก็บข้อมูลประมาณ 153 TiB การลากข้อมูลและการแบ่งแยกครั้งแรกใช้เวลา 9 วันระบบที่เกิดขึ้นได้ ส่งผลให้มีอัตราความช้าในการสอบถามเฉลี่ย 694ms กับการเรียกคืน 90%, ได้รับการรับรองจากการคํานวณความจริงของแรงโหด

แผนการเดินทาง

IBM และ NVIDIA ยังคงปรับปรุงแพลตฟอร์มโดยเน้นการลดความช้าในการอัตราฐานและการสอบถามการลดเวลาในการรับข้อมูลจาก 9 วัน เป็น 1 วัน, และลดความช้าในการสอบถามให้อยู่ในช่วง 50-100 มิลลิสekunth โดยยังคงการเรียกคืน 90 เปอร์เซ็นต์

การบูรณาการการระบุเวกเตอร์ในระบบไฟล์มาตรฐานมีเป้าหมายที่จะทําให้การจัดจําหน่ายง่ายขึ้นและลดอุปสรรคต่อการนํา AI มาใช้ในองค์กรIBM กําลังวางตําแหน่ง CAS เป็นชั้นพื้นฐานสําหรับพื้นฐานที่ใช้ AI.

บริษัท เทคโนโลยีจีเทงจี (Beijing Qianxing Jietong Technology Co., Ltd.)
แซนดี้ แยง (Sandy Yang) ผู้อํานวยการยุทธศาสตร์โลก
วอทแอป / เวชแชท: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
เน้นธุรกิจ:
การจัดจําหน่ายสินค้า ICT/การบูรณาการระบบและบริการ/การแก้ไขพื้นฐาน
ด้วยประสบการณ์การจําหน่ายไอที 20 ปีขึ้นไป เราร่วมมือกับแบรนด์ชั้นนําระดับโลก เพื่อให้ผลิตภัณฑ์ที่น่าเชื่อถือและบริการมืออาชีพ
การใช้เทคโนโลยีเพื่อสร้างโลกที่ฉลาด ผู้ให้บริการสินค้า ICT ที่คุณไว้วางใจ

PREV: Dell PowerMaxOS 10.4 ประกอบด้วยการเพิ่มประสิทธิภาพ การขยายความแข็งแกร่งทางไซเบอร์ และการบูรณาการแอพสมัยใหม่

NEXT: NetApp ขยายการผสานรวม Google Cloud เพื่อปรับปรุงข้อมูลองค์กรสำหรับ AI

รายละเอียดการติดต่อ

Beijing Qianxing Jietong Technology Co., Ltd.

ผู้ติดต่อ: Ms. Sandy Yang

โทร: 13426366826

IBM เปิดตัว Content-Aware Storage สำหรับเวิร์กโหลด RAG

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค

Huawei เซิร์ฟเวอร์ฟิวชั่น

เซิร์ฟเวอร์ Dell Poweredge

เซิร์ฟเวอร์ H3C

สวิตช์ ดาต้าคอม

อุปกรณ์ WLAN

เราเตอร์ไร้สายอัจฉริยะ

ฮาร์ดไดรฟ์ HDD

ฮาร์ดไดรฟ์ภายใน SSD

การ์ดจอ Geforce

โปรเซสเซอร์ INTEL CPU

หน่วยความจำเซิร์ฟเวอร์ RAM

เซิร์ฟเวอร์จัดเก็บข้อมูลที่ตกแต่งใหม่

โมดูลตัวรับส่งสัญญาณ SFP

สวิตช์ช่องสัญญาณไฟเบอร์

IBM เปิดตัว Content-Aware Storage สำหรับเวิร์กโหลด RAG

ฐานข้อมูลเวกเตอร์ในขนาด

การบูรณาการท่อ RAG

การแก้ปัญหาเรื่องขนาดและค่าใช้จ่าย

อุปกรณ์ออมสินและอาร์คิทคัตช์ฮาร์ดแวร์

การระดมเรียงลําดับและการเร่ง GPU

แผนการเดินทาง

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค

12 Bays 1U ที่วางแร็ค Server Lenovo ThinkSystem SR630 ชั้นวาง Server

Think System SR250 V2 4SFF เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค Intel Xeon E-2378G Processor

เซิร์ฟเวอร์จัดเก็บข้อมูลแร็ค Intel C621A Inspur NF5180M6 1U ชั้นวาง Mount Server

Huawei เซิร์ฟเวอร์ฟิวชั่น

เซิร์ฟเวอร์ฟิวชั่น 5288 V6 4U แร็คเซิร์ฟเวอร์ 32 DDR4 DIMM 44 ฮาร์ดดิสก์ 3.5 นิ้ว

เซิร์ฟเวอร์จัดเก็บข้อมูลเครือข่าย Huawei Fusion 1U ความหนาแน่นสูงพิเศษ 1288H V5

ใหม่ Gen OceanStor 5310 Huawei ชั้นวาง Server Hybrid Flash Storage