Qdrant ผู้ให้บริการโซลูชันการค้นหาเวกเตอร์และฐานข้อมูลแบบผสมได้ ได้เปิดตัวประสิทธิภาพการจัดทำดัชนีที่อัปเกรดแล้ว กลไกการเฟลโอเวอร์คลัสเตอร์แบบสามโซน และฟีเจอร์การบันทึกการตรวจสอบที่เน้นการปฏิบัติตามข้อกำหนด
บริษัทพัฒนาฐานข้อมูลเวกเตอร์แบบสแตนด์อโลนสำหรับจัดเก็บการฝังที่จำเป็นสำหรับโมเดลภาษาขนาดใหญ่ (LLM) และเอเจนต์ AI อัตโนมัติ ซึ่งโดยทั่วไปขับเคลื่อนเวิร์กโฟลว์การอนุมาน AI เช่น การดึงข้อมูล-Augmented Generation (RAG) จากข้อมูลของ Qdrant ทีมจัดซื้อระดับองค์กรจะประเมินเครื่องมือค้นหาเวกเตอร์โดยอิงตามเกณฑ์หลักสามประการเสมอ ได้แก่ ความสามารถในการปรับขนาดสำหรับปริมาณงานที่เพิ่มขึ้น ความต่อเนื่องของบริการท่ามกลางความล้มเหลวของโครงสร้างพื้นฐาน และการตรวจสอบการปฏิบัติงานที่ติดตามได้
André Zayarni ผู้ร่วมก่อตั้งและซีอีโอของ Qdrant ให้ความเห็นว่า “GPU ไม่ได้จำกัดอยู่ที่การอนุมานโมเดลอีกต่อไป แต่ยังเพิ่มประสิทธิภาพการจัดทำดัชนีข้อมูล เราได้เปิดใช้งานการสร้าง HNSW ที่เร่งด้วย GPU ในเวอร์ชันโอเพ่นซอร์สของเราตั้งแต่ v1.13 และความสามารถนี้ขณะนี้พร้อมใช้งานอย่างเป็นทางการบน Qdrant Cloud เมื่อรวมกับการจำลองแบบหลาย AZ และการบันทึกการตรวจสอบ ชุดโปรแกรมแบบผสานรวมช่วยให้องค์กรต่างๆ สามารถปรับใช้ Qdrant สำหรับปริมาณงานการผลิตที่สำคัญ”
การอัพเกรดผลิตภัณฑ์ล่าสุดของ Qdrant ครอบคลุมการปรับปรุงหลักสามประการ:
การจัดทำดัชนีที่เร่งด้วย GPU: การทดสอบเกณฑ์มาตรฐานยืนยันว่า GPU เฉพาะเพิ่มความเร็วการสร้างดัชนี HNSW สูงสุดสี่เท่าบน Qdrant Cloud ผู้ใช้สามารถติดตั้งทรัพยากร GPU ไปยังคลัสเตอร์ที่มีอยู่เพื่อจัดการกับการจัดทำดัชนีที่มีความเข้มสูงได้อย่างมีประสิทธิภาพ
คลัสเตอร์ Multi-Availability Zone (AZ): กลไกการจำลองแบบข้าม AZ จะทำซ้ำข้อมูลในโซนความพร้อมใช้งานสามโซนในภูมิภาคเดียว ช่วยขจัดเวลาแฝงเมื่อเกิดข้อผิดพลาดด้วยตนเอง ทำให้มั่นใจได้ว่าการดำเนินการอ่านและเขียนจะไม่หยุดชะงัก แม้ว่า Availability Zone หนึ่งจะประสบปัญหาไฟดับก็ตาม
การบันทึกการตรวจสอบ: ฟังก์ชันจะบันทึกการดำเนินการที่ใช้ API ทั้งหมด รวมถึงการสืบค้นข้อมูล การอัปโหลด การลบ การจัดการคอลเลกชัน และงานสแน็ปช็อต รายการบันทึกแต่ละรายการใช้รูปแบบ JSON ที่มีโครงสร้าง ซึ่งระบุตัวตนผู้ใช้ คีย์ API การประทับเวลา คอลเลกชันเป้าหมาย และสถานะการอนุญาตการดำเนินการ เมื่อระบบอัตโนมัติดำเนินงานตามข้อมูลที่ดึงมา บันทึกจะนำเสนอแนวทางการตรวจสอบที่ชัดเจนสำหรับแหล่งที่มาของคำขอ เวลาดำเนินการ และความถูกต้องตามกฎหมายในการเข้าถึง ผู้ใช้สามารถปรับแต่งรอบการเก็บรักษาบันทึกและส่งออกบันทึกภายนอกผ่าน API เพื่อการเก็บถาวรในระยะยาว
ปัจจุบัน สามารถเข้าถึงการจัดทำดัชนีที่เร่งด้วย GPU ได้บน AWS โดยมีแผนขยายความครอบคลุมไปยังผู้จำหน่ายระบบคลาวด์และภูมิภาคต่างๆ มากขึ้น คลัสเตอร์หลาย AZ อยู่ในระดับพรีเมียมของ Qdrant โดยมอบเวลาทำงานที่สนับสนุน SLA ที่ 99.95% คุณสมบัติการบันทึกการตรวจสอบเปิดสำหรับคลัสเตอร์ Qdrant Cloud แบบชำระเงินทั้งหมด
เอกสารอย่างเป็นทางการให้รายละเอียดเพิ่มเติมเกี่ยวกับความสามารถใหม่สามประการ
เชิงอรรถ
Hierarchical Navigable Small World (HNSW) เป็นอัลกอริทึมที่ออกแบบมาเพื่อระบุเวกเตอร์เพื่อนบ้านที่ใกล้ที่สุด โดยจะแมปเวกเตอร์เข้ากับโครงสร้างกราฟที่เชื่อมต่อถึงกัน ซึ่งจะขยายตัวอย่างมากตามปริมาณข้อมูลที่เพิ่มมากขึ้น HNSW ซ้อนเลเยอร์กราฟเสมือนหลายชั้น: เลเยอร์เบาบางด้านบนมีเวกเตอร์น้อยที่สุดสำหรับการค้นหาเบื้องต้นอย่างรวดเร็ว ในขณะที่ชั้นล่างจะเก็บเวกเตอร์มากขึ้นเรื่อยๆ จนกว่าเลเยอร์ด้านล่างจะครอบคลุมจุดข้อมูลทั้งหมด แต่ละเลเยอร์ทำหน้าที่เป็นจุดเริ่มต้นที่ได้รับการปรับปรุงสำหรับชั้นถัดไป ซึ่งช่วยลดเวลาในการตอบสนองการค้นหาโดยรวมลงอย่างมาก
Qdrant เผชิญกับการแข่งขันจากคู่แข่งในอุตสาหกรรมหลายราย Pinecone ยังใช้อัลกอริธึม HNSW และใช้ประโยชน์จาก NVIDIA GPU เพื่อเพิ่มประสิทธิภาพการฝังและการจัดอันดับใหม่ Zilliz มอบทั้งความเข้ากันได้ของ HNSW และการเร่งความเร็วของ GPU; ฐานข้อมูล Milvus ที่เป็นรากฐานจะรวม Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) จากไลบรารี RAPIDS cuVS เพื่อเปิดใช้งานการจัดทำดัชนี GPU
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/ผู้อำนวยการฝ่ายกลยุทธ์ระดับโลก
WhatsApp / WeChat: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
มุ่งเน้นธุรกิจ:
การจัดจำหน่ายผลิตภัณฑ์ ICT/บูรณาการระบบและบริการ/โซลูชั่นโครงสร้างพื้นฐาน
ด้วยประสบการณ์การจัดจำหน่ายด้านไอทีมากกว่า 20 ปี เราร่วมมือกับแบรนด์ชั้นนำระดับโลกเพื่อนำเสนอผลิตภัณฑ์ที่เชื่อถือได้และบริการระดับมืออาชีพ
“ใช้เทคโนโลยีเพื่อสร้างโลกอัจฉริยะ” ผู้ให้บริการผลิตภัณฑ์ ICT ที่เชื่อถือได้ของคุณ!