สำหรับองค์กรจำนวนมาก คลังข้อมูลได้เปลี่ยนจากสินทรัพย์เชิงกลยุทธ์ไปสู่ภาระในการดำเนินงาน แพลตฟอร์มที่เป็นกรรมสิทธิ์มายาวนาน เช่น Teradata ควบคู่ไปกับบริการเฉพาะบนคลาวด์ เช่น Snowflake ได้มอบความสามารถในการปรับขนาดและประสิทธิภาพ แต่ต้องแลกมากับการถูกผูกติดกับผู้จำหน่าย ราคาที่คาดไม่ถึง และความยืดหยุ่นทางสถาปัตยกรรมที่จำกัด
เมื่อการตรวจสอบกฎระเบียบทวีความรุนแรงขึ้น และการวิเคราะห์ที่ขับเคลื่อนด้วย AI กลายเป็นหัวใจสำคัญของความได้เปรียบในการแข่งขัน องค์กรต่างๆ กำลังประเมินใหม่ว่าแพลตฟอร์มคลังข้อมูลปัจจุบันของพวกเขาสอดคล้องกับวัตถุประสงค์ทางธุรกิจระยะยาวอย่างแท้จริงหรือไม่
EDB Postgres® AI (EDB PG AI) จัดการกับความท้าทายเหล่านี้โดยตรงด้วย WarehousePG ซึ่งเป็นคลังข้อมูลแบบโอเพนซอร์สขนาดเพตะไบต์ที่สร้างขึ้นเพื่อคืนการควบคุม ความสามารถในการคาดการณ์ และอธิปไตยของข้อมูล โดยไม่ลดทอนประสิทธิภาพ สร้างขึ้นบน Postgres และออกแบบมาสำหรับการวิเคราะห์แบบขนานขนาดใหญ่ WarehousePG นำเสนอวิธีการที่ทันสมัยในการหลุดพ้นจากระบบที่จำกัด พร้อมทั้งลดต้นทุนรวมในการเป็นเจ้าของ (TCO) ลงได้ถึง 58%
การวิเคราะห์ขนาดเพตะไบต์แบบโอเพนซอร์สด้วย Postgres เป็นแกนหลัก
คลังข้อมูลระดับองค์กรกำลังถูกยืดขยายเกินขีดจำกัดการออกแบบเดิม ชุดข้อมูลขนาดเพตะไบต์ ความต้องการในการปรับใช้แบบไฮบริด ข้อกำหนดด้านอธิปไตยของข้อมูล และการวิเคราะห์ที่ขับเคลื่อนด้วย AI ทั้งหมดนี้อยู่ร่วมกันในสภาพแวดล้อมการผลิตที่ต้องการทั้งประสิทธิภาพที่ยอดเยี่ยมและความยืดหยุ่นทางสถาปัตยกรรม
แพลตฟอร์มที่เป็นกรรมสิทธิ์แบบดั้งเดิมและคลังข้อมูลบนคลาวด์เท่านั้นประสบปัญหาในการตอบสนองความต้องการเหล่านี้พร้อมกัน ทำให้องค์กรต้องเลือกระหว่างต้นทุน การควบคุม และฟังก์ชันการทำงาน
EDB Postgres AI สำหรับ WarehousePG เติมเต็มช่องว่างนี้ด้วยการนำเสนอคลังข้อมูลขนาดเพตะไบต์แบบโอเพนซอร์สเต็มรูปแบบที่สร้างขึ้นบน Postgres ออกแบบมาสำหรับการวิเคราะห์ประสิทธิภาพสูง AI ในฐานข้อมูล และการปรับใช้ที่ยืดหยุ่นทั่วทั้งสภาพแวดล้อมภายในองค์กร คลาวด์ และไฮบริด ระบบนี้จะแก้ไขข้อจำกัดของระบบเดิมและระบบเฉพาะบนคลาวด์
สถาปัตยกรรม: MPP บนพื้นฐาน Postgres ที่ปรับขนาดได้
สถาปัตยกรรมแบบประมวลผลแบบขนานขนาดใหญ่ (MPP) ของ WarehousePG ช่วยให้สามารถปรับขนาดได้ทั่วทั้งโหนดหลายร้อยโหนด แทนที่จะพึ่งพารูปแบบการปรับขนาดเซิร์ฟเวอร์เดียว ระบบจะกระจายทั้งข้อมูลและการประมวลผลคิวรีไปยังโหนดส่วน (segment nodes) หลายโหนด โดยมีโหนดผู้ประสานงานกลาง (coordinator node) คอยดูแล
โหนดผู้ประสานงานจัดการกับการแยกวิเคราะห์คิวรี การเพิ่มประสิทธิภาพ และการวางแผนการประมวลผล เมื่อแผนคิวรีเสร็จสมบูรณ์ งานจะถูกกระจายไปยังส่วนต่างๆ ซึ่งทำงานแบบขนานกับพาร์ติชันข้อมูลของตนเอง วิธีการนี้ช่วยให้ WarehousePG สามารถเรียกใช้คิวรีการวิเคราะห์ที่ซับซ้อนได้อย่างมีประสิทธิภาพ รวมถึงการรวม (joins) ขนาดใหญ่ การรวมกลุ่ม (aggregations) ฟังก์ชันหน้าต่าง (window functions) และการแปลง (transformations) ข้ามชุดข้อมูลขนาดเพตะไบต์
สถาปัตยกรรมนี้ช่วยขจัดคอขวดโดยธรรมชาติของฐานข้อมูลแบบโมโนลิธ ในขณะที่ยังคงความเข้ากันได้กับ SQL อย่างสมบูรณ์กับ Postgres ซึ่งช่วยลดช่วงการเรียนรู้สำหรับทีมข้อมูลที่มีอยู่ได้อย่างมาก
ประสิทธิภาพที่คาดการณ์ได้โดยไม่มีข้อจำกัดที่เป็นกรรมสิทธิ์
แตกต่างจากคลังข้อมูลที่สร้างขึ้นบนคลาวด์ซึ่งพึ่งพาการกำหนดราคาตามการใช้งานและการจัดการทรัพยากรที่คลุมเครือ WarehousePG นำเสนอพฤติกรรมเวิร์กโหลดที่กำหนดได้และประสิทธิภาพที่สม่ำเสมอ การจัดสรรทรัพยากรและการประมวลผลคิวรีถูกควบคุมอย่างสมบูรณ์ภายในคลัสเตอร์ ทำให้มั่นใจได้ถึงเวลาตอบสนองที่คงที่แม้ภายใต้เวิร์กโหลดการวิเคราะห์แบบผสม
ในฐานะโซลูชันที่ได้รับใบอนุญาต Apache 2.0 ซึ่งสร้างขึ้นบน Postgres แบบโอเพนซอร์ส WarehousePG ช่วยให้องค์กรหลุดพ้นจากรูปแบบการจัดเก็บที่เป็นกรรมสิทธิ์และเอนจิ้นการประมวลผลที่ควบคุมโดยผู้จำหน่าย ข้อมูลยังคงสามารถเข้าถึงได้ พกพาได้ และปรับใช้ได้ทุกที่ที่องค์กรต้องการ ทั้งภายในองค์กรเพื่อการปฏิบัติตามกฎระเบียบ บนคลาวด์สาธารณะเพื่อความยืดหยุ่น หรือในการตั้งค่าแบบไฮบริดเพื่อการเพิ่มประสิทธิภาพต้นทุน
ความเป็นอิสระทางสถาปัตยกรรมนี้ ควบคู่ไปกับการกำหนดราคาตามแกนหลักของ EDB ช่วยลด TCO ลงได้ถึง 58% โดยเฉพาะอย่างยิ่งสำหรับองค์กรที่ย้ายมาจากแพลตฟอร์มที่เป็นกรรมสิทธิ์ที่มีราคาสูงหรือคลังข้อมูลบนคลาวด์ที่คาดเดาไม่ได้
การจัดเก็บข้อมูลแบบไฮบริดและการเข้าถึงข้อมูลใน Data Lake ด้วย SQL
สภาพแวดล้อมการวิเคราะห์สมัยใหม่กระจายอยู่ทั่วหลายระดับการจัดเก็บข้อมูลมากขึ้น WarehousePG จัดการกับสิ่งนี้ผ่าน Framework ส่วนขยายแพลตฟอร์ม (PXF) ซึ่งช่วยให้สามารถเข้าถึงข้อมูลภายนอกที่จัดเก็บในที่เก็บอ็อบเจกต์และระบบไฟล์แบบกระจาย เช่น Amazon S3 และ Hadoop Distributed File System (HDFS) ได้ด้วย SQL
ด้วย PXF วิศวกรข้อมูลสามารถคิวรีรูปแบบต่างๆ เช่น Parquet, AVRO, JSON และ CSV ได้โดยไม่ต้องคัดลอกข้อมูลไปยังคลังข้อมูล สิ่งนี้ช่วยลดความซับซ้อนของ ETL และความซ้ำซ้อนในการจัดเก็บข้อมูลได้อย่างมาก ในขณะเดียวกันก็เปิดใช้งานกลยุทธ์ข้อมูลแบบไฮบริด “ข้อมูลร้อนและเย็น”: ชุดข้อมูลที่เข้าถึงบ่อยจะยังคงอยู่ในที่เก็บข้อมูลประสิทธิภาพสูงของ WarehousePG ในขณะที่ข้อมูลที่ใช้น้อยจะอยู่ในที่เก็บอ็อบเจกต์ต้นทุนต่ำ
จากมุมมองทางเทคนิค วิธีการนี้จะรักษาความหมายของ SQL ข้ามชั้นการจัดเก็บข้อมูลที่หลากหลาย ทำให้ทีมวิเคราะห์สามารถทำงานกับโมเดลข้อมูลเชิงตรรกะเดียว
การนำเข้าข้อมูลแบบเรียลไทม์ด้วย FlowServer
ไปป์ไลน์แบบ Batch เท่านั้นไม่เพียงพออีกต่อไปสำหรับกรณีการใช้งานการวิเคราะห์จำนวนมาก WarehousePG มีส่วนประกอบ FlowServer เฉพาะสำหรับการนำเข้าข้อมูลแบบเรียลไทม์และใกล้เรียลไทม์
FlowServer รองรับการสตรีมเหตุการณ์ที่มีปริมาณงานสูงจากแพลตฟอร์มต่างๆ เช่น Apache Kafka และ RabbitMQ ทำให้กรณีการใช้งาน เช่น การวิเคราะห์การดำเนินงาน การตรวจจับการฉ้อโกง และการตรวจสอบแบบเรียลไทม์ ด้วยการนำเข้าข้อมูลสตรีมโดยตรงไปยังคลังข้อมูล องค์กรจะลดความล่าช้าระหว่างระบบการดำเนินงานและข้อมูลเชิงลึกจากการวิเคราะห์
สถาปัตยกรรมนี้ช่วยให้เวิร์กโหลดแบบสตรีมและแบบ Batch อยู่ร่วมกันภายในแพลตฟอร์มการวิเคราะห์เดียวกัน ทำให้โครงสร้างพื้นฐานง่ายขึ้นและลดการเคลื่อนย้ายข้อมูล
AI, ML และการประมวลผลเวกเตอร์ในฐานข้อมูล
คุณสมบัติสำคัญของ EDB Postgres AI สำหรับ WarehousePG คือการรองรับการวิเคราะห์และ AI ในฐานข้อมูล ซึ่งช่วยขจัดความจำเป็นในการย้ายชุดข้อมูลขนาดใหญ่ไปยังแพลตฟอร์มการเรียนรู้ของเครื่อง (ML) ภายนอก
WarehousePG ผสานรวม MADlib สำหรับการเรียนรู้ของเครื่องที่ใช้ SQL ทำให้ผู้ใช้สามารถฝึกและให้คะแนนโมเดลได้โดยตรงภายในฐานข้อมูลโดยใช้โครงสร้างเชิงสัมพันธ์ที่คุ้นเคย สำหรับกรณีการใช้งานขั้นสูง แพลตฟอร์มนี้รองรับเฟรมเวิร์ก Python ML ในฐานข้อมูล ทำให้วิศวกรข้อมูลสามารถทำงานในระดับที่ใหญ่ขึ้นได้โดยไม่ต้องส่งออกข้อมูล
การรองรับเวกเตอร์แบบเนทีฟผ่านส่วนขยาย pgvector ช่วยให้สามารถค้นหาความคล้ายคลึง การค้นหาเชิงความหมาย และเวิร์กโหลดการสร้างแบบเสริมการดึงข้อมูล (RAG) ได้โดยตรงภายในคลังข้อมูล ความสามารถนี้มีความสำคัญมากขึ้นเรื่อยๆ สำหรับแอปพลิเคชันที่ขับเคลื่อนด้วย AI ซึ่งรวมข้อมูลองค์กรที่มีโครงสร้างเข้ากับเนื้อหาที่ไม่มีโครงสร้าง เช่น เอกสารและบันทึก
ด้วยการรวมศูนย์ข้อมูล การวิเคราะห์ และ AI WarehousePG ช่วยลดความซับซ้อนของไปป์ไลน์และเร่งเวลาในการรับข้อมูลเชิงลึก
ความพร้อมใช้งานสูงและความพร้อมสำหรับองค์กร
WarehousePG ได้รับการออกแบบมาเพื่อความน่าเชื่อถือระดับการผลิต ความพร้อมใช้งานสูงทำได้ผ่านโหนดผู้ประสานงานสำรอง (standby coordinator) เพื่อให้มั่นใจว่าการดำเนินงานจะไม่หยุดชะงักหากโหนดผู้ประสานงานหลักล้มเหลว ความทนทานต่อข้อผิดพลาดระดับส่วน (segment-level fault tolerance) ช่วยให้เวิร์กโหลดยังคงทำงานต่อไปได้แม้ว่าโหนดแต่ละโหนดจะไม่พร้อมใช้งาน
คุณสมบัติระดับองค์กร ได้แก่ การจัดการเวิร์กโหลด การกำหนดเวลาคิวรีที่คาดการณ์ได้ และการสังเกตการณ์ที่ครอบคลุม เพื่อให้มั่นใจถึงการดำเนินงานที่เสถียรภายใต้ความต้องการการวิเคราะห์ที่หนักหน่วง
ที่สำคัญ องค์กรสามารถเข้าถึงการสนับสนุนตลอด 24 ชั่วโมงทุกวันจากผู้เชี่ยวชาญ Postgres ของ EDB ซึ่งเชื่อมช่องว่างระหว่างความยืดหยุ่นของโอเพนซอร์สและความต้องการในการดำเนินงานขององค์กร
การย้ายข้อมูลโดยไม่กระทบกระเทือน
สำหรับองค์กรที่ปรับปรุงระบบจากแพลตฟอร์มการวิเคราะห์เดิม WarehousePG นำเสนอเส้นทางที่มีความเสี่ยงต่ำในการก้าวไปข้างหน้า เวิร์กโหลด Greenplum ที่มีอยู่สามารถย้ายได้ผ่านการสลับไบนารี (binary swap) ทำให้สามารถปรับปรุงระบบได้อย่างรวดเร็วโดยไม่ต้องเขียนคิวรีใหม่หรือฝึกอบรมทีมใหม่ ความเข้ากันได้กับ SQL ในระดับสูงยังช่วยให้การย้ายจากคลังข้อมูลที่เป็นกรรมสิทธิ์อื่นๆ ที่ใช้ SQL ง่ายขึ้น
วิธีการนี้ช่วยให้องค์กรสามารถปรับปรุงระบบได้อย่างค่อยเป็นค่อยไป โดยรักษาความต่อเนื่องทางธุรกิจ ในขณะเดียวกันก็สามารถควบคุมสแต็กการวิเคราะห์ของตนเองได้อีกครั้ง
การสร้างคลังข้อมูลใหม่สำหรับการวิเคราะห์สมัยใหม่
EDB PG AI สำหรับ WarehousePG พิสูจน์ให้เห็นว่าการวิเคราะห์ขนาดเพตะไบต์ ความพร้อมสำหรับ AI และอธิปไตยของข้อมูลไม่จำเป็นต้องใช้แพลตฟอร์มที่เป็นกรรมสิทธิ์หรือการผูกติดกับคลาวด์ ด้วยการรวมความเข้ากันได้กับ Postgres ความสามารถในการปรับขนาด MPP การจัดเก็บข้อมูลแบบไฮบริด การนำเข้าข้อมูลแบบเรียลไทม์ และความสามารถด้าน AI และ ML ในฐานข้อมูล WarehousePG จึงมอบรากฐานทางเทคนิคที่แข็งแกร่งสำหรับการวิเคราะห์ระดับองค์กรสมัยใหม่
สำหรับองค์กรที่มองหาคลังข้อมูลที่ให้ความสำคัญกับการควบคุมสถาปัตยกรรม ประสิทธิภาพที่คาดการณ์ได้ และเศรษฐศาสตร์แบบโอเพนซอร์ส WarehousePG นำเสนอทางเลือกที่น่าสนใจและพร้อมสำหรับอนาคต
บริษัท ปักกิ่ง เฉียนซิง เจียทง เทคโนโลยี จำกัด
แซนดี้ หยาง / ผู้อำนวยการฝ่ายกลยุทธ์ระดับโลก
WhatsApp / WeChat: +86 13426366826
อีเมล: yangyd@qianxingdata.com
เว็บไซต์: www.qianxingdata.com/www.storagesserver.com
จุดเน้นทางธุรกิจ:
การจัดจำหน่ายผลิตภัณฑ์ ICT / การรวมระบบและบริการ / โซลูชันโครงสร้างพื้นฐาน
ด้วยประสบการณ์ด้านการจัดจำหน่ายไอทีมากกว่า 20 ปี เราเป็นพันธมิตรกับแบรนด์ชั้นนำระดับโลกเพื่อส่งมอบผลิตภัณฑ์ที่เชื่อถือได้และบริการระดับมืออาชีพ
“ใช้เทคโนโลยีเพื่อสร้างโลกที่ชาญฉลาด” ผู้ให้บริการผลิตภัณฑ์ ICT ที่คุณไว้วางใจ!