StorageReview ได้ทวงคืนตำแหน่งสูงสุดด้านการประมวลผลด้วยการคำนวณค่า π ได้ถึง 314 ล้านล้านหลัก ซึ่งทำลายสถิติโลกเดิม การแข่งขันเพื่อความแม่นยำของค่า π ในปัจจุบันได้พัฒนาจากการทดลองบนคลาวด์ในยุคแรกๆ ไปสู่การแสดงศักยภาพของโครงสร้างพื้นฐานและความชาญฉลาดทางวิศวกรรมอย่างเต็มรูปแบบ
ย้อนกลับไปในปี 2022 Google Cloud ได้สร้างความฮือฮาด้วยการคำนวณค่า π ได้ถึง 100 ล้านล้านหลัก โครงการนี้ใช้ชุดอินสแตนซ์คลาวด์จำนวนมากเพื่อรันโปรแกรม y-cruncher และใช้ข้อมูล I/O จำนวนหลายสิบเพตะไบต์ ในขณะนั้น ความสำเร็จนี้ถือเป็นมาตรฐานที่ชัดเจนสำหรับขีดจำกัดสูงสุดที่โครงสร้างพื้นฐานแบบดั้งเดิมสามารถทำได้
จากนั้นจึงเปลี่ยนจุดสนใจไปที่สภาพแวดล้อมห้องปฏิบัติการภายในองค์กร ในช่วงต้นปี 2024 เราได้อัปเกรดระบบของเราเพื่อตั้งสถิติใหม่ที่ 105 ล้านล้านหลัก โดยได้รับการสนับสนุนจาก Solidigm QLC SSD เกือบ 1 เพตะไบต์ ความสำเร็จนี้ได้สร้างมาตรฐานใหม่ของขนาด โดยพิสูจน์ว่าเครื่องเดียวภายในองค์กรสามารถให้ประสิทธิภาพที่ยอดเยี่ยมได้ เพียงไม่กี่เดือนต่อมา เราได้ผลักดันขีดจำกัดต่อไปอีกถึง 202 ล้านล้านหลัก ความก้าวหน้านี้ได้รับการยืนยันว่าที่เก็บข้อมูลแฟลชความหนาแน่นสูง เมื่อรวมกับการปรับแต่งระบบอย่างพิถีพิถัน สามารถทำผลงานได้ดีกว่าโครงสร้างพื้นฐานคลาวด์แบบไฮเปอร์สเกลสำหรับเวิร์กโหลดเฉพาะที่ต้องการสูงนี้
แน่นอนว่าทุกสถิติย่อมมีการท้าทาย Linus Media Group และ KIOXIA ได้อ้างสิทธิ์ในตำแหน่งนี้ต่อมาด้วยการคำนวณค่า π ได้ถึง 300 ล้านล้านหลัก การตั้งค่าของพวกเขาอาศัยคลัสเตอร์จัดเก็บข้อมูลร่วม Weka ขนาดใหญ่ที่ติดตั้งที่เก็บข้อมูลแฟลช 2PB แม้ว่าสิ่งนี้จะแสดงให้เห็นถึงศักยภาพของโครงสร้างพื้นฐานแบบดั้งเดิมที่เน้นการจัดเก็บข้อมูล แต่ก็มาพร้อมกับการแลกเปลี่ยนที่สำคัญ: ฮาร์ดแวร์เต็มแร็ค การใช้พลังงานจำนวนมาก และความต้องการระบบระบายความร้อนที่ซับซ้อน เรามุ่งมั่นที่จะไม่ปล่อยให้สถิตินี้อยู่โดยไม่มีการท้าทาย
วันนี้ StorageReview ภูมิใจที่จะประกาศชัยชนะครั้งใหม่ของเรา: การคำนวณค่า π ได้ถึง 314 ล้านล้านหลัก ความสำเร็จนี้ทำได้โดยใช้เซิร์ฟเวอร์ Dell PowerEdge R7725 ขนาด 2U เพียงเครื่องเดียว ติดตั้ง CPU AMD EPYC แบบ 192 คอร์คู่ และ SSD Micron 6550 Ion ขนาด 61.44TB จำนวนสี่สิบตัว เราได้สร้างและปรับแต่งระบบเสร็จสิ้นในเดือนกรกฎาคม และเริ่มการคำนวณในวันที่ 31 กรกฎาคม 2025 โดยบังเอิญ การคำนวณสิ้นสุดลงในวันที่สองของงาน SC25 ทำให้สถิติการประมวลผลประสิทธิภาพสูง (HPC) ใหม่นี้มีความทันเวลามากยิ่งขึ้น
การปรับขนาด y-cruncher ให้ถึง 314 ล้านล้านหลัก
เมื่อขนาดการคำนวณเกินหลายแสนล้านหลัก y-cruncher จะเปลี่ยนจากเกณฑ์มาตรฐานแบบดั้งเดิมไปสู่การทดสอบโครงสร้างพื้นฐานระยะยาวที่หนักหน่วง ตรรกะหลักของโปรแกรมยังคงตรงไปตรงมา แต่การโต้ตอบกับฮาร์ดแวร์ในขนาดนี้จะกลายเป็นปัจจัยชี้ขาด การดำเนินงานทั้งหมดขึ้นอยู่กับความสามารถของระบบในการรักษาการดำเนินการหลายความแม่นยำหลายพันรายการให้ทำงานได้อย่างราบรื่น โดยไม่ทำให้ CPU หยุดทำงานหรือทำให้ชั้นจัดเก็บข้อมูลทำงานหนักเกินไป อันที่จริง สถิติใหม่นี้ชนะมาได้จากชั้นจัดเก็บข้อมูลอย่างแท้จริง
เราได้ติดตั้ง SSD Micron 6550 Ion Gen5 NVMe จำนวน 40 ตัว โดย 34 ตัวถูกจัดสรรไว้สำหรับการรัน y-cruncher โดยเฉพาะ กลุ่ม SSD นี้ให้พื้นที่ใช้งานประมาณ 2.1 เพตะไบต์ ทำให้ y-cruncher มีพื้นที่จัดเก็บเพียงพอสำหรับการคำนวณและประมวลผลค่า π 314 ล้านล้านหลัก SSD ที่เหลืออีก 6 ตัวถูกกำหนดค่าเป็นวอลุ่มซอฟต์แวร์ RAID10 ซึ่งใช้สำหรับจัดเก็บผลลัพธ์สุดท้าย 314 ล้านล้านหลักโดยเฉพาะ
การปรับปรุงการออกแบบระหว่างเซิร์ฟเวอร์ Dell PowerEdge รุ่นที่ 16 และ 17 ก็มีบทบาทสำคัญในการเพิ่มประสิทธิภาพสำหรับการรันสถิติ 314 ล้านล้านหลักนี้ การทดลอง 202 ล้านล้านหลักก่อนหน้านี้ของเราใช้ Dell PowerEdge R760 แบบ 24 เบย์ ซึ่งมี PCIe switch บน backplane ของไดรฟ์ โดยแลกเปลี่ยนความหนาแน่นของไดรฟ์เพื่อประสิทธิภาพที่เพิ่มขึ้น ในทางตรงกันข้าม เซิร์ฟเวอร์ PowerEdge รุ่นที่ 17 เช่น R770 ที่ใช้ Intel และ R7725 ที่ใช้ AMD มี backplane ที่มีการออกแบบเชื่อมต่อโดยตรงเท่านั้น โดยให้ PCIe 2 หรือ 4 เลนต่อเบย์
PowerEdge R7725 ซึ่งติดตั้ง backplane Gen5 E3.S แบบ 40 เบย์ ให้ PCIe 2 เลนต่อสล็อต SSD แม้ว่าสิ่งนี้อาจดูเหมือนเป็นการแลกเปลี่ยนประสิทธิภาพที่เป็นไปได้บนกระดาษ แต่แพลตฟอร์มนี้ยังคงสามารถส่งมอบความเร็วที่น่าประทับใจ: ประสิทธิภาพการอ่านและเขียนพร้อมกันสูงสุดถึง 280GB/s เมื่อใช้งานทั้ง 40 เบย์เต็มที่
โดยใช้เกณฑ์มาตรฐานการจัดเก็บข้อมูลภายในของ y-cruncher เราได้วัดประสิทธิภาพการจัดเก็บข้อมูลของแต่ละแพลตฟอร์มในการกำหนดค่าที่เกี่ยวข้อง ในทุกเวิร์กโหลด เราสังเกตเห็นการปรับปรุงประสิทธิภาพการจัดเก็บข้อมูลตั้งแต่ 72% ถึง 383% โดยมีเมตริกการอ่านและเขียนที่สมดุล ซึ่งตอกย้ำความเหนือกว่าของเซิร์ฟเวอร์ PowerEdge รุ่นที่ 17 สำหรับการประมวลผลที่เน้นการจัดเก็บข้อมูลขนาดใหญ่
| เมตริก | ระบบ 202T (สถิติเดิม) | ระบบ 314T (สถิติใหม่) | เปอร์เซ็นต์ความแตกต่าง (314T เทียบกับ 202T) |
|---|---|---|---|
| Sequential Write | 47.0 GiB/s | 107 GiB/s | +127.7% |
| Sequential Read | 56.7 GiB/s | 127 GiB/s | +124.0% |
| Threshold Strided Write | 62.2 GiB/s | 107 GiB/s | +72.0% |
| Threshold Strided Read | 20.9 GiB/s | 101 GiB/s | +383.3% |
Dell PowerEdge R7725 เป็นมากกว่าแค่ขุมพลังจัดเก็บข้อมูล แต่ยังโดดเด่นในฐานะแพลตฟอร์ม AMD Turin แบบสองซ็อกเก็ตที่มีศักยภาพในการประมวลผลที่ยอดเยี่ยม เราได้ติดตั้งโปรเซสเซอร์ AMD EPYC 9965 แบบ 192 คอร์ ทำให้มีคอร์รวม 384 คอร์ เพื่อปลดล็อกประสิทธิภาพนี้ เราได้อัปเกรดโซลูชันระบายความร้อนด้วยอากาศแบบมาตรฐานเป็นแผ่นระบายความร้อนด้วยของเหลว CoolIT SP5 ซึ่งระบายความร้อนด้วย CoolIT AHx10 Liquid-to-Air CDU (Coolant Distribution Unit)
การอัปเกรดระบบระบายความร้อนเชิงกลยุทธ์นี้ให้ประโยชน์หลักสามประการ: ช่วยให้ CPU รักษาความเร็วสัญญาณนาฬิกาสูงอย่างต่อเนื่อง รักษาพัดลมแชสซีของเซิร์ฟเวอร์ให้ทำงานที่ระดับ PWM (Pulse Width Modulation) ต่ำอย่างน่าทึ่งที่ 30% และรับประกันว่าการใช้พลังงานเฉลี่ยของระบบยังคงที่ประมาณ 1,600Wการปรับแต่งซอฟต์แวร์และระบบสำหรับชั้นซอฟต์แวร์ เราได้เปลี่ยนจากแนวทางปฏิบัติในอดีตโดยเลือกใช้ Ubuntu 24.04.2 LTS Server แทน Windows Server การตัดสินใจนี้มีบทบาทสำคัญในการเพิ่มเสถียรภาพของระบบให้สูงสุดและปลดล็อกประสิทธิภาพของเวิร์กโหลดที่เพิ่มขึ้นอย่างมากก่อนเริ่มการคำนวณสถิติ เราได้ทำการทดสอบซ้ำอย่างเข้มงวดและปรับแต่งการกำหนดค่า ขั้นตอนสำคัญคือการสำรอง 4 ใน 384 คอร์ที่มีอยู่สำหรับการดำเนินงานระบบพื้นหลังที่สำคัญ เพื่อให้แน่ใจว่าเธรดการคำนวณหลักจะไม่ถูกขัดขวาง ผลลัพธ์คืออะไร? เราไม่ได้แค่เอาชนะสถิติ pi เดิมเท่านั้น แต่เราได้ทำลายมันในทุกเมตริกที่วัดได้ การคำนวณของเรามีความโดดเด่นในด้านประสิทธิภาพ ประสิทธิภาพการใช้พลังงาน และที่น่าประทับใจที่สุดคือความน่าเชื่อถือที่ไร้ที่ติ เรามีความภาคภูมิใจเป็นพิเศษในการเป็นความพยายามบันทึกสถิติ pi ขนาดใหญ่เพียงหนึ่งเดียวที่เสร็จสมบูรณ์โดยไม่มีการหยุดทำงาน การคำนวณดำเนินไปอย่างราบรื่นตั้งแต่ต้นจนจบโดยไม่จำเป็นต้องเริ่มใหม่ประสิทธิภาพการใช้พลังงานที่ทำลายสถิติหลักการสำคัญเบื้องหลังความพยายามบันทึกสถิติ pi ของ StorageReview แต่ละครั้งคือการลดความซับซ้อนของระบบและเพิ่มประสิทธิภาพการใช้พลังงาน สถิติ 300T เดิมอาศัยคลัสเตอร์จัดเก็บข้อมูลแบบกระจายพร้อมเครือข่ายความเร็วสูง ซึ่งโดยธรรมชาติแล้วต้องการงบประมาณพลังงานและระบบระบายความร้อนที่สูงขึ้น
ตลอดการคำนวณค่า π 314 ล้านล้านหลักทั้งหมด Dell PowerEdge R7725 ของเราใช้พลังงานรวม 4,304.662 kWh ซึ่งเทียบเท่ากับ 13.70 kWh ต่อล้านล้านหลัก ซึ่งทำให้โซลูชันของเราเป็นหนึ่งในการคำนวณค่า π ขนาดใหญ่ที่มีประสิทธิภาพมากที่สุดเท่าที่เคยมีมา ความแตกต่างอย่างชัดเจนระหว่างแนวทางเซิร์ฟเวอร์เดี่ยวที่มีประสิทธิภาพของเรากับวิธีการคลัสเตอร์ที่ใช้พลังงานมากนั้นชัดเจนทันที ดังที่แสดงในตารางเปรียบเทียบด้านล่าง
การรันTotal kWhราคา @ $0.12/kWh
ราคา @ $0.20/kWhการรันคลัสเตอร์ Weka 300T33,600 kWh (โดยประมาณ)$4,032$6,720การรันเซิร์ฟเวอร์เดี่ยว 314T4,304.662 kWh
$517
$861
เป็นสิ่งสำคัญที่ต้องเน้นย้ำว่าระหว่างการคำนวณค่า π 314 ล้านล้านหลัก เราได้ใช้ SSD ในการกำหนดค่า JBOD (Just a Bunch of Disks) ซึ่งไม่มีความทนทานต่อข้อมูลในตัว การตัดสินใจนี้ขับเคลื่อนโดยลำดับความสำคัญหลักสองประการ: การเพิ่มประสิทธิภาพการใช้พลังงานและการเพิ่มประสิทธิภาพของระบบโดยรวม อย่างไรก็ตาม สิ่งนี้ยังจุดประกายการสนทนาที่สำคัญเกี่ยวกับการปรับโซลูชันการจัดเก็บข้อมูลให้เข้ากับความต้องการเฉพาะของเวิร์กโหลดที่กำลังดำเนินการอยู่ เวิร์กโหลดแต่ละอย่างมีเอกลักษณ์เฉพาะตัว บางอย่างสามารถเริ่มใหม่ได้โดยมีผลกระทบต่อการดำเนินงานน้อยที่สุด ดังนั้นจึงไม่ต้องการระดับความทนทานต่อข้อผิดพลาดสูงเท่ากับงานที่สำคัญ ในกรณีของเรา เรามุ่งเน้นไปที่การปกป้องผลลัพธ์ข้อมูลสุดท้ายผ่านการตั้งค่าซอฟต์แวร์ RAID แบบดั้งเดิม เพื่อให้มั่นใจในความสมบูรณ์ของตัวเลข π ที่ทำลายสถิติโดยไม่กระทบต่อประสิทธิภาพของระบบ110 วันของการทำงานต่อเนื่องแม้จะคำนวณตัวเลขได้มากกว่าความพยายามบันทึกสถิติ π ก่อนหน้านี้ทั้งหมด แต่เวลาในการทำงานจริงของเราสั้นกว่าเกณฑ์มาตรฐานก่อนหน้านี้อย่างมาก สถิติ 300 ล้านล้านหลักก่อนหน้านี้ต้องใช้เวลาประมาณ 225 วันในการดำเนินการทั้งหมด ซึ่งเทียบเท่ากับ 175 วันของการคำนวณจริงเมื่อไม่รวมเวลาหยุดทำงาน ในทางตรงกันข้าม การรัน 314 ล้านล้านหลักของเราบรรลุการทำงานต่อเนื่องเต็ม 110 วัน ความเสถียรที่ยอดเยี่ยมนี้สามารถอธิบายได้ด้วยปัจจัยสำคัญสี่ประการ: ระบบปฏิบัติการที่แข็งแกร่งและเสถียร การลดภาระงานพื้นหลังให้น้อยที่สุดเพื่อหลีกเลี่ยงการแย่งชิงทรัพยากร โทโพโลยี NUMA (Non-Uniform Memory Access) ที่สมดุลเพื่อการสื่อสาร CPU-หน่วยความจำที่เหมาะสมที่สุด และอาร์เรย์ชั่วคราวที่ออกแบบมาโดยเฉพาะเพื่อจัดการกับรูปแบบการเข้าถึงข้อมูลที่เป็นเอกลักษณ์ที่สร้างขึ้นโดย y-cruncher ในขนาดที่ไม่เคยมีมาก่อนนี้
ไฮไลท์ทางเทคนิค: 148,356,635,606,263,504 (132 PiB): 314,000,000,000,000ฮาร์ดแวร์ที่ใช้: Dell PowerEdge R7725 พร้อม CPU AMD EPYC 9965 2x, DRAM DDR5 1.5TB, Micron 61.44TB 6550 Ion 40x
| ซอฟต์แวร์และอัลกอริทึม | : y-cruncher v0.8.6.9545, Chudnovsky | การสึกหรอของ SSD ต่อ SMART | : 7.3PB เขียนต่อไดรฟ์ หรือ 249.11PB ทั่วทั้ง 34 SSD ที่ใช้สำหรับสลับ |
|---|---|---|---|
| จุดตรวจสอบที่ใหญ่ที่สุดเชิงตรรกะ | : 850,538,385,064,992 (774 TiB) | การใช้งานดิสก์สูงสุดเชิงตรรกะ | : 1,605,960,520,636,440 (1.43 PiB) |
| ไบต์ดิสก์ที่อ่านเชิงตรรกะ | : 148,356,635,606,263,504 (132 PiB) | ไบต์ดิสก์ที่เขียนเชิงตรรกะ | : 126,658,805,195,776,600 (112 PiB) |
วันที่เริ่มต้น
: พฤหัสบดี 31 ก.ค. 17:16:41 2025
วันที่สิ้นสุด
: อังคาร 18 พ.ย. 05:57:08 2025
- pi: 8793223.144 วินาที, 101.773 วัน
- เวลาคำนวณทั้งหมด: 9274878.580 วินาที
- เวลาตั้งแต่ต้นจนจบ: 9463226.454 วินาที
- ความคิดเห็นปิดท้ายเป็นเวลาหลายทศวรรษที่การคำนวณค่า π ขั้นสูงได้ทำหน้าที่เป็นเวทีแสดงศักยภาพในการประมวลผล โดย "เครื่องจักรขนาดใหญ่" ในแต่ละยุคสมัยได้เข้ามามีบทบาทสำคัญ สถิติในยุคแรกๆ อาศัยเดสก์ท็อปประสิทธิภาพสูงและอาร์เรย์จัดเก็บข้อมูลภายนอก จากนั้นจึงเปลี่ยนไปใช้ฮาร์ดแวร์ระดับองค์กรภายในองค์กร เมื่อเร็วๆ นี้ การแข่งขันได้ย้ายไปยังคลาวด์ ซึ่งโครงการต่างๆ เช่น การคำนวณ 1
รายละเอียดการติดต่อ
Beijing Qianxing Jietong Technology Co., Ltd.
ผู้ติดต่อ: Ms. Sandy Yang
โทร: 13426366826



