เอา SSD ใส่ฮีตซิงค์เย็นลงเยอะแค่ไหน?

สวัสดีคนที่ยังติดตามอ่าน blog ผมอยู่ (น่าจะหายหมดแล้วมั้ง)

ไม่ได้เขียน blog มานาน 2 ปีกว่า ซึ่งปีนี้มีเรื่องให้เขียนย้อนหลังเยอะพอสมควรเลยหล่ะ แต่ตอนนี้ขอเขียนสั้น ๆ เพราะเมื่อช่วงเดือนตุลาคมปีที่แล้ว ผมประกอบคอมฯ เครื่องใหม่มาแทนคอมฯ เครื่องเดิมอายุประมาณ 5 ปี วันนี้ขอเล่าประสบการณ์ในเรื่องใส่ฮีตซิงค์ของ SSD M.2 เพิ่มหลังจากที่ผมซื้อ Lexar NM710 มาใส่เพิ่มเติม เพราะผมพบว่า SSD M.2 มันร้อนเกินไปจนความเร็วตกในบางครั้ง ผมจึงทำการทดลองเปรียบเทียบดูว่าพอใส่ฮีตซิงค์แล้วความร้อนมันสูงแค่ไหน โดยในภาพผมทดสอบให้มันทำงานที่ความเร็วสูงสุด เพื่อดูว่ามันร้อนขนาดไหนหากไม่มีฮีตซิงค์

พอรู้ว่าร้อนขนาดไหน ผมซื้อฮีตซิงค์ Lexar รุ่น LPAH100 มาใส่เพิ่มเติม เป็นฮีตซิงค์เสริมสำหรับ SSD M.2 สล็อตที่ไม่มีฮีตซิงค์มาประกอบแล้วทดสอบดูอีกรอบ

โดยจะเห็นว่าผมทดสอบด้วยความเร็วระดับสูงสุด แต่ความร้อนไม่สูงเกิน 61c ในมุมผมถือว่าลดความร้อนลงมาได้เยอะมาก ๆ และเมื่อความร้อนไม่สูงจนเกินไป ย่อมส่งผลต่อการทำงาน ยังทำให้ตัว controller บน SSD มันก็ไม่ดรอปความเร็วลงเพื่อลดความร้อนอีกด้วย

สำหรับตอนต่อ ๆ ไปจะมาเล่าเรื่องอะไร ติดตามกันได้ครับ จะพยายามมาเขียนต่อเรื่อย ๆ 👍

ลองของกับ Apacer Thunderbird AST680S (240GB) และ Apacer TURBO II AS710 (128GB)

ผมได้ SSD มาทดสอบอยู่ 2 ตัว เมื่อไม่นานมานี้ เป็นรุ่นที่ระดับ consumer ใช้งาน ยี่ห้อน Apacher รุ่น Thunderbird AST680S (240GB) และ TURBO II AS710 (128GB)โดยทั้งสองรุ่นนั้นมีความสามารถที่เหมือนกันอยู่หลายๆ อย่าง เช่น รองรับ SATA Interface 6.0Gbps, ECC engine correcting, TRIM command support, 256-bit AES encryption and decryption และพร้อมกับประกัน 3 ปี

แต่ทั้งสองรุ่นก็มีข้อแตกต่างกันในการนำไปใช้งานอยู่บ้าง เรามาดูเป็นรุ่นๆ ไปดีกว่า

2015-08-08 15.06.18

Apacer Thunderbird AST680S (240GB)

รุ่น Apacer Thunderbird AST680S ถือเป็นรุ่นที่ระดับบน ความจุ 240GB ในราคาประมาณ 3,1xx บาท ที่ให้ทั้งประสิทธิภาพที่ดีในด้านความเร็วเป็นหลัก ตัวเคสที่ประกอบมีงานแน่นหนามาก ตัวเคสที่ประกอบมีความหนาเพียง 7mm เท่านั้น ทำให้ประกอบใส่เข้ากับ notebook ขนาดเล็กได้

ความเร็วที่ให้ไว้ใน datasheet คือ Interface SATA III 6Gb/s ให้ความเร็วในการอ่าน 550 MB/s และ เขียน 520 MB/s

2015-08-08 15.10.43

2015-08-19 22.17.54 2015-08-19 22.18.06

2015-08-19 22.18.12 2015-08-19 22.18.30

โดยการทดสอบ ผมนำเอา SSD รุ่นดังกล่าวมาติดตั้ง OS แล้ววัดความเร็วด้วย AS SSD Benchmark ให้ชมกัน

as-ssd-bench Apacer AST680S 2 19.8.2558 22-06-17 as-ssd-bench Apacer AST680S 2 19.8.2558 22-06-09

as-copy-bench Apacer AST680S 2 19.8.2558 22-11-27

จะเห็นในด้านความเร็วทั้ง MB/s และ IOPS ทำออกมาได้ค่อนข้างดี ใกล้เคียงกับ datasheet

as-compr-bench Apacer AST680S 2 19.8.2558 22-05-32

มาดูที่การทำความเร็วว่าทำงานได้สม่ำเสมอมากแค่ไหน โดยจากกราฟจะเห็นว่า ความเร็วที่ได้นั้น ค่อนข้างนิ่ง ถือว่าผ่านในการทดสอบความนิ่งในการใช้งาน

Apacer TURBO II AS710 (128GB)

รุ่น Apacer TURBO II AS710 ถือเป็นรุ่นที่ระดับกลาง ที่ให้ความจุ 128GB ในราคาประมาณ 2,6xx บาท ที่ให้ทั้งประสิทธิภาพที่ดีในด้านความเร็วปานกลาง ตัวเคสที่ประกอบที่แน่หนา แต่เบากว่า  Apacer Thunderbird AST680S ซึ่งคาดว่าเพื่อไว้สำหรับพกพา เพราะในรุ่นนี้ สามารถเชื่อมต่อผ่าน USB 3.0 ได้โดยตรง โดยตัวเคสที่ประกอบมีความหนาเพียง 7mm เท่านั้น ทำให้ประกอบใส่เข้ากับ notebook ขนาดเล็กได้

2015-08-08 23.55.14

2015-08-08 18.43.00 2015-08-08 18.43.59

2015-08-08 18.45.29 HDR 2015-08-08 18.45.52 HDR

ในด้านความเร็วนั้น การทำงานทั้งผ่าน SATA และ USB 3.0 นั้น ให้ความเร็วใกล้เคียงกัน โดยความเร็ว USB 3.0 นั้นขึ้นอยู่กับ interface controller ของเครื่องนั้นๆ ด้วยว่าสามารถทำความเร็วได้แค่ไหนด้วย หากเป็น interface controller รุ่นใหม่ๆ จะทำความเร็วได้เสถียรและใกล้เคียงกับ SATA มาก

as-ssd-bench Apacer AS710 128 19.8.2558 22-31-47 as-ssd-bench Apacer AS710 128 19.8.2558 22-32-00

as-copy-bench Apacer AS710 128 19.8.2558 22-37-47

จะเห็นในด้านความเร็วทั้ง MB/s และ IOPS ทำออกมาได้ค่อนข้างดี ใกล้เคียงกับ datasheet

as-compr-bench Apacer AS710 128 19.8.2558 22-33-38

มาดูที่การทำความเร็วว่าทำงานได้สม่ำเสมอมากแค่ไหน โดยจากกราฟจะเห็นว่า ความเร็วที่ได้นั้นค่อยวิ่งสูงขึ้นเรื่อยๆ ซึ่งแตกต่างจาก Apacer Thunderbird AST680S รุ่นที่เหนือกว่าตัวนี้ คาดว่าน่าจะเป็นเรื่องของ cache และตัว controller ตัวนี้ที่อาจเกี่ยวกับ interface ที่มี USB 3.0 เป็นส่วนเสริมเข้ามา

สรุป

ความรู้สึกหลังจากใช้งานทั้งสองตัวโดยรวมแล้ว Apacer Thunderbird AST680S (240GB) ให้ตอบสนองการใช้งานที่จำเป็นต้องการประสิทธิภาพที่สูงกว่ามาก สำหรับคนที่ต้องการลงทุนสำหรับการใช้ติดตั้ง OS น่าจะชื่นชอบตัวนี้ อีกทั้งตาม endurance rating ของรุ่นนี้ ที่ระบุไว้ที่ 670 TBW ทำให้ตอบโจทย์การใช้งานที่ต้องการความทนทานสูง และสำหรับ Apacer TURBO II AS710 (128GB) นั้น น่าจะเหมาะกับการนำมาพกพามากกว่า เพราะมีน้ำหนักเบา และถึงแม้ว่าจะมีประสิทธิภาพที่น้อยกว่ารุ่นบนที่นำมาทดสอบคู่กัน แต่ endurance rating ของรุ่นนี้ ที่ระบุไว้ที่ 340 TBW ก็ถือว่าให้ตัวเลขมาได้ค่อนข้างน่าสนใจ และถือว่าสูงเมื่อเทียบกับความจุและราคาที่ได้

หมายเหตุ สำหรับใครสงสัยเรื่อง endurance rating สามารถเข้าไปได้ตาม link ที่ได้ทำไว้ครับ

ซื้อ SSD อย่าดูแต่ Throughput, Latency และ IOPS ให้ดูข้อมูล Endurance Rating ด้วย

ในช่วงเดือนที่ผ่านมา ผมได้มีโอกาสทดสอบ SSD หลายรุ่น และ SSD ที่ใช้งานอยู่บางตัวมีปัญหาจนต้องซื้อใหม่ ผมเลยนำประสบการณ์ของปัญหา และมาเล่าเรื่องของ Endurance Rating เพื่อเอาไว้เลือกซื้อ SSD มาเล่าให้ฟังไว้ประกอบการซื้อ SSD ในครั้งต่อๆ ไป และถือเป็นการบันทึกช่วยจำให้กับตัวเองด้วย

Endurance Rating ที่ว่านี้ อ้างอิงจาก JESD218/JESD219 standard เพื่อนำไปใช้วัดผลการทดสอบความทนทานของ SSD รุ่นนั้น โดยค่าที่มักจะแสดงอยู่ใน Reliability Specifications มักจะบอกเป็นค่า Terabytes Written หรือตัวย่อ TBW ซึ่งแปลตรงๆ ว่า “จำนวนไบต์ที่สามารถเขียนลงไปได้ทั้งหมด” แน่นอนว่ามักจะมีขอบเขตเวลา ซึ่งโดยทั่วไปวัดจาก “อายุการรับประกันสินค้า” และบางยี่ห้อ หรือบาง Technical Specifications จะมีอีกคำหนึ่งคือ Drive Writes Per Day หรือตัวย่อว่า DWPD ซึ่งแปลตรงๆ ว่า “จำนวนข้อมูลที่เขียนลงบนไดรฟ์ต่อวัน” โดยเทียบกับขนาดพื้นที่ของตัว SSD ซึ่งวัดขอบเขตเวลาจากอายุการรับประกันเช่นเดียวกัน

เมื่อมี 2 ค่าดังกล่าว มักจะให้มาแค่อย่างใดอย่างหนึ่ง เราสามารถแปลงค่าไป-กลับของทั้งสองข้างได้ด้วยวิธีคิดดังนี้

DWPD = TBW * 1024 / (Capacity * Warranty * 365)

SSD 120GB รับประกัน 5 ปี โดยให้ค่า TBW ไว้ที่ 70 แปลงเป็น DWPD จะได้ดังนี้

(70 * 1024) / (120 * 5 * 365)  = 0.3273059360730594 DWPD หรือประมาณ 0.33 DWPD

ส่วนบางรุ่นให้ DWPD มา เราก็แปลงเป็น TBW ได้ดังนี้

TBW = DWPD * Warranty * 365 * Capacity / 1,024

SSD 100GB รับประกัน 5 ปี โดยให้ค่า DWPD ไว้ที่ 10 แปลงเป็น TBW จะได้ดังนี้

10 * 5 * 365 * 100/1024 = 1,782.2265625 TBW หรือปประมาณ 1,782 TBW (1.78 PBW)

ซึ่งทั้งค่า TBW และ DWPD นั้นไม่ได้ระบุแบบคงตัวทั้งรุ่นนั้นๆ รวมๆ กัน แต่มักแยกตามความจุด้วย ดังตัวอย่าง Reliability Specifications  ของ Intel SSD DC S3500 และ Intel SSD DC S3700 ด้านล่าง ฉะนั้นต้องตรวจสอบให้ดีกว่าได้เท่าไหร่อย่างไรในแต่ละรุ่น

image

image

image

ซึ่งจากค่าดังกล่าวนี้ จะทำให้เห็นถึงความแตกต่างของ SSD แบบ consumer grade กับ enterprise grade จาก Endurance rating ได้ชัดเจนขึ้น และ consumer grade มักไม่ได้ให้ตัวเลขนี้มาใน Technical Specifications หรือให้มาก็มักจะแอบๆ ไว้ ตัวอย่างเช่น

  • Intel SSD 335 240 GB มีค่า TBW ที่ 21.4 (รับประกัน 5 ปี)
  • Intel SSD 530 240 GB มีค่า TBW ที่ 36.5 (รับประกัน 5 ปี)
  • Intel SSD DC S3500 240GB ทีค่า TBW ที่ 140 (รับประกัน 5 ปี)
  • Samsung SSD 840 Pro มีค่า TBW ที่ 73 (รับประกัน 5 ปี)
  • Samsung SSD 850 Pro มีค่า TBW ที่ 150 (รับประกัน 10 ปี)
  • Intel SSD DC S3700 200GB มีค่า TBW ที่ 3,650 TBW (3.65 PB) (รับประกัน 5 ปี)

และหากไปตรวจสอบราคาด้านบนจะเห็นว่าความจุพอๆ กัน แต่ราคาแต่ละรุ่นจะห่างกันเกือบเท่าตัวโดนวัดตาม TBW หรือ DWPD ที่สูงกว่าจะมีราคาแพงกว่า และแน่นอนว่า SSD พวก consumer grade ณ ตอนนี้อยู่ประมาณ 0.2 DWPD – 0.35 DWPD แล้วแต่รุ่นและราคา อย่างตัวที่เพิ่งออกมาและโฆษณาว่าทนทานมากในตลาด consumer grade อย่าง Samsung SSD 850 Pro หากเอามาเข้าสูตร DWPD แบบประกัน 5 ปีแล้วจะได้อยู่ที่ประมาณ 0.35 DWPD หรือ 0.175 DWPD หากคิดแบบประกัน 10 ปี ซึ่งถือว่าเป็น consumer grade ที่มี DWPD เทียบเท่า enterprise grade ในหลายๆ รุ่นเลย แต่แน่นอนว่าราคาก็ใกล้ๆ กันด้วย

ทำไมเราถึงสนใจตัวเลข DWPD และ TBW นัก หากเอามาใช้งานหนักๆ ผมขอนำข้อมูลเพิ่มเติมจากการใช้งานจริงของ Intel SSD 530 120 GB มีค่า TBW ที่ 36.5 โดย Intel รับประกัน 5 ปี มาฝาก ด้านล่างคือการตรวจสอบข้อมูลจาก SMART Details ของตัว SSD ซึ่งตัวนี้ใช้งานสุดโหดพอสมควร โดยตัวมันเองนั้นทำงาน 24×7 มาตลอดเกือบ 2 ปี โดยใช้กับงาน database อยู่ และใช้งานหนักระดับ 800 query/s โดยอ่าน-เขียนฐานข้อมูลหนักระดับ 100-300MB/s เป็นเวลาสิบกว่าชั่วโมงต่อวัน (ช่วง peak load) โดยระบุไว้เลยว่ามีเขียนไฟล์ไป 31.69 TB และอ่านไฟล์ไป 214.83TB แล้ว และเมื่ออาทิตย์ที่ผ่านมา SSD ตัวนี้เริ่มมีอาการเขียนไฟล์ลงไปได้ช้าลงจน I/O วิ่งช้าระดับ 80% และหยุดทำงานไปถึง 3 ครั้งในเวลา 7 วัน โดยไม่ทราบสาเหตุ

Capture3

โดยเมื่อตรวจสอบด้วย Intel Solid-State Drive Toolbox แล้วพบว่า SMART Summary ใกล้ Warning และ Eslimated Life Remaining เหลือไม่ถึง 25% แล้ว และแน่นอนว่า ณ ตอนนี้คงไม่เสี่ยงกับ 25% ที่เหลือ เพราะอาการออกหนักมากในตอนนี้ตามที่บอกไปข้างต้น

Capture4

Capture1 Capture2

จากตัวอย่างที่แสดงให้เห็น จะเห็นว่า แม้ว่า Totals LBAs Written จะยังไม่ครบตาม TBW ใน datasheet แต่หากใกล้มากๆ ระดับนี้ก็มีความเสี่ยงมากพอที่จะทำให้ SSD เกิดปัญหาได้แล้ว และตอนนี้ส่วนตัวก็เปลี่ยนมาใช้ Intel SSD DC S3500 ที่มี TBW ที่ 70 TB ซึ่งมากกว่าตัวเก่าเท่าตัว แต่แน่นอนว่าการเปลี่ยนครั้งนี้จะมีการปรับในอนาคตเป็นตัวที่ดีกว่านี้ คือ Intel SSD DC S3700 Series ที่มี TBW ที่ 1,875 TB หรือทนทานกว่ามาก (แต่ราคาก็แพงกว่าเท่าตัวอีกเช่นกัน) โดยผลจากการเปลี่ยนทำให้ I/O ที่วิ่งอยู่พุ่งขึ้นไป 80% นั้นลดต่ำลงเหลือ 5-10% เท่านั้น

สำหรับคำแนะนำคนที่อ่านถึง ณ ตอนนี้คือ ใครใช้ SSD ดูก็ลองเช็ค Totals LBAs Written จากใน SMART Details ของตัว SSD ว่ามีค่าเท่าไหร่เมื่อเทียบกับข้อมูล TBW ใน datasheet ของรุ่นที่ใช้อยู่ เผื่อจะได้เตรียมตัวเปลี่ยนหรือสำรองข้อมูลได้ทัน แต่แน่นอนว่า consumer grade อาจจะหายากหน่อย อันนี้ก็คงแล้วแต่ยี่ห้อ-รุ่นว่าจะกล้าบอกคนซื้อมากแค่ไหน แน่นอนว่าการใช้ของแต่ละคนไม่เท่ากัน บางคนไม่ได้อ่าน-เขียนไฟล์หนักๆ รุ่นถูกๆ มี Endurance Rating ไม่มาก ก็เพียงพอต่อความต้องการแล้ว แต่บางคนเอาไปใช้งานหนักๆ การดูเรื่องความทนทานผ่านค่า Endurance Rating ก็ช่วยให้มั่นใจในการใช้งานหนักๆ ได้มากขึ้น

ช่วง 2 อาทิตย์ที่ผ่านมา กับ SSD มีปัญหา

มีคนถามผมมาว่า ช่วง 2 อาทิตย์ที่ผ่านมาที่ SSD มีปัญหา ผมใช้หลักวิธี ติดตามปัญหา และสรุปปัญหายังไง ขอนำมาแชร์ให้ทราบ

  1. เช็ค S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) ของตัว SSD ว่ามีค่าต่างๆ เกินหรือมีค่าที่แปลกกว่าปรกติหรือไม่ ซึ่งตัวที่ผมเช็คว่ามีปัญหานั้น ในส่วนนี้ไม่มีอะไรผิดปรกติ จึงเช็คต่อในข้อที่ 2.
  2. สั่ง Surface test errors เพื่อเช็คข้อมูลทุกๆ cell data ของ SSD ซึ่งคล้ายๆ กับเช็ค track ของ HDD สรุปยังคงทำงานได้ปรกติดีไม่มีอะไรผิดพลาด หรือ bad cell ขึ้นมา เลยทำต่อในข้อที่ 3.
  3. สั่ง Erase ตัว SSD แล้วทำการติดตั้งระบบใหม่ แล้วลองใช้งานดูว่าเกิดอาการเดิมหรือไม่ ซึ่งมีอาการแปลกๆ แม้จะเพิ่งติดตั้งใหม่ โดย OS ที่นำมาติดตั้งนั้น ตัว media ใช้ checksum ตรงกับ source ของ Microsoft และแผ่นเป็นลิขสิทธิ์แท้ เลยติดตามปัญหาในข้อที่ 4. ต่อไป
  4. ปรกติอาการที่บ่งบอกว่า SSD เริ่มมีปัญหาคือ อยู่ๆ ไฟล์ก็เกิดปัญหา signature invalid หรือ checksum invalid ขึ้นมาแบบไม่ทราบสาเหตุ โดยการตรวจสอบคือใช้ System File Checker (sfc /scannow) ของ Windows เอง โดยตรวจสอบแล้วจะเจอ corrupt files ใน log และ repair ไม่ได้ ทำให้ไฟล์ระบบทั้งหมดมีปัญหา ซึ่งจะเกิด error ได้หลากหลายมาก อย่างที่ผมเจอคือ
    – อยู่ๆ activation services ไม่ทำงาน ทำให้ Windows deactivated แบบไม่ทราบสาเหตุ เช็คแล้วไฟล์เกิด signature invalid จนไม่สามารถทำงานได้ แม้แต่เรียก activation process มาเพื่อดู Installation ID ยังทำไม่ได้
    – เจอ Windows Search service ทำงานไปสักพัก tquery.dll โหลดไม่ขึ้น ทำให้ Search service ค้าง จน File Explorer พัง เพราะ checksum invalid
    – ไฟล์ mfmp4srcsnk.dll เกิด signature invalid ทำให้ File Explorer ปิดตัวเองลงเมื่อเปิด Folder ที่มีไฟล์วิดีโอเยอะๆ
    – อยู่ๆ ไฟล์ kernel ทั้งหมดระบบทั้งหมด ไม่สามารถเปิดหรือรันอะไรได้เลยหลังจากติดตั้ง
  5. จากข้อที่ 4. ใน Event Viewer จะมี log ที่ระบุ delayed write failed ที่ตัว SSD เกิดขึ้นในบางครั้ง
  6. ใช้ไปสักพักเกิดอาการ BSoD เกิดขึ้นอย่างไม่ทราบสาเหตุแม้จะไม่ได้เปิดอะไรหนักๆ หรือเปิดโปรแกรมเดิมๆ แม้จะเพิ่งติดตั้ง Windows ใหม่ๆ และเพิ่งติดตั้ง driver และ update ระบบครบแล้ว ซึ่งจากที่ตรวจสอบ สรุปได้จากข้อที่ 4. และ 5.

จากทั้งหมดที่ว่ามา 6. ข้อเป็นการตรวจสอบและข้อสังเกตุทั้งหมดที่เจอมาจนมั่นใจแน่ๆ ว่า SSD มีปัญหาในการใช้งาน เพราะแค่ BSoD เฉยๆ อาจจะไม่มีอะไรมาก แต่เกิดอาการ delayed write failed และไฟล์ระบบอยู่ๆ ก็พังใช้งานไม่ได้ อย่างไม่ทราบสาเหตุ ใช้ System File Checker แล้วก็ใช้งานและแก้ไขไม่ได้ ก็ต้องเริ่มตั้งธงแล้วว่า SSD มีปัญหาครับ

SSD กับงาน Database Server

ใช้ SSD Vertex 4 (SATA3 ทำงานบน SATA2) ขนาด 60GB ทั้งหมด 2 ตัวบน Production อยู่ 2 รอบบ ตัวแรกระบบ Frontend ทำงานตลอดเวลา 24 ชั่วโมงโหลดข้อมูลบน Database MySQL ขนาด transaction 30-100 queries/s แบบ ACID Model ตลอด (เป็น transaction เรื่องเงินเลยต้องมี locking ระดับ row ด้วย) แต่พังในเวลาประมาณ 3 เดือน และตอนนี้ SSD ตัวใหม่ก็ยังทำงานได้ดีอยู่ลุ้นๆ จะไปต่อได้แค่ไหน ส่วนอีกตัวทำงานมาแล้ว 6 เดือน ยังไม่มีปัญหาใดๆ ตัวนี้ทำงานที่ 500-600 queries/s แต่เป็น ISAM model ตลอด (ไม่มีการ locking ใดๆ) การทำใช้ SSD มาทำงานและแก้ไขปัญหาเรื่อง IOPS ของ database ช่วยให้งานที่อาจใช้เวลา 1-5 วินาที เสร็จสิ้นภายในเวลาหน่วย ms เท่านั้น ซึ่งคุ้มเสี่ยงที่จะใช้

คำถามคือระบบป้องกันทำอย่างไร? เพราะ SSD มีโอกาสเสียง่ายกว่า HHD อยู่แล้ว ซึ่งแก้ปัญหาด้วยการทำระบบด้านหลังอีกชุด โดยรัน VM ควบคู่ทั้งสองระบบ ซึ่งทำ Realtime backup แบบ Replication ที่ทำงานแบบ Event base ตลอดเวลาเพื่อคอย Backup ไว้อีกชุดและมีชุด VM อีกตัวทำหน้าที่ Daily backup แบบ Full Database อีก 1 ชุดสามารถรองรับการ downtime ได้ 99.9% per year ได้สบาย

โดยระบบเคย down เพราะ SSD พังและนำกลับมาอยู่ใน State ‘uptime’ ได้ในเวลาประมาณ 30 นาที ด้วยการกู้จาก Realtime backup มาใส่ในระบบที่ยังทำงานปรกติอีกระบบไปก่อน แล้วเข้าไปเปลี่ยน SSD ตัวใหม่เสร็จสิ้นใน 6 ชัวโมง (จากที่บอกไปด้านบน) อันนี้คือการแก้ไขปัญหานี้

ส่วนการแนวการแก้ไขปัญหาต่อไปในช่วงปีนี้ คือแผนการทำ HA ตัว Database Server เพิ่มเติม แต่ยัง LAB เรื่อง MySQL Cluster ว่าจะเอามาใช้อะไรได้บ้างและมีความเร็วเพียงพอหรือไม่ที่จะทำแบบนี้ หรือทำ RAID SSD ก็น่าสนใจเช่นกันคงต้อง LAB ต่อไปอีกสักพัก