ช่วง 2 อาทิตย์ที่ผ่านมา กับ SSD มีปัญหา

มีคนถามผมมาว่า ช่วง 2 อาทิตย์ที่ผ่านมาที่ SSD มีปัญหา ผมใช้หลักวิธี ติดตามปัญหา และสรุปปัญหายังไง ขอนำมาแชร์ให้ทราบ

  1. เช็ค S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology) ของตัว SSD ว่ามีค่าต่างๆ เกินหรือมีค่าที่แปลกกว่าปรกติหรือไม่ ซึ่งตัวที่ผมเช็คว่ามีปัญหานั้น ในส่วนนี้ไม่มีอะไรผิดปรกติ จึงเช็คต่อในข้อที่ 2.
  2. สั่ง Surface test errors เพื่อเช็คข้อมูลทุกๆ cell data ของ SSD ซึ่งคล้ายๆ กับเช็ค track ของ HDD สรุปยังคงทำงานได้ปรกติดีไม่มีอะไรผิดพลาด หรือ bad cell ขึ้นมา เลยทำต่อในข้อที่ 3.
  3. สั่ง Erase ตัว SSD แล้วทำการติดตั้งระบบใหม่ แล้วลองใช้งานดูว่าเกิดอาการเดิมหรือไม่ ซึ่งมีอาการแปลกๆ แม้จะเพิ่งติดตั้งใหม่ โดย OS ที่นำมาติดตั้งนั้น ตัว media ใช้ checksum ตรงกับ source ของ Microsoft และแผ่นเป็นลิขสิทธิ์แท้ เลยติดตามปัญหาในข้อที่ 4. ต่อไป
  4. ปรกติอาการที่บ่งบอกว่า SSD เริ่มมีปัญหาคือ อยู่ๆ ไฟล์ก็เกิดปัญหา signature invalid หรือ checksum invalid ขึ้นมาแบบไม่ทราบสาเหตุ โดยการตรวจสอบคือใช้ System File Checker (sfc /scannow) ของ Windows เอง โดยตรวจสอบแล้วจะเจอ corrupt files ใน log และ repair ไม่ได้ ทำให้ไฟล์ระบบทั้งหมดมีปัญหา ซึ่งจะเกิด error ได้หลากหลายมาก อย่างที่ผมเจอคือ
    – อยู่ๆ activation services ไม่ทำงาน ทำให้ Windows deactivated แบบไม่ทราบสาเหตุ เช็คแล้วไฟล์เกิด signature invalid จนไม่สามารถทำงานได้ แม้แต่เรียก activation process มาเพื่อดู Installation ID ยังทำไม่ได้
    – เจอ Windows Search service ทำงานไปสักพัก tquery.dll โหลดไม่ขึ้น ทำให้ Search service ค้าง จน File Explorer พัง เพราะ checksum invalid
    – ไฟล์ mfmp4srcsnk.dll เกิด signature invalid ทำให้ File Explorer ปิดตัวเองลงเมื่อเปิด Folder ที่มีไฟล์วิดีโอเยอะๆ
    – อยู่ๆ ไฟล์ kernel ทั้งหมดระบบทั้งหมด ไม่สามารถเปิดหรือรันอะไรได้เลยหลังจากติดตั้ง
  5. จากข้อที่ 4. ใน Event Viewer จะมี log ที่ระบุ delayed write failed ที่ตัว SSD เกิดขึ้นในบางครั้ง
  6. ใช้ไปสักพักเกิดอาการ BSoD เกิดขึ้นอย่างไม่ทราบสาเหตุแม้จะไม่ได้เปิดอะไรหนักๆ หรือเปิดโปรแกรมเดิมๆ แม้จะเพิ่งติดตั้ง Windows ใหม่ๆ และเพิ่งติดตั้ง driver และ update ระบบครบแล้ว ซึ่งจากที่ตรวจสอบ สรุปได้จากข้อที่ 4. และ 5.

จากทั้งหมดที่ว่ามา 6. ข้อเป็นการตรวจสอบและข้อสังเกตุทั้งหมดที่เจอมาจนมั่นใจแน่ๆ ว่า SSD มีปัญหาในการใช้งาน เพราะแค่ BSoD เฉยๆ อาจจะไม่มีอะไรมาก แต่เกิดอาการ delayed write failed และไฟล์ระบบอยู่ๆ ก็พังใช้งานไม่ได้ อย่างไม่ทราบสาเหตุ ใช้ System File Checker แล้วก็ใช้งานและแก้ไขไม่ได้ ก็ต้องเริ่มตั้งธงแล้วว่า SSD มีปัญหาครับ

บางครั้ง RAID ก็ไม่ช่วยอะไร

คนส่วนใหญ่ที่ซื้อ Harddisk มาเพื่อเก็บข้อมูลต่างๆ และมีไม่น้อยที่ใส่ใจต่อการเก็บข้อมูลมากๆ ไม่อยากให้ข้อมูลหายก็มักจะซื้อแบบ RAID และนำมาทำเป็น RAID 1 (Mirror) เพื่อหวังว่าจะทำให้ข้อมูลของเรานั้นอยู่รอดปลอดภัยไปตราบนานเท่านาน

ก่อนอื่นเลยต้องบอกก่อนว่ามี RAID แบบเดียวเท่านั้นที่ไม่เกี่ยวกับการสำรองข้อมูลในเรื่องนี้เลยคือ RAID 0 (Strip) ซึ่งในตอนนี้คงไม่ได้พูดถึง (อย่าคิดว่าพูดถึงตัวนี้เด็ดขาด)

แต่ความเข้าใจเรื่องการสำรองข้อมูลด้วย RAID นั้นก็ไม่ได้ถูกต้องเสียทั้งหมด เพราะความเข้าใจผิดที่ว่า RAID คือการป้องกันและสำรองข้อมูลนั้น แท้จริงแล้ว RAID ช่วยในเรื่องของความผิดพลาดหรือความเสียหายทางด้าน Hardware เป็นหลัก ซึ่งหมายความว่า ระบบ Harddisk ที่ต่อบน RAID นั้นจะยังคงทำงานได้แม้ Harddisk บางส่วนในระบบนั้นเสียหายอยู่เท่านั้นและ Performance ต่างๆ จะตกลงด้วยซ้ำไปถ้ามี Harddisk ตัวใดเสีย หรือเกิดความผิดพลาดขึ้น (หรือมากเท่าที่ระบบ RAID ที่ Setup จะยอมรับได้) ซึ่งก็แน่นอนว่ายังพอที่จะทำงานและสำรองข้อมูลออกมาจากระบบต่อไปได้ แต่ยังไงก็ต้องนำ Harddisk ตัวใหม่ใส่กลับเข้าระบบเพื่อ Rebuild ใหม่

ซึ่งข้อควรระวังอันดับแรกและคนไม่ค่อยคิดคือ RAID Controller ก็มีสิทธิ์เสียได้เช่นกัน ซึ่ง Harddisk ทั้งระบบอาจจะไม่เสีย แต่ RAID Controller เสียแทนก็มีให้เห็นอยู่บ่อยครั้ง คราวนี้ก็เอาข้อมูลออกมาจากระบบไม่ได้ทั้งระบบเลย เพราะหัวใจสำคัญในการติดต่อมันอยู่ที่ Controller พวกนี้แหละ (ซึ่งในระบบใหญ่ๆ เท่านั้นที่มี RAID Controller อยู่ 2 ชุดเพื่อรองรับเหตุการณ์นี้)

ต่อมาคือเรื่องของ RAID ไม่ได้ช่วยกรณีมีการลบไฟล์หรือ Software มีปัญหาเลย ตัวอย่างที่มักไม่ค่อยเจอแต่ถ้าเจอก็ร้องกรี๊ดแน่ๆ คือการที่ File System พัง ซึ่งมักจะเจอบ่อยๆ ในกรณีที่ไฟดับและเครื่องคอมพิวเตอร์ดับทันที จนทำให้ Harddisk โดนไฟฟ้ากระชากเข้าระบบ (รวมไปถึงไฟฟ้าตก ไปเกิน ไปกระชากแบบไฟฟ้าไม่ดับด้วย) ทำให้การอ่านเขียน File Record บน File System เกิดความเสียหายแต่ถ้าตัว Journaling มันทำงานได้ดีก็จะ recovery ส่วนที่เสียหายกลับมาได้ แต่หนักกว่านั้นก็ได้เวลาลาบ้านเก่า ซึ่งทำให้ Harddisk เกิดอาการ RAW File System ไปเลย ซึ่งเป็นอาการที่เราไม่สามารถอ่านข้อมูล Harddisk/Partition นั้นๆ ได้เพราะตัว File Record หายหรือพัง ซึ่งการ recovery จาก RAW File System นั้นคือการ scan full drive ทั้งหมดเพื่อ build ตัว File Record ใหม่ทั้งหมด ซึ่งก็ใช้เวลานานมากๆ อย่างเช่น Harddisk ความจุ 2TB ก็ใช้เวลาประมาณ 24 ชั่วโมง บนความเร็ว Interface แบบ USB 3.0 (ความเร็ว B/W อยู่ที่ ~90-100MB/s) ถ้าเป็น USB 2.0 ก็คูณไปอีก 2-4 เท่า ความช้าหรือเร็วขึ้นอยู่กับความจุและความเร็วของ Interface ของ Harddisk ในการอ่าน/เขียนเป็นสำคัญ

สุดท้ายไม่มีระบบใดที่ดีไปกว่าการ Backup แบบหลาย copy บนอุปกรณ์หรือระบบมากกว่า 1 ระบบเสมอครับ ถ้าทำสำรองข้อมูลไว้หลายๆ สถานที่ก็คงดี แต่ก็…. (มีคนทำนะครับ)

ฝากไว้เหมือนเดิม

Backup พันวัน เอาไว้ใช้วันสำคัญวันเดียว … วันที่ข้อมูลมีปัญหา!!!

วิธีเก็บไฟล์รูปภาพให้อยู่กับเรานานๆ

โดยรวมผมจะแบ่งเป็น 2 ส่วน คือไฟล์ภาพแบบ JPEG/RAW File ที่ไม่ได้แต่งใดๆ จะเก็บตาม ปี/เดือน/วัน แล้วไล่ลำดับ Folder ไปเรื่อยๆ ตามวันที่ของไฟล์นั้นๆ (ตามรูปซ้ายล่าง)

สำหรับไฟล์รูปที่แต่งเรียบร้อยแล้ว ก็จะจัดเก็บตามแนวการถ่ายและหรือชื่อที่ทำให้เราจำได้ง่าย ใน Folder นี้ผมจะเปิด Indexing Services ไปด้วยเผื่อต้องการเรียงตามวันที่ก็ใช้ Windows Search จัดการเอา ส่วนจัดการ tag ก็ใช้ metadata จัดการค้นเอาจาก Index ของ Windows Search เอาก็ได้ แต่ปรกติมันจะช้า (นานๆ ใช้ที) ก็ใช้ตาม Folder ค้นจากชื่อที่เราจัดไว้เร็วกว่า ซึ่งเป็นข้อดีของการจัดไฟล์ไว้เป็นระบบไม่ต้องใช้ Search ช่วยในบางเรื่อง แถมเร็วกว่าถ้าเรารู้ตำแหน่งแน่นอน (ตามรูปด้านขวาล่าง)

2011-04-20_164740 2011-04-20_165320

ลำดับต่อมาเมื่อเราแบ่งได้แล้วว่าส่วนไหนใช้ทำงานอย่างเดียว และส่วนไหนใช้เก็บ (นานๆ ครั้งนำมาใช้หรือดู)

แต่แน่นอนเมื่อรูปเยอะขึ้นเราต้องแบ่งเพิ่มเติมขึ้นมาอีกว่าส่วนไหนทำอะไรบ้าง

  1. รูปที่ใช้ทำงานในปัจจุบัน
  2. ทำงานบ้างและต้องพกติดตัวไป
  3. ไม่พกไปไหนมาไหนแต่ยังต้องใช้ทำงาน
  4. เก็บไฟล์ไว้เมื่อส่งงานลูกค้าจบแล้ว
  5. ไฟล์ภาพส่วนตัวในความทรงจำต่างๆ ของเราเอง

จาก 5 ส่วนด้านบน จะมี HDD อยู่ 4 ตัวที่เกี่ยวข้อง

2011-11-22_222914

  • HDD – D: SATA Internal (100GB) สำหรับเก็บไฟล์ภาพที่ทำงานปัจจุบัน
  • HDD – E: SATA Ultrabay (250GB) สำหรับเก็บไฟล์ภาพที่ยังไม่ได้ใช้ทำงานแต่ต้องพกไปไหนมาไหนตลอดเผื่อต้องใช้
  • HDD – H: e-SATA (1TB) สำหรับเก็บไฟล์ภาพที่ทำงานอยู่ หรือไม่ได้ทำงานแล้วและไม่ได้ยุ่งเกี่ยวตลอดเวลา เช่นรูปที่ส่งลูกค้าไปแล้ว รูปที่แต่งแล้วและเก็บเป็น Porfolio ไว้
  • HDD – I : USB 2.0 (1TB) สำหรับเก็บไฟล์ภาพทั้งหมดจาก HDD D:, E: และ H: สำหรับ Backups เผื่อ HDD ทั้ง 3 ตัวด้านบนเสียหาย

โดยที่เราใช้การ Sync ผ่าน SyncToy แล้วตั้ง Pairs เป็น Synchronize ทั้งหมด

image

ไฟล์รูปทั้งหมดที่เก็บก็จะอยู่ในการดูแลตลอดเวลา

ดูจำนวนรูปและพื้นที่เก็บตั้งแต่ถ่ายรูปมา (ปี 2546 โน้นเลย) ไม่เคยทำรูปหายเพราะ Backup ตลอด ทำให้ทุกรูปยังอยู่ครบ ^^

2011-12-15_011658

ข้อควรระวังเวลานำเครื่องไปซ่อม

ในฐานะที่ส่วนตัวก็เคยเป็นช่างซ่อมคอมฯ มาก่อน จะทราบดีว่างานซ่อมของช่างซ่อมคอมฯ นั้นแข่งกันเวลาอย่างมาก แน่นอนว่าลูกค้าก็อยากได้เครื่องเร็วๆ กลับไปใช้งาน ช่างและร้านก็อยากได้จำนวณเครื่องเยอะๆ เพื่อรับเงินลูกค้า ความรวดเร็วจึงตรงไปตรงมา ทุกคน win-win แต่ …. ข้อมูลและปัญหามันต้องใช้เวลาแก้ไข เพราะฉะนั้น ก่อนนำเครื่องเข้าไปซ่อมสิ่งที่ควรทำก่อนเลยคือ …

สำรองข้อมูลสำคัญของคุณไว้ซะ!!!

ผมพูดจริง!!!

ศ. บริการ หรือร้านรับซ่อมเค้าไม่รู้หรอกครับว่าข้อมูลของคุณอันไหนจำเป็น อันไหนสำคัญ เค้าไม่สนใจข้อมูลของคุณว่ามีค่าแค่ไหน มีแต่คุณเท่านั้นที่รู้และทราบ เพราะฉะนั้น สำรองข้อมูลของคุณและนำไปไว้ในที่ที่ปลอดภัยเสียก่อนที่จะเอาไปซ่อม หรือแนะนำให้อ่าน แนวทางการ Backup ข้อมูล ควบคู่ไปด้วยครับ

อีกประเด็นคือ พวกข้อมูลที่ลับเฉพาะ ที่หลุดไม่ได้ควรเก็บหรือนำออกไปเสียให้หมดก่อนส่งซ่อม ความสอดรู้สอดเห็นของคนมันมีเยอะ แม้ช่างจะไม่ได้ว่างงานมานั่งไล่หาข้อมูลของคุณ แต่ถ้าเป็นรูปลับเฉพาะมันก็ไม่ยากที่จะเห็นเพราะ Thumbnail view for folders ของ OS สมัยใหม่มันโผล่มาให้เห็นทั้งๆ ที่ไม่ได้อยากให้ขึ้นอยู่เนืองๆ เพราะฉะนั้น ….

เก็บข้อมูลของคุณไว้ในที่ที่ปลอดภัยเสมอ และก่อนส่งซ่อมก็ลบๆ มันออกไปก่อนซะ
(จะด้วยวิธีการใดก็ว่ากันไป)

แนวทางการ Backup ข้อมูล (ฉบับปรับใหม่)

จาก แนวทางการ Backup ข้อมูล รอบนี้ปรับใหม่ เนื่องจากว่าได้ HDD 2TB ตัวใหม่มา ประกอบกับ Notebook ตัวใหม่ มันไม่มี port Firewire 400 มามีแต่ eSATA มาให้เลยต้องปรับใหม่เน้นใช้งานจริงเป็นหลัก

HDD 1TB ตัวประกอบเองด้วย Enclosure Smart Drive เป็นตัว Backup Data จาก Drive D:, G:, H: และ K: ในส่วนที่จำเป็นทั้งหมดมาใส่ที่ I: ส่วนของตัวทำงานอีกตัวคือ E: นั้นจะถูก Mirror Backup/Work ผ่าน H: ที่ทำงานบน eSATA อีกทีนึงเผื่อโยนงานไปเครื่องอื่นก็แค่เอาสาย eSATA ไปเสียบทำงานได้เลย

ส่วนไฟล์ทำงานบน Notebook อยู่ที่ Drive D: ถูกส่งเข้า I: เช่นกัน

จะเห็นว่า Drive I: รับบทหนักในเรื่องนี้ แต่เป็นการกระจายความเสี่ยงว่าถ้าไอ้ตัวนี้พัง ก็คือพังตัวเดียวเดียวแล้วจบไป ตัวอื่นพังก็มาเอาที่ตัวนี้ได้อยู่เช่นกัน อะไรแบบนั้น อนาคตคิดว่าจะทำ RAID 1 สำหรับ Drive I : ด้วย

สำหรับ Contents อื่นๆ ใน K: มีหลายส่วนไม่ได้ Backup จริงจัง เช่นพวก Software, MV ต่างๆ และไฟล์หนังที่ Rip ไว้ดู (ไม่อยากให้แผ่นแท้ที่ซื้อเป็นรอย) ก็เลยต้องใส่ในี้แทน กำลังมีแผนกับเรื่องนี้อยู่เหมือนกันอาจจะใช้ NAS แทน (เงิน!!!!)

ตอนนี้มุมมองตัว Media สำหรับ Backup คือเน้นรวม ศ. เพื่อการค้นหาและเรียกคืนที่ง่ายมากขึ้น และกระจายข้อมูลที่ใช้ไปหลายๆ แหล่งแทน

สรุปง่ายคือๆคือ

[E:] –> [H:]

[D:|G:|H:|K:] –> [I:]

การ Sync ข้อมูลต่างๆ ใช้การ Sync ด้วย SyncToy ทั้งหมด

สำหรับ Backup จาก Notebokk เข้า HDD Backup ใช้ Incrementals Chain Version บน Acronis True Image Home 2011

สำหรับ Versioning ใช้ OS จัดการแทน เสียพื้นที่ 5-8% ของพื้นที่ทั้งหมดของแต่ละ partition เพื่อทำ Versioning บน File System อีกเช่นเคย

2011-07-27_222947

ฝากไว้อีกครั้งครับ

Backup พันวัน เอาไว้ใช้วันสำคัญวันเดียว … วันที่ข้อมูลมีปัญหา!!!