Desktop Search ศึกครั้งนี้ใหญ่หลวงนัก ตอนที่ 1

เป็นบทความที่ดองนานจนคาดว่าเน่าไปหลายรอบแล้ว แต่พอดีว่าวันนี้ค้นเจอ เลยเอามาปัดฝุ่นใหม่ และปรับปรุงเนื้อหาโดยส่วนใหญ่ให้ทันสมัยมากขึ้น ซึ่งน่าดีถ้าเอามาลงในเวลาแบบนี้ ;)

ทำความรู้จักกันก่อน

Desktop Search คือโปรแกรมที่เข้าไปเก็บข้อมูลภายในไฟล์ของเรา โดยมันจะวิ่งเข้าไปเก็บข้อมูลของไฟล์เราทุก ๆ ที่ โดยมันจะเก็บข้อมูลเท่าที่มันรู้จักและเรากำหนดขอบเขตการเก็บข้อมูลไว้ โดยสิ่งที่ปัจจุบันคนส่วนใหญ่นั้นมีไฟล์เอกสาร และไฟล์ข้อมูลต่าง ๆ มากมาย ทำให้การค้นหาไฟล์ที่เก็บไว้ในเครื่องไม่พบ หรือจำชื่อไฟล์ไม่ได้ซึ่งทำให้ต้องไล่หาไฟล์เหล่านั้นดังงมเข็มในทะเล หรือบางครั้งต้องมาเปิดหาทีละไฟล์ๆ เพื่อหาข้อมูลที่เราต้องการ ซึ่งเสียเวลาทำงานอย่างมาก การใช้ Desktop Search น่าจะเหมาะกับยุคที่ข้อมูลข่าวสารนั้นมีมากมายจนหาได้ยากยิ่ง โดยหลักการของ Desktop Search นั้นใช้หลักการเดียวกับระบบ Web Search โดยทั่วไป คือเข้าไปอ่านไฟล์ต่าง ๆ แล้วนำมาเก็บเป็นไฟล์ Index แยกต่างหาก โดยมีส่วนหลัก ๆ ภายในอยู่ 2 ส่วนคือ Keyword และ Document Path โดย Keyword คือคำใด ๆ ที่ได้จากการอ่านไฟล์ต่าง ๆ นำมาเชื่อมความสัมพันธ์กับที่อยู่ของไฟล์นั้น ๆ คล้าย ๆ กับดัชนีด้านหลังหนังสือวิชาการทั่วไปที่มักจะมีดัชนีเพื่ออ้างอิงเนื้อหาจากคำที่มักเป็นหัวข้อหลัก ๆ ภายในหนังสือเล่มนั้น ซึ่ง Desktop Search ก็ใช้หลักการเดียวกันนั้นเองด้วย (พวก Web Search Engine ก็ใช้แบบนี้เช่นกัน) ทำให้การค้นหาจาก Keyword ใด ๆ จะได้ที่อยู่ไฟล์นั้น ๆ ที่มี Keyword นั้น ๆ อยู่ด้วยมาแสดงให้เราทราบว่า Keyword ที่เราค้นหานั้นอยู่ในเอกสารใดบ้าง ซึ่งก็อย่างที่บอกไปแล้วว่า ไม่แตกต่างจากการค้นหา Web บน Internet แต่ประการใด หรือเหมือนกับยกโลก Internet มาใส่ลงในเครื่องเรา แต่เปลี่ยนจาก เราจะค้นหา Web ก็มาค้นหาเอกสารภายในเครื่องของเราแทนนั้นเอง

ศึกนี้ใหญ่หลวงนัก

ศึกการต่อสู้แย่งชิงตลาด Desktop Search ที่ถ้ามองมุมกว้าง ๆ แทบจะไม่มีอะไรที่ก่อกำไร หรือสร้างผลประโยชน์ต่อผู้ผลิตในการลงมาแข่งขันมากนัก แต่ถ้ามองให้ลึก ๆ ลงไปแล้วน่าจะเป็นเรื่องที่ยักษ์ใหญ่ด้านการค้นหาข้อมูลต่าง ๆ ต้องลงมาเพราะด้วยเหตุผลหลายประการด้วยกัน เช่น

เมื่อทุก ๆ อย่างสามารถหาได้ด้วยตัว Desktop Search ตัวนั้นได้มากขึ้นแล้ว แถมยังแม่นยำด้วยแล้ว ก็เหมือนศูนย์กลางการใช้งานของผู้ใช้ที่จะเข้ามาใช้งานต่าง ๆ มากมาย ยังผลให้การใช้งานส่วนอื่น ๆ ที่มีอยู่เช่น Shell ระบบขั้นพื้นฐาน เช่น Windows Explorer ก็แทบจะไม่มีความหมายในเชิงการใช้ค้นหาเอกสาร และไฟล์งานของเรา แถมด้วยความคุ้นเคย การทำงานต่าง ๆ ทำให้เกิดอุปนิสัยในการค้นหาที่เหมาะสมต่อผู้ให้บริหารค้นหาของค่ายนั้น ๆ ทำให้ยังผลต่อมาในเรื่องของการเข้าใช้งานในเว็บค้นหาของตนเองมากขึ้น ทำให้ยอดโฆษณามีมากขึ้นตามไปด้วย ดูตัวอย่างได้จากระบบค้นหาอย่าง Google ก็น่าจะเป็นตัวอย่างที่ดี
ทำให้ลดการเวลาในการเสียเวลาค้นหาจาก Folder ต่าง ๆ ใน Hard Drive ได้มากขึ้น ทำให้ให้เวลาในการทำงานต่อผู้ใช้ และมีเวลาในการเข้าถึงการทำงานใหม่ ๆ มากขึ้น นี่เป็นสิ่งที่ช่วยได้เยอะ แต่มีผลดีต่อผู้ผลิตคือ สร้าง Plug-in หรือ Add-on/in ในเชิงธุรกิจระดับสูง หรือองค์กร ได้ ซึ่งในตอนนี้ Windows Desktop Search และ Google Desktop Search ก็มีความสามารถอยู่แล้ว
ความเป็นเจ้าตลาด ทำให้เป็นตัวกำหนดรูปแบบ Logic การค้นหาได้ง่ายมากขึ้น
ผู้ใช้สะดวกสบายมากขึ้นการใช้ระบบ Operating System มีความง่ายตามด้วยได้ เมื่อง่ายมากขึ้นแล้ว ยิ่งไม่หนีไป Platform อื่น ๆ เพราะในเมื่อไฟล์เอกสาร และไฟล์งานต่าง ๆ หาง่าย ใช้คล่อง และบันทึกที่ไหนก็ได้ ยังไงก็หาเจอแล้ว ยิ่งทำให้การทำงาน ต่าง ๆ ก็ไม่ยากเหมือนเมื่อก่อนอีกต่อไป
ศักดิ์ศรี ความเป็นเจ้าตลาด เป็นเรืองที่กินไม่ได้ แต่เป็นหน้าเป็นตา ไม่ว่าจะเป็น Google, Yahoo, MSN, Copernic เป็นต้น ทำให้มันสอดคล้องกับข้อที่ 1 ในด้านการโฆษณาของตนเอง และความน่าเชื่อถือต่อตัวบริษัทด้วย (ทำให้หุ้นขึ้น หุๆๆๆ)

ต่อจากนี้เป็นเรื่องเล่าที่ได้ใช้ Copernic Desktop Search มากว่า 1 ปี, Google Desktop Search มา 2-3 เดือน และ Windows Desktop Search อีก 2 เดือน ผมจะสรุปให้เข้าใจง่าย ๆ และกระชับ เป็นส่วน ๆ ครับ

เครื่องที่ใช้งานคือ IBM Thinkpad R40 , PM 1.3; RAM 768MB; H/D 80GB 5,400rpm ขนาดข้อมูลใน H/D ที่ทำ Index มีประมาณ 40GB โดยประมาณ โดยมีไฟล์ทุกรูปแบบทั้ง Text, Audio, Video, ฯลฯ

Copernic Desktop Search 2.02

เป็น Desktop Search ที่ทำงานได้ดีมาก ๆ ใช้ทรัพยากรระบบต่ำ – เกือบปานกลาง และยังสามารถทำงานได้ตั้งแต่ Windows 98 ขึ้นไป

การทำงานนั้น มีการสร้าง Index Files โดยการ Search Indexing นั้นสามารถกำหนดการ Index ได้ว่าจะทำที่ Drive และ Folder ใดบาง ซึ่งกำหนดต่อไปได้อีกว่า จะค้นหาไฟล์ลักษณะไฟล์ใน Folder นั้น ๆ ได้อีกด้วย โดยไฟล์ Index ทั้งหมดนั้นถ้าทำการ Index ทั้งหมดเสร็จสิ้นแล้วนั้น จะได้ไฟล์ขนาด 800MB และใช้เวลาประมาณ 8 – 12 ชั่วโมงในการ Indexโดยขนาดไฟล์ Index นั้นจะแปรตามขนาดของเนื้อหาที่เราค้นหาในเครื่อง อย่างในเครื่องผมตอนนี้มีเนื้อหาต่าง ๆ ทั้ง E-Book และไฟล์ด้านการเขียนโปรแกรมทั้ง C, PHP, Ruby และไฟล์ Source Code ต่าง ๆ มากมาย รวม ๆ แล้วกว่า 40GB ใช้การทำ Index อยู่ 24 – 78 ชั่วโมง โดยได้ไฟล์ Index ขนาด 3 – 4GB ซึ่งใหญ่ได้ใจมาก และน่าจะเป็นจุดด่อยสำคัญสำหรับตัว Desktop Search ค่ายนี้ แต่ถึงไฟล์จะมีขนาดใหญ่แต่การแสดงผลการค้นหาก็ไม่ได้ลดความรวดเร็วลงมากนัก

ในส่วนการคุณสมบัติต่าง ๆ นั้นก็เช่น การไม่ทำ Index เมื่อทำงานบน Notebook ที่กำลังใช้ไฟจาก Battery อยู่, การกำหนดเวลาการ Index อย่างละเอียด การ Integrate เข้ากับ Internet Explorer และ Mozilla Firefox โดยทำตัวเองเป็น Tool Bar ด้านบน เข้าไป รวมถึงมี Deskbar อยู่บน Taskbar ด้วยทำให้การค้นหาสามารถทำได้อย่างสะดวก

ซึ่งรูปแบบการค้นหาไฟล์นั้น มีมากมายมากเช่น

ซอฟต์แวร์จัดการเอกสาร Office documents (Word documents, PowerPoint presentations, Excel worksheets), WordPerfect documents, Adobe Acrobat documents, HTML pages, Text files/RTF, and ASP, .C, .CPP, .CS, .CSV, .H, .INC, .INI, JAVA, .PAS, .XML, .XSL, GZ, HLP, RAR, SWF, TAR, VSD เป็นต้น และยังมีอีกมากที่ซอฟต์แวร์ที่กำหนดไว้ และเรายังสามารถกำหนดนามสกุลไฟล์เข้าไปเพิ่มเติมได้อีก แต่ที่ชอบที่สุดคือมันสามารถค้นหาไฟล์ OpenDocument Format ได้ดีที่สุดในกลุ่ม Desktop Search ของ Windows เพราะมีไม่กี่ยี่ห้อที่สนับสนุน และมักเป็น Plug-in ที่ทำออกมาได้ไม่ค่อยดีนัก แต่ Copernic ทำออกมาได้ดีมากและที่ได้ทดลองใช้ก็น่าจะดีที่สุดในตลาดแล้วในเวลานี้

ซอฟต์แวร์อีเมล Outlook 2000/XP/2003, Outlook Express 5.x/6.x, Eudora 5.0 และ Mozilla Thunderbird 1.0 ไฟล์เพลงก็มี MP3, OGG, WMA และ WAV

รูปภาพ Indexing metadata of EXIF, JPEG, GIF picture files

และไฟล์อื่น ๆ อีกมาก โดยมากมักเป็นไฟล์ที่เป็นมาตรฐานทั่วไป และมักใช้กับบ่อย ๆ อยู่แล้วกว่า 150 แบบ ซึ่งจากตัวเลขแล้วน่าจะรู้จักน้อยที่สุดกว่าทั้ง 3 ตัว แต่การค้นหากลับครอบคลุมผลได้ดีกว่ามาก ซึ่งก็น่าจะเกิดจากที่ไฟล์ที่ผู้ผลิตที่กำหนดให้ทำ Index ได้นั้นมักเป็นไฟล์ที่ได้รับการยอมรับจนเป็นมาตรฐานเสียส่วนใหญ่นั้นเอง

จากการใช้งานนั้น การค้นหาทำงานได้รวดเร็วมากที่สุดในทั้ง 3 ตัวที่ได้ใช้งานมาก แถมด้วยการกำหนดขอบเขตการค้นหาได้ยืดหยุนสูง แต่น้อยกว่า Windows Desktop Search และ Google Desktop Search เยอะทีเดียว เพราะทั้ง 2 ค่ายนั้นมี Plug-in เสริมที่โปรแกรมเมอร์ทั่วไปสามารถเขียนเพิ่มลงไปได้ ทำให้การค้นหานั้นสามารถเพิ่มคุณสมบัติของการเข้าไปเก็บข้อมูลภายในไฟล์ได้ลึกมากขึ้นกว่าสิ่งที่กำหนดมาตั้งแต่ต้น

ตัวหน้าจอการผลการค้นหานั้น ทำผ่าน Windows และ Deskbarของ Copernic Desktop Search เองเลย โดยไม่ต้องพึ่งพา Engine อื่น ๆ ของตัว Windows หน้าตาการใช้งาน และปรับแต่งอื่น ๆ ทำงานได้ง่าย แทบไม่ต้องเรียนรู้อะไรมากมายก็สามารถใช้งานได้ โดยการตั้งค่านั้นเริ่มต้นตั้งแต่ตอนที่เราติดตั้งโปรแกรมเสร็จสิ้นก็จะมี Wizard ให้เราสามารถตั้งค่าอย่างเป็นขั้นเป็นตอน และเมื่อการตั้งค่าเสร็จสิ้นก็แทบจะไม่ต้องยุ่งในการตั้งค่าอีก ถ้าไม่มีการเปลี่ยนแปลงในเชิงลึกกว่านั้น

โดยจุดเด่นที่น่าจะเป็นส่วนที่คนใช้โปรแกรม Open-Source ชอบก็คือสามารถเข้าไปทำ Index ข้อมูลภายในโปรแกรมอย่าง Firefox ได้ซึ่งเข้าไปเก็บข้อมูลได้ทั้ง Bookmark และ History ทำให้การค้นหาสามารถทำได้ที่จุดเดียว

ซึ่งการใช้งานพื้นที่ของหน่วยความจำโดยเริ่มการ Startup Process จะใช้ หน่วยความจำเริ่มต้นที่ 16MB – 32MB โดยประมาณ โดยมี Process และ Service เพียงแค่ 1 Process ในการทำงานเท่านั้น ซึ่งถือว่าการใช้หน่วยความจำพอ ๆ กับ WinAmp 5 หรือ iTunes 7.1 ซึ่งถือว่าเบามากเมื่อเทียบกับอีก 2 ตัวที่เหลือ

ตัว Desktop Search ตัวนี้เสียดาย ที่ไม่มีคุณสมบัติ Add-in (Plug-in) เพื่อเพิ่มส่วนขยายอื่น ๆ ในการปรับแต่งตัวซอฟต์แวร์ด้านอื่น ๆ เช่นการค้นหารูปแบบไฟล์อื่น ๆ ที่ไม่ได้กำหนดไว้ เป็นต้น ซึ่งน่าจะเป็นสิ่งที่น่าเสียดายของซอฟต์แวร์ตัวนี้

โปรดติดตามตอนต่อไปครับ ;) สำหรับ Google Desktop Search

3 thoughts on “Desktop Search ศึกครั้งนี้ใหญ่หลวงนัก ตอนที่ 1”

mokin

March 17, 2007 at 9:52 PM

avafind ดีสุด ลองสิฟอร์ด
Ford AntiTrust

March 18, 2007 at 11:57 PM

avafind นี่อยากจะลองนะ แต่ดูจากเว็บและ interface แล้วไม่ผ่านอย่างแรง เพราะไม่มีรายละเอียดว่ารองรับไฟล์ใดบ้างที่ละเอียดพอ แถมเสียเงินอีกต่างหาก -_-‘ โดยรวมนี่สู้ Copernic ไม่ได้ด้วยประการทั้งปวง
ZuZa

October 16, 2007 at 3:09 PM

Avafind เจ๋งกว่า Copernic เยอะ พิมชื่อทีออกมาหมด

Comments are closed.

Related Posts

3 thoughts on “Desktop Search ศึกครั้งนี้ใหญ่หลวงนัก ตอนที่ 1”