วันอาทิตย์ที่ 11 กันยายน พ.ศ. 2554

Search Engine




Search Engine คืออะไร







Search Engine คือเครื่องมือที่ใช้ในการรวบรวมดัชนีของเว็บเพจ หรือเว็บไซต์ในโลกนี้โดยใช้โปรแกรมตัวเล็กๆ ที่เราๆ ทุกคนอาจรู้จักในชื่อว่า Robot หรือ Spider นั่นเองครับ Search Engine มีการให้บริการที่ฟรีๆ อยู่สองลักษณะครับคือ

 1. การให้บริการทำดัชนีเว็บเพจและเว็บไซต์ด้วย Robot หรือ Spider เมื่อเว็บไซต์มีการอัพเดทเนื้อหาใหม่ๆ

 2. ให้บริการฟรีเครื่องมือค้นหาข้อมูลผ่านออนไลน์ (อันนี้คนใช้กันเยอะ)
      ในปัจจุบันนั้น Search Engine ถูกแบ่งแยกออกเป็นหลายๆ กลุ่มด้วยกันครับ แต่ที่เราๆ ท่านๆ รู้จักและใช้กันเป็นประจำเป็นจะเป็นกลุ่มที่ชื่อว่า “Crawler-Based Search Engines” เพราะเป็นกลุ่มที่มีการใช้ฐานข้อมูลและส่ง Spider หรือ Robot ไปทำการบันทึกข้อมูลหน้าเพจต่างๆ จากทั่วโลกเอามาจัดเก็บให้เป็นระเบียบและมีการจัดอันดับตามความเหมาะสมของเนื้อหานั้นๆ

      
 ข้อมูลที่ Spider หรือ Robot ทำสำเนานั้นจะได้รับการจัดเก็บเข้าสู่ระบบฐานข้อมูลขนาดใหญ่ ที่เีรียกว่า “Search Engine Index Server” เมื่อใดก็ตามที่มีคนค้นหาข้อมูลผ่านหน้าเว็บของ Search Engine ที่ให้บริการอย่างเช่น Google เจ้า Search Engine Index Server ก็จะทำการประมวลผลข้อมูลต่างๆ ที่ตนเองมีอยู่และแสดงผลออกมาให้ตรงตามความต้องการข้อมูลนั้น ๆ โดยวิเคราะห์จากความเหมาะสมของเนื้อหา และความสมบูรณ์ของเนื้อหา ซึ่งมีส่วนประกอบต่างๆ หลายอย่างด้วยกัน เช่น รูปแบบเนื้อหา Keywords และองค์ประกอบอื่นๆ ตามแต่ละที่นั้นกำหนดเอาไว้เพื่อวิเคราะห์ผล  
       

      ในกลุ่มนี้ก็ได้แก่ Google,Yahoo!,ฺBing (MSN Live) นั่นเองครับ ส่วนหน้าตาของ Search Engine ประเภทนี้นั้นก็แล้วแต่การออกแบบครับ และการวิเคราะห์ความแม่นยำในการนำแสดงเนื้อหาก็แตกต่างกันออกไป ขึ้นอยู่กับรูปแบบของการพัฒนาของแต่ละแห่ง เพราะทุกอย่างที่ให้บริการนั้นล้วนเป็นความลับต่อกันทั้งสิ้น ตรงส่วนนี้เองทำให้เราสามารถใช้บริการ การค้นหา ได้อย่างรวดเร็วและแม่นยำมากยิ่งขึ้น เพราะเกิดการแข่งขันการให้บริการครับ เอาหละเราไปดูหน้าตาของแต่ละที่กันครับเริ่มจากยักษ์ใหญ่แห่ง Search Engine อย่าง Google



Google Search Engine





Yahoo! Search Engine




Search Engine มี 3 ประเภท 
      โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยคะ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้

   ประเภทที่ 1 Crawler Based Search Engines

Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน


Crawler Based Search Engine  ได้แก่อะไรบ้าง จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่ Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog)  ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทำการค้นหาคำว่า “Search Engine คืออะไร” ผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกัน  




ประเภทที่ 2 Web Directory หรือ Blog Directory

       Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยกตัวอย่างดังนี้





ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory 

      1. ODP หรือ Dmoz ที่หลายๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วย (URL : http://www.dmoz.org )

   
 2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com ) 3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many



ประเภทที่ 3 Meta Search Engine

      

      Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
   

       ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.
   
  
     มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คืออะไร” คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำงานของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำหรับบทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่องประการใด หรือ ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้ทำการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สำหรับ ผู้ที่ทำการค้นคว้างข้อมูลต่าง ๆ เพื่อนำไปใช้งาน.








เว็บไซต์ www.siamguru.com แบ่งการค้นหาเป็น 4 รูปแบบคือ

ค้นหาเว็บไซต์ (Basic Search) เหมาะสำหรับผู้ที่ใช้อินเทอร์เน็ตทั่วๆ ไปที่ยังไม่มีความรู้มากนัก
ค้นหาเว็บไซต์แบบซูเปอรเสิร์ช (Super Search) เป็นบริการสืบค้นข้อมูลแบบมีเงื่อนไข สำหรับการค้นหาที่มีการเฉพาะเจาะจงมากยิ่งขึ้น
ค้นหาเพลง (Music Search) บริการค้นหาเพลง , เนื้อร้อง จากเว็บเพจต่างๆ โดยสามารถค้นหาได้จากชื่อเพลง ชื่อนักร้อง ชื่ออัลบั้ม หรือ คำร้องจากท่อนใดท่อนหนึ่งก็ได้
ค้นหารูปภาพ (Image Search) บริการค้นหา ภาพถ่าย ภาพกราฟฟิก ภาพการ์ตูน






1 ความคิดเห็น: