সার্চ ইঞ্জিন কিভাবে কাজ করে তা জানা সার্চ ইঞ্জিন অপটিমাইজেশনের জন্য অত্যন্ত গুরুত্বপুর্ণ বিষয়। সার্চ ইঞ্জিন কাজ করার ধাপগুলো তিনটি.ভাগে ভাগ করা যায়
ক্রলিং :
ইন্টারনেটের কন্টেন্ট গুলো আবিষ্কার করা হয় ক্রলিং এর মাধ্যমে
ইনডেক্সিং :
কন্টেন্টগুলো বিশাল আকারের ডাটাবেসে জমা ও বিশ্লেষন করা হয়।
ফলাফল প্রদর্শন :
ব্যবহারকারীর অনুসন্ধানের উপর ভিত্তি করে প্রাসঙ্গিক ফলাফল প্রদর্শন করে।
ক্রলিং
সার্চ ইঞ্জিনের কাজ শুরু হয় ক্রলিং এর মাধ্যমে। ক্রলিং এর মাধ্যমে সম্পুর্ণ ওয়েবসাইটের একটি লিষ্ট তৈরী করা হয়। স্পাইডার বা রোবট ওয়েব পেজের টাইটেল, ছবি, কিওয়ার্ড, অন্য ওয়েবপেজের লিংক সবকিছুর তালিকা তৈরী করে। তবে আধুনিক ক্রলারগুলো সম্পুর্ণ ওয়েবপেজকেই তার স্মৃতিতে ধারণ করে এর সাথে অতিরিক্ত কিছু বিষয়ের উপর গুরুত্বপ্রদান করে যেমন পেজের লেআউট, বিজ্ঞাপনের স্থান, কোথায় লিংক ব্যবহার করা হয়েছে তা কি প্রবন্ধের মধ্যে নাকি ফুটারে অদৃশ্যভাবে ইত্যাদি ইত্যাদি । ক্রলার প্রতিনিয়ত ওয়েবসাইটকে স্ক্যান করে ফলে নতুন কোন পরিবর্তন আসা মাত্র তা স্বয়ংক্রিয়ভাবে আপডেট করে নেয়। ক্রলিং মুলত সাইটের পরিবর্তনের হার , রোবট টেক্সট ফাইলের গঠন ইত্যাদির উপর নির্ভর করে।
ইনডেক্সকরণ
ক্রলিং এ প্রাপ্ত ডাটা নিদির্ষ্ট ডাটাবেসে সংরক্ষনের প্রক্রিয়ায় ইনডেক্সিং। চিন্তা করুন, আপনি আপনার সকল বই এর একটি লিষ্ট তৈরী করেছেন তাদের লেখকের নাম কত পৃষ্ঠার বই ইত্যাদি ইত্যাদি। প্রতিটি বই এর লিস্ট তৈরীর জন্য
আপনাকে প্রতিটি বই পড়তে হয়েছে যাকে ক্রলিং
বলা যেতে পারে এবং সেই বই গুলোর লিষ্ট আপনি
যখন লিখে রাখেন সেটা হচ্ছে ইনডেক্সিং।
গুগলের বিশাল ডাটা সেন্টারে এই তথ্য সমুহ সংরক্ষণ
করা হয়। যেখানে হাজার হাজার পেটা বাইট ডাটা
সংরক্ষিত থাকে
ফলাফল প্রদর্শন
সার্চ ইঞ্জিনের এটিই সর্বশেষ ধাপ। সংরক্ষিত
ফলাফল সমুহকে ব্যবহারকারীর অনুসন্ধানের শব্দ
অনুসারে প্রাসঙ্গিক ফলাফল প্রদর্শন করে। সার্চ
ইঞ্জিনের এই ধাপটি অত্যন্ত জটিল কিন্তু ওয়েব
ডেভেলপার বা সার্চ ইঞ্জিন ব্যবহারকারীদের জন্য
সবচেয়ে গুরুত্বপুর্ণ।
দুটি সার্চ ইঞ্জিনের মধ্যে পার্থক্য গড়ে তুলে আই
ফলাফল প্রদর্শন পদ্ধিত । প্রত্যেকটি সার্চ ইঞ্জিনের
র্যাংকিং এর জন্য আলাদা আলাদা এলগরিদম আছে
যা প্রত্যেকটি সার্চ ইঞ্জিন গোপন রাখে।
গুগলের এই এলগরিদম তুলনামুলক ভাবে অন্য সার্চ
ইঞ্জিন সমুহ থেকে জটিল। গুগলের প্রায় ২০০ এর উপরে
বিষয় বিবেচনা করে কোন সাইটকে র্যাংকিং করে।
আপনাকে প্রতিটি বই পড়তে হয়েছে যাকে ক্রলিং
বলা যেতে পারে এবং সেই বই গুলোর লিষ্ট আপনি
যখন লিখে রাখেন সেটা হচ্ছে ইনডেক্সিং।
গুগলের বিশাল ডাটা সেন্টারে এই তথ্য সমুহ সংরক্ষণ
করা হয়। যেখানে হাজার হাজার পেটা বাইট ডাটা
সংরক্ষিত থাকে
ফলাফল প্রদর্শন
সার্চ ইঞ্জিনের এটিই সর্বশেষ ধাপ। সংরক্ষিত
ফলাফল সমুহকে ব্যবহারকারীর অনুসন্ধানের শব্দ
অনুসারে প্রাসঙ্গিক ফলাফল প্রদর্শন করে। সার্চ
ইঞ্জিনের এই ধাপটি অত্যন্ত জটিল কিন্তু ওয়েব
ডেভেলপার বা সার্চ ইঞ্জিন ব্যবহারকারীদের জন্য
সবচেয়ে গুরুত্বপুর্ণ।
দুটি সার্চ ইঞ্জিনের মধ্যে পার্থক্য গড়ে তুলে আই
ফলাফল প্রদর্শন পদ্ধিত । প্রত্যেকটি সার্চ ইঞ্জিনের
র্যাংকিং এর জন্য আলাদা আলাদা এলগরিদম আছে
যা প্রত্যেকটি সার্চ ইঞ্জিন গোপন রাখে।
গুগলের এই এলগরিদম তুলনামুলক ভাবে অন্য সার্চ
ইঞ্জিন সমুহ থেকে জটিল। গুগলের প্রায় ২০০ এর উপরে
বিষয় বিবেচনা করে কোন সাইটকে র্যাংকিং করে।
EmoticonEmoticon