কম্পিউটার

ওয়েব সার্চ ইঞ্জিন কি?


একটি ওয়েব সার্চ ইঞ্জিন হল একটি বিশেষ কম্পিউটার সার্ভার যা ওয়েবে ডেটা অনুসন্ধান করে। ব্যবহারকারীর প্রশ্নের অনুসন্ধানের ফলাফল একটি তালিকা হিসাবে পুনরুদ্ধার করা হয় (হিট হিসাবে পরিচিত)। হিটগুলির মধ্যে ওয়েব পৃষ্ঠা, ছবি এবং বিভিন্ন ধরনের ফাইল অন্তর্ভুক্ত থাকতে পারে৷

এছাড়াও বিভিন্ন সার্চ ইঞ্জিন সার্চ এবং রিটার্ন ডাটা পাবলিক ডাটাবেস বা ওপেন ডিরেক্টরিতে পাওয়া যায়। সার্চ ইঞ্জিনগুলি ওয়েব ডিরেক্টরিগুলির থেকে আলাদা যে ওয়েব ডিরেক্টরিগুলি মানব সম্পাদকদের দ্বারা সমর্থিত হয় যেখানে অনুসন্ধান ইঞ্জিনগুলি অ্যালগরিদমিকভাবে বা অ্যালগরিদমিক এবং মানব ইনপুটের সংমিশ্রণে কাজ করে৷

ওয়েব সার্চ ইঞ্জিন হল বড় ডেটা মাইনিং অ্যাপ্লিকেশন। সার্চ ইঞ্জিনের সমস্ত উপাদানে অনেকগুলি ডেটা মাইনিং কৌশল ব্যবহার করা হয়, ক্রল করা থেকে শুরু করে (যেমন, কোন পৃষ্ঠাগুলিকে ক্রল করা উচিত এবং ক্রল করার ফ্রিকোয়েন্সিগুলি নির্ধারণ করা), সূচীকরণ (যেমন, সূচীকরণের জন্য পৃষ্ঠাগুলি নির্বাচন করা এবং সূচকটি কতটা হওয়া উচিত তা নির্ধারণ করা) নির্মাণ করা হবে), এবং অনুসন্ধান করা (যেমন, পৃষ্ঠাগুলিকে কীভাবে র‌্যাঙ্ক করতে হবে, কোন বিজ্ঞাপনগুলি যোগ করতে হবে, এবং কীভাবে অনুসন্ধানের ফলাফলগুলি কাস্টমাইজ করা যায় বা "প্রসঙ্গ সচেতন" তৈরি করা যায় তা নির্ধারণ করা)।

তথ্য খনির জন্য অনুসন্ধান ইঞ্জিন পদ্ধতি বড় চ্যালেঞ্জ. প্রথমত, তাদের একটি বড় এবং ক্রমবর্ধমান পরিমাণ ডেটা পরিচালনা করতে হবে। সাধারণত, এই ধরনের ডেটা বিভিন্ন মেশিন ব্যবহার করে প্রক্রিয়া করা যায় না। পরিবর্তে, সার্চ ইঞ্জিনগুলিকে কম্পিউটার ক্লাউড ব্যবহার করতে হবে, যার মধ্যে হাজার হাজার বা এমনকি কয়েক হাজার কম্পিউটার রয়েছে যা সহযোগিতামূলকভাবে প্রচুর পরিমাণে তথ্য সংগ্রহ করে। কম্পিউটার ক্লাউড এবং উচ্চ বিতরণ করা ডেটা সেটের উপর ডেটা মাইনিং পদ্ধতির স্কেল করা গবেষণার জন্য একটি অ্যাপ্লিকেশন।

দ্বিতীয়ত, ওয়েব সার্চ ইঞ্জিনকে অনলাইন রেকর্ডের সাথে মোকাবিলা করতে হবে। একটি সার্চ ইঞ্জিন বড় ডেটা সেটে অফলাইনে একটি মডেল তৈরি করতে পারে। এটি একটি ক্যোয়ারী ক্লাসিফায়ার তৈরি করতে পারে যা ক্যোয়ারী বিষয়ের উপর ভিত্তি করে পূর্বনির্ধারিত উপাদানগুলিতে একটি অনুসন্ধান ক্যোয়ারী তৈরি করে। একটি মডেল অফলাইনে তৈরি করা হোক না কেন, মডেলের সফ্টওয়্যার অনলাইনে রিয়েল টাইমে ব্যবহারকারীর প্রশ্নের সমাধান করতে দ্রুত হওয়া উচিত৷

দ্রুত বর্ধিত ডেটা স্ট্রিমগুলিতে একটি মডেলকে সমর্থন করা এবং ক্রমবর্ধমানভাবে রিফ্রেশ করা আরেকটি চ্যালেঞ্জ রয়েছে। উদাহরণস্বরূপ, একটি ক্যোয়ারী ক্লাসিফায়ারকে ক্রমাগতভাবে ক্রমবর্ধমানভাবে রক্ষণাবেক্ষণের প্রয়োজন হতে পারে কারণ নতুন কোয়েরি বাড়তে থাকে এবং পূর্বনির্ধারিত উপাদান এবং ডেটা বিতরণ পরিবর্তন হতে পারে। কিছু বর্তমান মডেল প্রশিক্ষণ পদ্ধতি অফলাইন এবং স্ট্যাটিক এবং তাই এই পদ্ধতিতে ব্যবহার করা যাবে না।

তৃতীয়ত, ওয়েব সার্চ ইঞ্জিনগুলিকে এমন প্রশ্নের মোকাবিলা করতে হয় যেগুলিকে অল্প সংখ্যক বার জিজ্ঞাসা করা হয়। ধরুন একটি সার্চ ইঞ্জিন প্রসঙ্গ-সচেতন ক্যোয়ারী নির্দেশনা সমর্থন করতে হবে। যখন একজন ব্যবহারকারী একটি ক্যোয়ারী পোজ করেন, তখন সার্চ ইঞ্জিন গ্রাহক প্রোফাইল এবং তার ক্যোয়ারী ইতিহাস ব্যবহার করে একটি সেকেন্ডের একটি ছোট ভগ্নাংশের মধ্যে আরও কাস্টমাইজড উত্তর ফেরত দিয়ে কোয়েরির প্রেক্ষাপট অনুমান করার চেষ্টা করে।


  1. ওয়েব কন্টেন্ট মাইনিং কি?

  2. ওয়েব স্ট্রাকচার মাইনিং কি?

  3. স্ট্রিম কি?

  4. 11টি সেরা ডিপ ওয়েব সার্চ ইঞ্জিন যা খুঁজে বের করতে পারে না তা Google করতে পারে না