MBR এর বিভিন্ন উপাদান রয়েছে যা নিম্নরূপ -
প্রশিক্ষণ সেট নির্বাচন করা৷ − প্রশিক্ষণ সেটে 49,652টি খবর অন্তর্ভুক্ত ছিল, এই লক্ষ্যের জন্য সংবাদ পুনরুদ্ধার পরিষেবা দ্বারা সমর্থিত। এই গল্পগুলি প্রায় তিন মাসের খবর এবং প্রায় 100টি একাধিক সূত্র থেকে পাওয়া যায়৷
৷প্রতিটি গল্পে গড়ে 2,700টি শব্দ রয়েছে এবং এতে আটটি কোড তৈরি করা হয়েছে। প্রশিক্ষণ সেটটি বিশেষভাবে তৈরি করা হয়নি, তাই প্রশিক্ষণ সেটে কোডের ফ্রিকোয়েন্সি একটি বড় চুক্তিতে পরিবর্তিত হয়, সাধারণভাবে সংবাদের গল্পগুলিতে কোডের সম্পূর্ণ ফ্রিকোয়েন্সি অনুকরণ করে।
দূরত্ব ফাংশন নির্বাচন করা৷ - পরবর্তী ধাপ হল দূরত্ব ফাংশন নির্বাচন করা। এই পদ্ধতিতে, একটি দূরত্ব ফাংশন বিদ্যমান ছিল, এটি প্রাসঙ্গিক প্রতিক্রিয়া হিসাবে পরিচিত একটি ধারণার উপর নির্ভর করে যা তাদের অন্তর্ভুক্ত শব্দগুলির উপর ভিত্তি করে দুটি ফাইলের মিল গণনা করে। প্রাসঙ্গিক প্রতিক্রিয়া, যা সাইডবারে আরও সম্পূর্ণরূপে সংজ্ঞায়িত করা হয়েছে, অনুসন্ধানগুলিকে পরিমার্জিত করার একটি পদ্ধতি হিসাবে একটি প্রদত্ত নথির অনুরূপ ফাইলগুলি ফেরত দেওয়ার জন্য তৈরি করা হয়েছিল। একই ফাইল MBR এর জন্য ব্যবহৃত প্রতিবেশী।
কম্বিনেশন ফাংশন বেছে নেওয়া৷ - পরবর্তী সিদ্ধান্ত হল সমন্বয় ফাংশন। এটি খবরের জন্য শ্রেণিবিন্যাস কোড তৈরি করা হতে পারে যা বেশিরভাগ শ্রেণিবিন্যাসের সমস্যা থেকে আলাদা। কিছু শ্রেণীবিভাগ সমস্যা একক সেরা সমাধানের জন্য দেখছেন. কিন্তু খবরের গল্পে একাধিক কোড থাকতে পারে, এমনকি একই উপাদান থেকেও। এই সমস্যাগুলির সাথে এমবিআরকে মানিয়ে নেওয়ার ক্ষমতা এর নমনীয়তাকে হাইলাইট করে৷
সংমিশ্রণ ফাংশনের জন্য একটি ওজনযুক্ত সমষ্টি পদ্ধতির প্রয়োজন। যেহেতু সর্বাধিক দূরত্ব ছিল 1, ওজন সহজেই দূরত্বের এক বিয়োগ ছিল, তাই ওজনগুলি ছোট দূরত্বের প্রতিবেশীদের জন্য বড় এবং বড় দূরত্বের প্রতিবেশীদের জন্য ছোট হতে পারে৷
প্রতিবেশীদের সংখ্যা নির্বাচন করা৷ − তদন্তে 1 এবং 11 এর মধ্যে নিকটতম প্রতিবেশীর সংখ্যার মধ্যে বৈচিত্র্য রয়েছে। আরও প্রতিবেশীদের ব্যবহার করে সেরা ফলাফল পাওয়া যায়। কিন্তু এই কেস স্টাডিটি MBR-এর বিভিন্ন অ্যাপ্লিকেশন থেকে আলাদা কারণ এটি প্রতিটি গল্পের জন্য বিভিন্ন বিভাগ তৈরি করছে। সাধারণ সমস্যা হল শুধুমাত্র একটি পৃথক বিভাগ বা কোড তৈরি করা এবং কম প্রতিবেশীই সেরা ফলাফলের জন্য যথেষ্ট হবে৷
এটি কোডিং-এ MBR-এর কার্যকারিতা গণনা করতে পারে, সংবাদ পরিষেবার সম্পাদকদের একটি বোর্ড 200টি গল্পের জন্য, সম্পাদকদের দ্বারা বা MBR দ্বারা নির্ধারিত কিছু কোড পর্যালোচনা করে। প্যানেলের সংখ্যাগরিষ্ঠদের দ্বারা সম্মত কিছু কোড আছে যেগুলিকে "সঠিক" হিসাবে বিবেচনা করা হয়েছিল৷
৷মানব সম্পাদকদের দ্বারা প্রাথমিকভাবে তৈরি করা কোডগুলির সাথে "সঠিক" কোডগুলির তুলনা আকর্ষণীয় ছিল। প্রাথমিকভাবে গল্পের (মানুষের দ্বারা) তৈরি করা 88% কোড সঠিক ছিল কিন্তু মানব সম্পাদকরা ভুল করেছেন।