এটি RIPPER নামে একটি বহুল ব্যবহৃত নিয়ম আনয়ন অ্যালগরিদম। এই অ্যালগরিদমটি বেশ কয়েকটি প্রশিক্ষণের উদাহরণের সাথে প্রায় রৈখিকভাবে স্কেল করে এবং ওভারলোডেড ক্লাস ডিস্ট্রিবিউশন সহ ডেটা সেট থেকে মডেল তৈরির জন্য বিশেষভাবে উপযুক্ত। RIPPER শোরগোল ডেটা সেটের সাথেও ভাল কাজ করে কারণ এটি মডেলের অতিরিক্ত ফিটিং প্রতিরোধ করতে একটি বৈধতা সেট ব্যবহার করে৷
RIPPER তার ডিফল্ট শ্রেণী হিসাবে সংখ্যাগরিষ্ঠ শ্রেণী নির্বাচন করে এবং সংখ্যালঘু শ্রেণী চিহ্নিত করার নিয়ম বোঝে। মাল্টিক্লাস সমস্যার জন্য, ক্লাসগুলি তাদের ফ্রিকোয়েন্সি অনুসারে সিরিজ।
যাক (y1 y2 ...yc ) অর্ডার করা ক্লাস হবে, যেখানে y1 সর্বনিম্ন ঘন ঘন ক্লাস এবং yc সবচেয়ে ঘন ঘন ক্লাস হয়. প্রথম পুনরাবৃত্তির সময়, দৃষ্টান্তগুলি যা y1 এর অন্তর্গত ইতিবাচক উদাহরণ হিসাবে আইবেল করা হয়, যখন অন্যান্য শ্রেণীর অন্তর্গত সেগুলিকে নেতিবাচক উদাহরণ হিসাবে লেবেল করা হয়৷
ক্রমিক আচ্ছাদন পদ্ধতিটি এমন নিয়ম তৈরি করতে ব্যবহার করা যেতে পারে যা ইতিবাচক এবং নেতিবাচক উদাহরণগুলির মধ্যে বৈষম্য করে। এর পরে, RIPPER নিয়মগুলিকে নির্যাস করে যা y2 কে আলাদা করে অন্যান্য বাকি ক্লাস থেকে। এই প্রক্রিয়াটি পুনরাবৃত্তি করা হয় যতক্ষণ না আমরা yc রেখেছি যেটিকে ডিফল্ট ক্লাস হিসেবে মনোনীত করা হয়।
RIPPER একটি নিয়ম বাড়ানোর জন্য একটি সাধারণ-থেকে-নির্দিষ্ট পদ্ধতি এবং FOIL-এর ডেটা লাভের পরিমাপ ব্যবহার করে নিয়মের পূর্ববর্তীতে ঢোকানোর জন্য সর্বোত্তম সংযোগ নির্বাচন করতে। যখন নিয়মটি নেতিবাচক দৃষ্টান্তগুলি কভার করতে শুরু করে তখন এটি সংযোজক সন্নিবেশ করা বন্ধ করে দেয়৷
বৈধকরণ সেটে এর বাস্তবায়নের উপর নির্ভর করে নতুন নিয়মটি ছাঁটাই করা হয়। ছাঁটাই করা প্রয়োজন কিনা তা নির্ধারণ করতে নিম্নলিখিত মেট্রিক গণনা করা হয় - (p-n)/(p+n), যেখানে p(n) হল নিয়ম দ্বারা আচ্ছাদিত বৈধতা সেটে ইতিবাচক (নেতিবাচক) উদাহরণের সংখ্যা৷
এই মেট্রিকটি একঘেয়েভাবে বৈধকরণ সেটে নিয়মের নির্ভুলতার সাথে সম্পর্কিত। ছাঁটাই করার পরে যদি মেট্রিকটি উন্নত করা হয়, তাই কনজেক্টটি বাদ দেওয়া হয়। নিয়মে ঢোকানো চূড়ান্ত সংযোগ থেকে শুরু করে ছাঁটাই সম্পন্ন হয়। উদাহরণস্বরূপ, একটি নিয়ম ABCD → y দেওয়া হয়েছে, RIPPER পরীক্ষা করে যে D প্রথমে ছাঁটাই করা উচিত কিনা, তারপরে CD, BCD, ইত্যাদি। যদিও প্রাথমিক নিয়মটি শুধুমাত্র ইতিবাচক দৃষ্টান্তগুলিকে কভার করে, ছাঁটাই করা নিয়মটি প্রশিক্ষণ সেটে বেশ কয়েকটি নেতিবাচক দৃষ্টান্ত কভার করতে পারে৷
একটি নিয়ম প্রণয়নের পর, নিয়ম দ্বারা আচ্ছাদিত কিছু ইতিবাচক এবং নেতিবাচক দৃষ্টান্ত মুছে ফেলা হয়। নিয়মটি তারপর রুলসসেটে যোগ করা হয় যতক্ষণ না এটি থামার শর্ত লঙ্ঘন না করে, যা ন্যূনতম বর্ণনা দৈর্ঘ্য নীতির উপর ভিত্তি করে।
যদি নতুন নিয়মটি ন্যূনতম d বিট দ্বারা সেট করা নিয়মের মোট উপস্থাপনা দৈর্ঘ্যকে উন্নত করে, তাহলে RIPPER তার নিয়ম সেটে নিয়ম সন্নিবেশ করা বন্ধ করে দেয় (ডিফল্টরূপে, d কে 64 বিট হিসাবে নির্বাচিত করা হয়)। RIPPER দ্বারা ব্যবহৃত আরেকটি স্টপিং শর্ত হল যে বৈধকরণ সেটে নিয়মের ত্রুটির হার 50% এর বেশি হওয়া উচিত নয়। RIPPER আরো অপ্টিমাইজেশান পদক্ষেপগুলি প্রয়োগ করে সিদ্ধান্ত নিতে যে নিয়ম সেটে থাকা বেশ কয়েকটি বিদ্যমান নিয়ম আরও বিকল্প নিয়ম দ্বারা পুনরুদ্ধার করা যায় কিনা৷