কম্পিউটার

RIPPER অ্যালগরিদম কি?


এটি RIPPER নামে একটি বহুল ব্যবহৃত নিয়ম আনয়ন অ্যালগরিদম। এই অ্যালগরিদমটি বেশ কয়েকটি প্রশিক্ষণের উদাহরণের সাথে প্রায় রৈখিকভাবে স্কেল করে এবং ওভারলোডেড ক্লাস ডিস্ট্রিবিউশন সহ ডেটা সেট থেকে মডেল তৈরির জন্য বিশেষভাবে উপযুক্ত। RIPPER শোরগোল ডেটা সেটের সাথেও ভাল কাজ করে কারণ এটি মডেলের অতিরিক্ত ফিটিং প্রতিরোধ করতে একটি বৈধতা সেট ব্যবহার করে৷

RIPPER তার ডিফল্ট শ্রেণী হিসাবে সংখ্যাগরিষ্ঠ শ্রেণী নির্বাচন করে এবং সংখ্যালঘু শ্রেণী চিহ্নিত করার নিয়ম বোঝে। মাল্টিক্লাস সমস্যার জন্য, ক্লাসগুলি তাদের ফ্রিকোয়েন্সি অনুসারে সিরিজ।

যাক (y1 y2 ...yc ) অর্ডার করা ক্লাস হবে, যেখানে y1 সর্বনিম্ন ঘন ঘন ক্লাস এবং yc সবচেয়ে ঘন ঘন ক্লাস হয়. প্রথম পুনরাবৃত্তির সময়, দৃষ্টান্তগুলি যা y1 এর অন্তর্গত ইতিবাচক উদাহরণ হিসাবে আইবেল করা হয়, যখন অন্যান্য শ্রেণীর অন্তর্গত সেগুলিকে নেতিবাচক উদাহরণ হিসাবে লেবেল করা হয়৷

ক্রমিক আচ্ছাদন পদ্ধতিটি এমন নিয়ম তৈরি করতে ব্যবহার করা যেতে পারে যা ইতিবাচক এবং নেতিবাচক উদাহরণগুলির মধ্যে বৈষম্য করে। এর পরে, RIPPER নিয়মগুলিকে নির্যাস করে যা y2 কে আলাদা করে অন্যান্য বাকি ক্লাস থেকে। এই প্রক্রিয়াটি পুনরাবৃত্তি করা হয় যতক্ষণ না আমরা yc রেখেছি যেটিকে ডিফল্ট ক্লাস হিসেবে মনোনীত করা হয়।

RIPPER একটি নিয়ম বাড়ানোর জন্য একটি সাধারণ-থেকে-নির্দিষ্ট পদ্ধতি এবং FOIL-এর ডেটা লাভের পরিমাপ ব্যবহার করে নিয়মের পূর্ববর্তীতে ঢোকানোর জন্য সর্বোত্তম সংযোগ নির্বাচন করতে। যখন নিয়মটি নেতিবাচক দৃষ্টান্তগুলি কভার করতে শুরু করে তখন এটি সংযোজক সন্নিবেশ করা বন্ধ করে দেয়৷

বৈধকরণ সেটে এর বাস্তবায়নের উপর নির্ভর করে নতুন নিয়মটি ছাঁটাই করা হয়। ছাঁটাই করা প্রয়োজন কিনা তা নির্ধারণ করতে নিম্নলিখিত মেট্রিক গণনা করা হয় - (p-n)/(p+n), যেখানে p(n) হল নিয়ম দ্বারা আচ্ছাদিত বৈধতা সেটে ইতিবাচক (নেতিবাচক) উদাহরণের সংখ্যা৷

এই মেট্রিকটি একঘেয়েভাবে বৈধকরণ সেটে নিয়মের নির্ভুলতার সাথে সম্পর্কিত। ছাঁটাই করার পরে যদি মেট্রিকটি উন্নত করা হয়, তাই কনজেক্টটি বাদ দেওয়া হয়। নিয়মে ঢোকানো চূড়ান্ত সংযোগ থেকে শুরু করে ছাঁটাই সম্পন্ন হয়। উদাহরণস্বরূপ, একটি নিয়ম ABCD → y দেওয়া হয়েছে, RIPPER পরীক্ষা করে যে D প্রথমে ছাঁটাই করা উচিত কিনা, তারপরে CD, BCD, ইত্যাদি। যদিও প্রাথমিক নিয়মটি শুধুমাত্র ইতিবাচক দৃষ্টান্তগুলিকে কভার করে, ছাঁটাই করা নিয়মটি প্রশিক্ষণ সেটে বেশ কয়েকটি নেতিবাচক দৃষ্টান্ত কভার করতে পারে৷

একটি নিয়ম প্রণয়নের পর, নিয়ম দ্বারা আচ্ছাদিত কিছু ইতিবাচক এবং নেতিবাচক দৃষ্টান্ত মুছে ফেলা হয়। নিয়মটি তারপর রুলসসেটে যোগ করা হয় যতক্ষণ না এটি থামার শর্ত লঙ্ঘন না করে, যা ন্যূনতম বর্ণনা দৈর্ঘ্য নীতির উপর ভিত্তি করে।

যদি নতুন নিয়মটি ন্যূনতম d বিট দ্বারা সেট করা নিয়মের মোট উপস্থাপনা দৈর্ঘ্যকে উন্নত করে, তাহলে RIPPER তার নিয়ম সেটে নিয়ম সন্নিবেশ করা বন্ধ করে দেয় (ডিফল্টরূপে, d কে 64 বিট হিসাবে নির্বাচিত করা হয়)। RIPPER দ্বারা ব্যবহৃত আরেকটি স্টপিং শর্ত হল যে বৈধকরণ সেটে নিয়মের ত্রুটির হার 50% এর বেশি হওয়া উচিত নয়। RIPPER আরো অপ্টিমাইজেশান পদক্ষেপগুলি প্রয়োগ করে সিদ্ধান্ত নিতে যে নিয়ম সেটে থাকা বেশ কয়েকটি বিদ্যমান নিয়ম আরও বিকল্প নিয়ম দ্বারা পুনরুদ্ধার করা যায় কিনা৷


  1. জনপ্রিয় এনক্রিপশন অ্যালগরিদম কি?

  2. তথ্য সুরক্ষায় SHA কী?

  3. ব্লোফিশ অ্যালগরিদমের অপারেশনগুলি কী কী?

  4. Blowfish এনক্রিপশন অ্যালগরিদম কি?