কম্পিউটার

গাছ ছাঁটাই করার পদ্ধতিগুলি কী কী?


ছাঁটাই হল সিদ্ধান্ত গাছের আকার হ্রাস করার পদ্ধতি। এটি গাছের আকার নির্ধারণ করে বা সামান্য শক্তি সমর্থন করে এমন গাছের জায়গাগুলিকে বাদ দিয়ে ওভারফিটিংয়ের ঝুঁকি কমাতে পারে। আওয়াজ বা বহিরাগতদের কারণে প্রশিক্ষণের তথ্যে অসামঞ্জস্যতা অনুসরণ করে এমন শাখাগুলি ছাঁটাই করে ছাঁটাই সমর্থন করে এবং গাছের সাধারণীকরণের দক্ষতা বাড়ায় এমন পদ্ধতিতে মূল গাছকে সমর্থন করে।

বিভিন্ন পদ্ধতি সাধারণত সর্বনিম্ন নির্ভরযোগ্য বিভাগগুলি মুছে ফেলার জন্য পরিসংখ্যানগত ব্যবস্থা ব্যবহার করে, যার ফলে প্রায়শই দ্রুত শ্রেণীবিভাগ হয় এবং স্বাধীন পরীক্ষার ডেটা সঠিকভাবে শ্রেণীবদ্ধ করার জন্য গাছের ক্ষমতার উন্নতি হয়।

গাছ ছাঁটাই করার দুটি পদ্ধতি রয়েছে যা নিম্নরূপ -

প্রি-প্রুনিং পদ্ধতি

প্রাক-ছাঁটাই পদ্ধতিতে, একটি গাছকে "ছাঁটাই" করা হয় তার নির্মাণের প্রথম দিকে পরিশ্রম করে (যেমন, প্রদত্ত নোডে প্রশিক্ষণের নমুনাগুলির উপসেটকে আরও ভাগ বা বিভাজন না করার সিদ্ধান্ত নেওয়ার মাধ্যমে)। থামলে, নোডটি একটি পাতায় পরিণত হয়। পাতাটি উপসেট নমুনার মধ্যে সবচেয়ে সাধারণ শ্রেণী বা সেই নমুনার সম্ভাব্যতা বন্টনকে প্রভাবিত করতে পারে।

একটি গাছ তৈরি করার সময়, পরিসংখ্যানগত তাত্পর্য, x2, তথ্য লাভ ইত্যাদি সহ পরিমাপগুলি একটি বিভাজনের উদারতা তৈরি করতে ব্যবহার করা যেতে পারে। যদি একটি নোডে নমুনাগুলিকে বিভাজন করার ফলে একটি বিভাজন হতে পারে যা পূর্ব-নির্দিষ্ট থ্রেশহোল্ডের নীচে হ্রাস পায়, তাহলে প্রদত্ত উপসেটের বিভাজন বন্ধ করা হয়। একটি উপযুক্ত থ্রেশহোল্ড নির্বাচন করতে সমস্যা আছে. উচ্চ থ্রেশহোল্ডের ফলে অতি সরলীকৃত গাছ হতে পারে, যখন কম থ্রেশহোল্ডের ফলে খুব কম সরলীকরণ হতে পারে।

ছাঁটাই-পরবর্তী পদ্ধতি

ছাঁটাই-পরবর্তী পদ্ধতি একটি "সম্পূর্ণভাবে বেড়ে ওঠা" গাছ থেকে শাখাগুলিকে সরিয়ে দেয়। একটি গাছের নোডের ডালপালা বাদ দিয়ে ছাঁটাই করা হয়। মূল্য জটিলতা ছাঁটাই অ্যালগরিদম হল ছাঁটাই-পরবর্তী পদ্ধতির একটি উদাহরণ। ছাঁটাই করা নোডটি একটি পাতায় পরিণত হয় এবং এটির পূর্ববর্তী শাখাগুলির মধ্যে সবচেয়ে সাধারণ শ্রেণী দ্বারা লেবেল করা হয়৷

গাছের প্রতিটি নন-লিফ নোডের জন্য, অ্যালগরিদম প্রত্যাশিত ত্রুটির হার গণনা করে যা সেই নোডের সাবট্রি ছোট করা হলে প্রদর্শিত হতে পারে। এরপরে, নোড ছাঁটাই না হলে প্রত্যাশিত ত্রুটির হার প্রতিটি শাখার জন্য ত্রুটির হার ব্যবহার করে গণনা করা হয়, প্রতিটি শাখা বরাবর পর্যবেক্ষণের মাত্রা অনুযায়ী ওজন দ্বারা সংযুক্ত করা হয়। যদি নোড ছাঁটাই একটি উচ্চ প্রত্যাশিত ত্রুটি হার বাড়ে, তারপর সাবট্রি সংরক্ষিত হয়. অতএব, এটি ছাঁটাই করা হয়।

ক্রমবর্ধমান ছাঁটাই করা গাছের একটি সেট তৈরি করার পরে, একটি স্বাধীন পরীক্ষার সেট প্রতিটি গাছের কার্যকারিতা অনুমান করতে পারে। প্রত্যাশিত ত্রুটি খরচ কমিয়ে দেয় এমন সিদ্ধান্ত গাছ পছন্দ করা হয়৷


  1. তথ্য নিরাপত্তা মডেলের পন্থা কি?

  2. টেক্সট স্টেগানোগ্রাফির জনপ্রিয় পদ্ধতিগুলি কী কী?

  3. সি টোকেন কি?

  4. C# এ মন্তব্য কি?