কম্পিউটার

অ্যাট্রিবিউট সাবসেট নির্বাচনের মৌলিক পদ্ধতি কি?


অ্যাট্রিবিউট সাবসেট নির্বাচন অপ্রাসঙ্গিক বা অপ্রয়োজনীয় বৈশিষ্ট্য (বা মাত্রা) বাদ দিয়ে ডেটা সেটের আকার হ্রাস করে। অ্যাট্রিবিউট সাবসেট নির্বাচনের লক্ষ্য হল গুণাবলীর একটি ন্যূনতম সেট আবিষ্কার করা যাতে ডেটা ক্লাসের ফলাফল সম্ভাব্যতা বিতরণ সমস্ত বৈশিষ্ট্য ব্যবহার করে মূল বিতরণ অ্যাক্সেসের ক্ষেত্রে প্রযোজ্য হিসাবে কাছাকাছি হয়। বৈশিষ্ট্যের একটি হ্রাস সেটে ডেটা মাইনিং একটি অতিরিক্ত সুবিধা আছে. এটি আবিষ্কৃত প্যাটার্নগুলিতে ঘটতে থাকা একাধিক বৈশিষ্ট্যকে হ্রাস করে, প্যাটার্নগুলিকে বোঝার জন্য সহজতর তৈরি করে৷

n বৈশিষ্ট্যের জন্য, 2 n আছে সম্ভাব্য উপসেট। গুণাবলীর সর্বোত্তম উপসেটের জন্য একটি সম্পূর্ণ অনুসন্ধান অত্যন্ত ব্যয়বহুল হতে পারে, বিশেষ করে n এবং একাধিক ডেটা ক্লাস বৃদ্ধির কারণে। এইভাবে, হিউরিস্টিক পদ্ধতিগুলি যেগুলি একটি কম অনুসন্ধানের স্থান অন্বেষণ করে সেগুলি প্রায়শই অ্যাট্রিবিউট সাবসেট নির্বাচনের জন্য ব্যবহৃত হয়৷

এই পদ্ধতিগুলি সাধারণত লোভী হয় যে অ্যাট্রিবিউট স্পেসের মাধ্যমে অনুসন্ধান করার সময়, তারা সর্বদা তৈরি করে যা সেই সময়ে আরও ভাল পছন্দ বলে মনে হয়৷ তাদের কৌশল হল স্থানীয়ভাবে সর্বোত্তম পছন্দ করা এই আশায় যে এটি বিশ্বব্যাপী সর্বোত্তম সমাধানের দিকে নিয়ে যাবে। এই ধরনের লোভী পন্থাগুলি অনুশীলনে দক্ষ এবং একটি সর্বোত্তম সমাধান অনুমান করার কাছাকাছি আসতে পারে৷

সর্বোত্তম এবং সবচেয়ে খারাপ বৈশিষ্ট্যগুলি সাধারণত পরিসংখ্যানগত তাত্পর্যের পরীক্ষাগুলি ব্যবহার করে নির্ধারণ করা হয়, যা বিবেচনা করে যে বৈশিষ্ট্যগুলি একে অপরের থেকে পৃথক। শ্রেণীবিভাগের জন্য সিদ্ধান্ত গাছ তৈরিতে ব্যবহৃত তথ্য লাভের পরিমাপ সহ কিছু অন্যান্য বৈশিষ্ট্য মূল্যায়ন ব্যবস্থা ব্যবহার করা যেতে পারে।

অ্যাট্রিবিউট সাবসেট নির্বাচনের নিম্নলিখিত পদ্ধতি রয়েছে যা নিম্নরূপ -

  • ধাপে এগিয়ে নির্বাচন - প্রক্রিয়াটি হ্রাসকৃত সেট হিসাবে বৈশিষ্ট্যগুলির একটি শূন্য সেট দিয়ে শুরু হয়। মূল বৈশিষ্ট্যগুলির মধ্যে সেরাটি নির্ধারণ করা হয় এবং হ্রাসকৃত সেটে যোগ করা হয়। প্রতিটি পরবর্তী পুনরাবৃত্তি বা ধাপে, অবশিষ্ট মূল বৈশিষ্ট্যগুলির মধ্যে সেরাটি সেটটিতে ঢোকানো হয়৷

  • ধাপে পশ্চাৎপদ নির্মূল৷ - পদ্ধতিটি বৈশিষ্ট্যগুলির সম্পূর্ণ সেট দিয়ে শুরু হয়। প্রতিটি ধাপে, এটি সেটে থাকা সবচেয়ে খারাপ বৈশিষ্ট্যকে সরিয়ে দেয়।

  • আগামী নির্বাচন এবং পশ্চাদপদ নির্মূলের সমন্বয় − ধাপে ধাপে এগিয়ে নির্বাচন এবং পশ্চাদগামী নির্মূল পদ্ধতিগুলিকে সংযুক্ত করা যেতে পারে যাতে, প্রতিটি ধাপে, পদ্ধতিটি সেরা বৈশিষ্ট্যটি বেছে নেয় এবং অবশিষ্ট বৈশিষ্ট্যগুলির মধ্যে থেকে সবচেয়ে খারাপটিকে নির্মূল করে৷

  • ডিসিশন ট্রি ইনডাকশন − ID3, C4.5, এবং CART সহ ডিসিশন ট্রি অ্যালগরিদমগুলি মূলত শ্রেণীবিভাগের জন্য ডিজাইন করা হয়েছিল৷ ডিসিশন ট্রি ইনডাকশন একটি ফ্লোচার্ট-এর মতো কাঠামো তৈরি করে যেখানে প্রতিটি অভ্যন্তরীণ (নন-লিফ) নোড একটি বৈশিষ্ট্যের উপর একটি পরীক্ষা নির্দেশ করে, প্রতিটি শাখা পরীক্ষার ফলাফলের সাথে মিলে যায়, এবং প্রতিটি বহিরাগত (পাতা) নোড একটি শ্রেণির পূর্বাভাস নির্দেশ করে। প্রতিটি নোডে, অ্যালগরিদম পৃথক শ্রেণীতে ডেটা ভাগ করার জন্য "সেরা" বৈশিষ্ট্য বেছে নেয়।


  1. HTML5-এ ক্রস-অরিজিন অ্যাট্রিবিউটের ব্যবহার কী?

  2. জাভাস্ক্রিপ্টে _.union() পদ্ধতির গুরুত্ব কী?

  3. জাভাস্ক্রিপ্টে _.size() পদ্ধতির ব্যবহার কী?

  4. নোভালিডেট এবং ফর্মনোভালিডেট অ্যাট্রিবিউটের মধ্যে পার্থক্য কী?