কম্পিউটার

সংখ্যাসূচক ডেটার জন্য বিচক্ষণতা এবং ধারণা শ্রেণিবদ্ধকরণের কৌশলগুলি কী কী?


প্রযোজ্য ডেটা রেঞ্জের বিস্তৃত বৈচিত্র্য এবং ডেটা মানগুলির ঘন ঘন আপডেটের কারণে সংখ্যাসূচক বৈশিষ্ট্যগুলির জন্য ধারণা শ্রেণিবিন্যাস সংজ্ঞায়িত করা জটিল এবং শ্রমসাধ্য। সাংখ্যিক তথ্যের জন্য ধারণা শ্রেণিবিন্যাস তৈরির বিভিন্ন পদ্ধতি রয়েছে যা নিম্নরূপ -

বিনিং - বিনিং হল একটি টপ-ডাউন স্প্লিটিং কৌশল যা নির্দিষ্ট সংখ্যক বিনের উপর ভিত্তি করে। এই পদ্ধতিগুলি সংখ্যা হ্রাস এবং ধারণা শ্রেণিবিন্যাস প্রজন্মের জন্য বিচক্ষণ পদ্ধতি হিসাবেও ব্যবহৃত হয়। ধারণা শ্রেণীবিন্যাস করার জন্য এই কৌশলগুলি ফলাফল পার্টিশনে পুনরাবৃত্তিমূলকভাবে ব্যবহার করা যেতে পারে। বিনিং ক্লাস ডেটা ব্যবহার করে না এবং তাই এটি একটি তত্ত্বাবধানহীন বিচক্ষণ কৌশল। এটি ব্যবহারকারী-নির্দিষ্ট সংখ্যক বিন এবং বহিরাগতদের উপস্থিতির জন্য সংবেদনশীল।

হিস্টোগ্রাম বিশ্লেষণ − বিনিংয়ের মতো, হিস্টোগ্রাম বিশ্লেষণ হল একটি তত্ত্বাবধানহীন বিচক্ষণ কৌশল কারণ এটি শ্রেণী ডেটা ব্যবহার করে না। হিস্টোগ্রামগুলি একটি অ্যাট্রিবিউট, A-এর মানগুলিকে বালতি হিসাবে পরিচিত বিচ্ছিন্ন পরিসরে ভাগ করে। একটি সমান-প্রস্থ হিস্টোগ্রামে, উদাহরণস্বরূপ, মূল্যের জন্য মানগুলিকে সমান-আকারের পার্টিশন বা রেঞ্জে বিভক্ত করা হয়, যেখানে প্রতিটি বাকেটের প্রস্থ $10)। একটি সমান ফ্রিকোয়েন্সি হিস্টোগ্রামের সাথে, মানগুলিকে বিভক্ত করা হয় যাতে, প্রতিটি পার্টিশনে একই সংখ্যক ডেটা টিপল থাকে৷

হিস্টোগ্রাম বিশ্লেষণ অ্যালগরিদম প্রতিটি পার্টিশনে পুনরাবৃত্তিমূলকভাবে প্রয়োগ করা যেতে পারে যাতে স্বয়ংক্রিয়ভাবে একটি বহুস্তরীয় ধারণা শ্রেণিবিন্যাস তৈরি হয়, পূর্ব-নির্দিষ্ট সংখ্যক ধারণা স্তরে পৌঁছে গেলে পদ্ধতিটি শেষ হয়ে যায়।

পুনরাবৃত্ত পদ্ধতি নিয়ন্ত্রণ করতে একটি সর্বনিম্ন ব্যবধান আকার প্রতি স্তর ব্যবহার করা যেতে পারে। এটি একটি পার্টিশনের ন্যূনতম প্রস্থ বা প্রতিটি স্তরে প্রতিটি পার্টিশনের জন্য ন্যূনতম সংখ্যা নির্দিষ্ট করে৷

এনট্রপি-ভিত্তিক বিচক্ষণতা - এনট্রপি সাধারণত বিবেচ্যকরণ ব্যবস্থা ব্যবহার করা হয়। তথ্য তত্ত্ব এবং তথ্য লাভের ধারণার উপর তাদের অগ্রণী কাজে ক্লদ শ্যানন এটি প্রথম চালু করেছিলেন।

এনট্রপি-ভিত্তিক বিচক্ষণতা হল একটি তত্ত্বাবধানে, টপ-ডাউন স্প্লিটিং কৌশল। এটি তার গণনা এবং বিভাজন পয়েন্ট নির্ধারণে শ্রেণী বন্টন ডেটা অন্বেষণ করে (একটি অ্যাট্রিবিউট রেঞ্জ পার্টিশন করার জন্য ডেটা মান)।

ক্লাস্টার বিশ্লেষণ - ক্লাস্টার বিশ্লেষণ একটি জনপ্রিয় ডেটা বিচ্ছিন্নকরণ পদ্ধতি। একটি ক্লাস্টারিং অ্যালগরিদম A এর মানগুলিকে ক্লাস্টার বা গোষ্ঠীতে বিভক্ত করে একটি সংখ্যাসূচক বৈশিষ্ট্য, A, আলাদা করার জন্য প্রয়োগ করা যেতে পারে।

ক্লাস্টারিং A-এর বিতরণ, সেইসাথে ডেটা পয়েন্টের ঘনিষ্ঠতা বিবেচনা করে এবং তাই উচ্চ-মানের বিচক্ষণতার ফলাফল তৈরি করতে পারে। ক্লাস্টারিং একটি টপ-ডাউন স্প্লিটিং স্ট্র্যাটেজি অথবা বটম-আপ মার্জিং স্ট্র্যাটেজি অনুসরণ করে A-এর জন্য একটি কনসেপ্ট হায়ারার্কি তৈরি করতে ব্যবহার করা যেতে পারে, যেখানে প্রতিটি ক্লাস্টার কনসেপ্ট হায়ারার্কির একটি নোড গঠন করে।


  1. সনাক্তকরণের জন্য ব্যবহৃত বায়োমেট্রিক কৌশলগুলি কী কী?

  2. স্টেগানালিসিস এর কৌশল কি কি?

  3. স্টেগানোগ্রাফির সুবিধা এবং অসুবিধা কি?

  4. ডেটা এনক্রিপশনের কৌশলগুলি কী কী?