কম্পিউটার

ডেটা মাইনিংয়ে একক-অ্যাট্রিবিউট মূল্যায়নকারীরা কী?


একক-অ্যাট্রিবিউট মূল্যায়নকারীদের মধ্যে, এটি একটি র‌্যাঙ্ক করা তালিকা তৈরি করতে র‌্যাঙ্কার অনুসন্ধান পদ্ধতির সাহায্যে ব্যবহার করা যেতে পারে যেখান থেকে র‌্যাঙ্কার একটি প্রদত্ত নম্বর বাতিল করে। এটি RankSearch পদ্ধতিতেও ব্যবহৃত হয়।

রিলিফ অ্যাট্রিবিউট ইভাল উদাহরণ-ভিত্তিক - এটি এলোমেলোভাবে দৃষ্টান্তের নমুনা দেয় এবং সমান এবং একাধিক শ্রেণীর প্রতিবেশী দৃষ্টান্ত পরীক্ষা করে। এটি বিচ্ছিন্ন এবং ক্রমাগত ক্লাস ডেটাতে কাজ করে। পরামিতিগুলি নমুনার একাধিক দৃষ্টান্ত সংজ্ঞায়িত করে, বিভিন্ন প্রতিবেশীকে পরীক্ষা করতে হবে, দূরত্ব অনুসারে প্রতিবেশীদের ওজন করতে হবে কিনা এবং একটি সূচকীয় ফাংশন যা পরিচালনা করে যে দূরত্বের সাথে ক্রমবর্ধমান ওজন কীভাবে ক্ষয় হয়৷

ইনফোগেইন অ্যাট্রিবিউট ইভাল - এটি ক্লাস সম্পর্কিত তাদের তথ্য লাভের হিসাব করে গুণাবলী গণনা করে। এটি প্রথমে MDL-ভিত্তিক বিচক্ষণতা পদ্ধতি ব্যবহার করে সংখ্যাসূচক বৈশিষ্ট্যগুলিকে আলাদা করে। এই পদ্ধতিটি, নিম্নলিখিত তিনটি সহ, একটি স্বাধীন মান হিসাবে অনুপস্থিত বিবেচনা করতে পারে বা তাদের ফ্রিকোয়েন্সি অনুপাতে অন্যান্য মানের মধ্যে গণনা বিতরণ করতে পারে।

চি-স্কোয়ার্ড অ্যাট্রিবিউট ইভাল − এটি ক্লাস সম্পর্কিত চি-স্কোয়ার পরিসংখ্যান গণনা করে বৈশিষ্ট্যগুলি গণনা করে৷

লাভ-অনুপাত বৈশিষ্ট্য ইভাল − এটি ক্লাস সম্পর্কিত তাদের লাভের অনুপাত গণনা করে গুণাবলী গণনা করে।

সিমেট্রিকাল আনসার্ট-অ্যাট্রিবিউট ইভাল − এটি ক্লাস সম্পর্কিত তার প্রতিসম অনিশ্চয়তা গণনা করে একটি বৈশিষ্ট্য গণনা করে৷

OneRAttribute Eval - এর জন্য OneR ক্লাসিফায়ার দ্বারা গৃহীত পরিষ্কার নির্ভুলতা পরিমাপ প্রয়োজন। এটি গণনার জন্য প্রশিক্ষণের ডেটার প্রয়োজন হতে পারে, যেমন OneR করে, অথবা এটি অভ্যন্তরীণ ক্রস-ভ্যালিডেশন ব্যবহার করতে পারে - একাধিক ভাঁজ একটি পরামিতি। এটি OneR-এর সহজ বিচক্ষণ পদ্ধতি নির্বাচন করতে পারে - ন্যূনতম বালতির আকার একটি প্যারামিটার৷

এসভিএম-অ্যাট্রিবিউট ইভাল - এটি একটি রৈখিক সমর্থন ভেক্টর মেশিনের সাথে পুনরাবৃত্তিমূলক বৈশিষ্ট্য অপসারণ ব্যবহার করে গুণাবলী গণনা করে। গুণাগুণগুলি তাদের সহগগুলির আকারের উপর নির্ভর করে একে একে বেছে নেওয়া হয়, প্রত্যেকের পরে পুনরায় শিখতে হয়।

প্রকৃতপক্ষে, একটি অনুপাত ব্যবহার করা যেতে পারে যতক্ষণ না নির্দিষ্ট সংখ্যক গুণাবলী অবশিষ্ট থাকে, তারপরে নির্দিষ্ট-সংখ্যা পদ্ধতিতে স্যুইচ করে দ্রুত অনেকগুলি বৈশিষ্ট্য মুছে ফেলা হয় এবং তারপরে প্রতিটি অবশিষ্ট একটিকে আরও নিবিড়ভাবে বিবেচনা করে।

বিভিন্ন পরামিতি সমর্থন ভেক্টর মেশিনে প্রেরণ করা হয় - জটিলতা, এপিসিলন, সহনশীলতা এবং ব্যবহৃত ফিল্টারিং পদ্ধতি।

প্রধান উপাদান এবং সুপ্ত শব্দার্থ বিশ্লেষণ গুণাবলীর সেট রূপান্তরিত করে। প্রধান উপাদানগুলির ক্ষেত্রে, নতুন বৈশিষ্ট্যগুলিকে তাদের eigenvalue-এর ক্রম অনুসারে স্থান দেওয়া হয়। ঐচ্ছিকভাবে, প্রকরণের একটি প্রদত্ত অনুপাতের (ডিফল্টরূপে 95%) হিসাব করার জন্য পর্যাপ্ত eigenvectors নির্বাচন করে একটি উপসেট নির্বাচন করা হয়। পরিশেষে, হ্রাসকৃত ডেটাকে আবার আসল স্থানে রূপান্তরিত করা যেতে পারে।

সুপ্ত শব্দার্থ বিশ্লেষণ প্রশিক্ষণ ডেটাতে একটি একক মান পচন প্রয়োগ করে। একবচন মানের পচন প্রধান উপাদান বিশ্লেষণের সাথে সম্পর্কিত - উভয় দিকই উৎপন্ন করে যেগুলি মূল বৈশিষ্ট্যের মানের রৈখিক সংমিশ্রণ কিন্তু ভিন্ন যে এটি একটি ম্যাট্রিক্স থেকে গণনা করা হয় যেটি বৈশিষ্ট্যের পারস্পরিক সম্পর্ক বা কোভেরিয়েন্স ম্যাট্রিক্সের পরিবর্তে মূল ডেটা মান রয়েছে৷


  1. ডাটা মাইনিং এ OLAP টুল কি কি?

  2. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  3. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?

  4. একটি বৈশিষ্ট্য কি?