কম্পিউটার

ডেটা সাধারণীকরণ এবং বিশ্লেষণাত্মক সাধারণীকরণের উদাহরণ কী?


ডেটা সাধারণীকরণ উচ্চ-স্তরের ধারণাগুলি (তরুণ, মধ্যবয়সী, এবং সিনিয়র সহ) তুলনামূলকভাবে নিম্ন-স্তরের মানগুলি (অ্যাট্রিবিউট বয়সের জন্য সংখ্যাসূচক মান সহ) প্রতিস্থাপন করে ডেটাকে সংক্ষিপ্ত করে। অতএব, এটি এমন একটি প্রক্রিয়া যা একটি ডাটাবেসের মধ্যে একটি তুলনামূলকভাবে নিম্ন ধারণাগত স্তর থেকে উচ্চতর ধারণাগত স্তরে টাস্ক-প্রাসঙ্গিক তথ্যের একটি বিশাল সেটকে বিমূর্ত করে।

বৃহৎ ডেটা সেটগুলির দক্ষ এবং নমনীয় সাধারণীকরণের জন্য নিম্নলিখিত দুটি পদ্ধতি রয়েছে -

OLAP পদ্ধতি − ডেটা কিউব প্রযুক্তিকে ডেটা গুদাম-ভিত্তিক, প্রাক-গণনা-ভিত্তিক, বস্তুগত দৃষ্টিভঙ্গি হিসাবে বিবেচনা করা যেতে পারে। এটি একটি OLAP বা ডেটা মাইনিং কোয়েরি প্রক্রিয়াকরণের জন্য সরানোর আগে অফলাইন একত্রীকরণ প্রয়োগ করে৷

অ্যাট্রিবিউট-ভিত্তিক আনয়ন পদ্ধতি - এটি একটি রিলেশনাল ডাটাবেস কোয়েরি-ভিত্তিক, সাধারণীকরণ-ভিত্তিক, অনলাইন ডেটা বিশ্লেষণ পদ্ধতি। অ্যাট্রিবিউট-ওরিয়েন্টেড ইনডাকশনে, প্রথমে, টাস্ক-প্রাসঙ্গিক তথ্য একটি রিলেশনাল ডাটাবেস ক্যোয়ারী ব্যবহার করে সংগ্রহ করা হয় এবং তারপরে ডেটার প্রাসঙ্গিক সংগ্রহে প্রতিটি অ্যাট্রিবিউটের একাধিক স্বতন্ত্র মানের পরীক্ষার ভিত্তিতে সাধারণীকরণ প্রয়োগ করা হয়।

সাধারণীকরণ বৈশিষ্ট্য অপসারণ দ্বারা প্রয়োগ করা হয়. অভিন্ন সাধারণীকৃত টিপলগুলিকে একত্রিত করে এবং তাদের নিজ নিজ গণনা জমা করে একত্রীকরণ কার্যকর করে, সাধারণীকৃত ডেটা সেটের আকার হ্রাস করে এবং ব্যবহারকারীদের সাথে ইন্টারেক্টিভ উপস্থাপনা।

অ্যাট্রিবিউট-ওরিয়েন্টেড ইনডাকশন পদ্ধতির মৌলিক নীতিগুলি -

  • ডেটা ফোকাসিং − ডেটা অবশ্যই টাস্ক-সম্পর্কিত হতে হবে, যেমন মাত্রা এবং ফলাফল হল আসল সম্পর্ক৷
  • অ্যাট্রিবিউট-রিমুভাল − এটি প্রাসঙ্গিক বৈশিষ্ট্যের সেট বেছে নিতে পারে বা A-এর জন্য নির্দিষ্ট মানের একটি বিশাল সেট থাকলে A-তে কোনো সাধারণীকরণ অপারেটর না থাকলে বা A-এর উচ্চ-স্তরের ধারণাগুলি অতিরিক্ত বৈশিষ্ট্যের পরিপ্রেক্ষিতে সংজ্ঞায়িত করা হয়।
  • অ্যাট্রিবিউট সাধারণীকরণ − যদি A-এর জন্য স্বতন্ত্র মানের একটি বিশাল সেট থাকে এবং A-তে সাধারণীকরণ অপারেটরের একটি সেট বিদ্যমান থাকে, তাহলে একটি অপারেটর নির্বাচন করুন এবং A-কে সাধারণীকরণ করুন।
  • বিশ্লেষণমূলক চরিত্রায়ন − এটি একটি পরিসংখ্যানগত পদ্ধতি যা তথ্য প্রিপ্রসেস করার জন্য অপ্রাসঙ্গিক বৈশিষ্ট্যগুলিকে ফিল্টার করতে বা প্রাসঙ্গিক বৈশিষ্ট্যকে র‌্যাঙ্ক করার জন্য। বৈশিষ্ট্যের প্রাসঙ্গিকতা বিশ্লেষণের পরিমাপগুলি অপ্রাসঙ্গিক বৈশিষ্ট্যগুলি বিশ্লেষণ করতে ব্যবহার করা যেতে পারে যা ধারণা বর্ণনা পদ্ধতি থেকে অননুমোদিত হতে পারে। শ্রেণী চরিত্রায়ন বা তুলনার মধ্যে এই প্রিপ্রসেসিং ধাপের অন্তর্ভুক্তি একটি বিশ্লেষণাত্মক চরিত্রায়ন হিসাবে সংজ্ঞায়িত করা হয়৷

অ্যাট্রিবিউট প্রাসঙ্গিকতা বিশ্লেষণের কারণ

বৈশিষ্ট্যের প্রাসঙ্গিকতা বিশ্লেষণের জন্য বেশ কয়েকটি কারণ রয়েছে যা নিম্নরূপ -

  • এটি নির্ধারণ করতে পারে কোন মাত্রা অন্তর্ভুক্ত করা উচিত।

  • এটি একটি উচ্চ স্তরের সাধারণীকরণ অর্জন করতে পারে।

  • এটি এমন বৈশিষ্ট্যের সংখ্যা হ্রাস করতে পারে যা আমাদের সহজেই প্যাটার্ন বুঝতে সহায়তা করে।

অ্যাট্রিবিউট প্রাসঙ্গিকতা বিশ্লেষণের পিছনে মূল ধারণাটি হল এমন কিছু পরিমাপ মূল্যায়ন করা যা একটি প্রদত্ত শ্রেণী বা পদ্ধতির সাথে সম্পর্কিত একটি বৈশিষ্ট্যের প্রাসঙ্গিকতা গণনা করতে পারে। এই ধরনের ব্যবস্থার মধ্যে তথ্য লাভ, অস্পষ্টতা, এবং পারস্পরিক সম্পর্ক সহগ জড়িত।


  1. বিজ্ঞান এবং প্রকৌশলে ডেটা মাইনিংয়ের ভূমিকা কী?

  2. ডেটা সুরক্ষা এবং ডেটা অখণ্ডতার মধ্যে পার্থক্য কী?

  3. স্টেগানোগ্রাফির সুবিধা এবং অসুবিধা কি?

  4. JSP-তে অ্যাকশন এলিমেন্টে আইডি এবং স্কোপ অ্যাট্রিবিউটের অর্থ কী?