কম্পিউটার

আমরা কিভাবে ঘন ঘন আইটেম সেট খনি করতে পারি?


নির্বোধ পদ্ধতিতে, এটি ঘন ঘন আইটেমসেটের সম্পূর্ণ সেট খনি করতে পারে এবং তারপর প্রতিটি ঘন ঘন আইটেমসেটকে সরিয়ে দিতে পারে যা একটি সঠিক উপসেট এবং বর্তমান ঘন ঘন আইটেমসেটের মতো একই সমর্থন দিতে পারে।

এই পদ্ধতিটি 2 100 পেতে পারে −1 ঘন ঘন আইটেমসেট একটি দৈর্ঘ্য-100 ঘন ঘন আইটেমসেট পাওয়ার জন্য, এটি অপ্রয়োজনীয় আইটেমসেটগুলি সরানো শুরু করার আগে। একটি প্রস্তাবিত কৌশল হল খনির পর্যায়ে অবিকল বন্ধ হওয়া আইটেমসেটগুলি অনুসন্ধান করা। এটি খনির সময় বন্ধ আইটেমসেটগুলির পদ্ধতি সনাক্ত করার সাথে সাথে অনুসন্ধানের জায়গাটি ছাঁটাই করার জন্য আমাদের প্রয়োজন ছিল। বিভিন্ন ছাঁটাই কৌশল রয়েছে যার মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত রয়েছে -

আইটেম মার্জিং৷ - যদি একটি ঘন ঘন আইটেমসেট সহ প্রতিটি লেনদেন X-এ একটি আইটেমসেট Y অন্তর্ভুক্ত থাকে তবে Y-এর কিছু যথাযথ সুপারসেট না থাকে, তাই X ∪Y একটি ঘন ঘন বন্ধ আইটেমসেট গঠন করে এবং X সহ কিছু আইটেমসেট অনুসন্ধান করার প্রয়োজন নেই কিন্তু Y নেই৷

সাব-আইটেমসেট ছাঁটাই − যদি একটি ঘন ঘন আইটেমসেট X পূর্বে আবিষ্কৃত ঘন ঘন বন্ধ হওয়া আইটেমসেট Y এবং support_count(X) =support_count(Y) এর একটি উপযুক্ত উপসেট হয়, তাহলে সেট গণনা ট্রিতে X এবং X এর সমস্ত বংশধর ঘন ঘন বন্ধ হওয়া আইটেমসেট হতে পারে না এবং তাই হতে পারে ছাঁটাই।

আইটেম এড়িয়ে যাওয়া৷ − বদ্ধ আইটেমসেটগুলির গভীরতা-প্রথম খনির ক্ষেত্রে, প্রতিটি স্তরে, একটি শিরোনাম টেবিল এবং একটি প্রজেক্টেড ডাটাবেসের সাথে সম্পর্কিত একটি উপসর্গ আইটেমসেট X থাকতে পারে। যদি একটি স্থানীয় ঘন ঘন আইটেম p এর একাধিক স্তরে একাধিক শিরোনাম টেবিলে অনুরূপ সমর্থন থাকে, তবে এটি বড় স্তরে হেডার টেবিল থেকে নিরাপদে p ছাঁটাই করতে পারে৷

যখন একটি নতুন ঘন ঘন আইটেমসেট পরিবর্তন করা হয়, তখন দুটি ধরণের ক্লোজার চেকিং প্রয়োগ করা অপরিহার্য যা নিম্নরূপ -

  • সুপারসেট পরীক্ষা করা হচ্ছে − এটি পরীক্ষা করতে পারে যে এই নতুন ঘন ঘন আইটেমসেটটি অনুরূপ সমর্থন সহ পূর্বে পাওয়া কিছু বন্ধ আইটেমসেটের সুপারসেট কিনা৷

  • সাবসেট চেকিং − এটি পরীক্ষা করতে পারে যে নতুন আবিষ্কৃত আইটেমসেটটি অনুরূপ সমর্থন সহ পূর্বে পাওয়া বন্ধ হওয়া আইটেমসেটের একটি উপসেট কিনা৷

এটি একটি বিভক্ত এবং জয়ী কাঠামোর অধীনে আইটেম মার্জিং প্রুনিং কৌশলগুলি গ্রহণ করতে পারে, তারপরে সুপারসেট পরীক্ষাটি আসলে অন্তর্নির্মিত এবং সুপারসেট চেকিংকে স্পষ্টভাবে প্রয়োগ করার প্রয়োজন নেই। এর কারণ হল যদি একটি ঘন ঘন আইটেমসেট X∪Y আইটেমসেট X-এর পরে আবিষ্কৃত হয় এবং X-এর মতো অনুরূপ সমর্থন বহন করে, তাহলে এটি X-এর প্রজেক্ট করা ডাটাবেসে থাকা উচিত এবং আইটেমসেট মার্জ করার সময় উত্পাদিত হওয়া উচিত।

এটি উপসেট পরীক্ষায় সাহায্য করতে পারে, খনন করা বন্ধ আইটেমসেটগুলির সেটকে সমর্থন করার জন্য একটি সংকুচিত প্যাটার্ন-ট্রি তৈরি করা যেতে পারে। প্যাটার্ন-ট্রিটি এফপি-ট্রির মেকানিজমের ক্ষেত্রে একই, আবিষ্কৃত সমস্ত বন্ধ আইটেমসেটগুলি সংশ্লিষ্ট গাছের শাখাগুলিতে স্পষ্টভাবে সংরক্ষিত হয়।


  1. আমি কিভাবে Windows 10 এ সাহায্য পেতে পারি?

  2. কীভাবে একটি বন্ধ ট্যাব পুনরায় খুলবেন

  3. আমি কীভাবে আমার ডেটা ব্যাকআপ করতে পারি?

  4. কিভাবে একটি অ্যান্টিভাইরাস পিসির গতি বাড়াতে পারে?