কম্পিউটার

ক্রমিক প্যাটার্ন মাইনিং কি?


অনুক্রমিক প্যাটার্ন মাইনিং হল প্যাটার্ন হিসাবে ঘন ঘন প্রদর্শিত সিরিজ ইভেন্ট বা পরবর্তী ঘটনাগুলির খনন। একটি অনুক্রমিক প্যাটার্নের একটি উদাহরণ হল যে ব্যবহারকারীরা একটি ক্যানন ডিজিটাল ক্যামেরা কিনেছেন তাদের এক মাসের মধ্যে একটি HP রঙিন প্রিন্টার কিনতে হবে৷

খুচরা তথ্যের জন্য, অনুক্রমিক নিদর্শনগুলি তাক বসানো এবং প্রচারের জন্য উপকারী। এই শিল্প, এবং টেলিযোগাযোগ এবং বিভিন্ন ব্যবসা, লক্ষ্যযুক্ত বিপণন, ব্যবহারকারী ধারণ এবং বিভিন্ন কাজের জন্য অনুক্রমিক নিদর্শন ব্যবহার করতে পারে৷

ওয়েব অ্যাক্সেস প্যাটার্ন বিশ্লেষণ, আবহাওয়ার পূর্বাভাস, উত্পাদন প্রক্রিয়া এবং ওয়েব অনুপ্রবেশ সনাক্তকরণের মতো ক্রমিক নিদর্শনগুলি ব্যবহার করা যেতে পারে এমন বেশ কয়েকটি ক্ষেত্র রয়েছে৷

সিকোয়েন্সের একটি সেট দেওয়া হয়েছে, যেখানে প্রতিটি সিকোয়েন্সে ইভেন্টের একটি ফাইল (বা উপাদান) অন্তর্ভুক্ত থাকে এবং প্রতিটি ইভেন্টে আইটেমগুলির একটি গোষ্ঠী অন্তর্ভুক্ত থাকে এবং ব্যবহারকারী-নির্দিষ্ট ন্যূনতম মিনিম সাপের থ্রেশহোল্ড দেওয়া থাকে, অনুক্রমিক প্যাটার্ন মাইনিং সমস্ত ঘন ঘন অনুসৃতি আবিষ্কার করে, যেমন, অনুক্রমের গোষ্ঠীতে যার সংঘটন ফ্রিকোয়েন্সি min_sup-এর চেয়ে কম নয়৷

যাক I ={I1 , আমি2 ,..., আমিp } সমস্ত আইটেম সেট হতে. একটি আইটেমসেট হল আইটেমের একটি খালি সেট। একটি ক্রম হল ঘটনাগুলির একটি আদেশকৃত সিরিজ। একটি ক্রম s নির্দেশিত হয় {e1 , e2 , e3 … el } যেখানে ইভেন্ট e1 e2 এর আগে উপস্থিত হয় , যা e3 এর আগে উপস্থিত হয় , ইত্যাদি ইভেন্ট ej s-এর উপাদান হিসেবেও পরিচিত।

ব্যবহারকারীর ক্রয়ের তথ্যের ক্ষেত্রে, একটি ইভেন্ট একটি শপিং ট্রিপকে সংজ্ঞায়িত করে যেখানে একজন গ্রাহক একটি নির্দিষ্ট দোকানে আইটেম ক্রয় করেন। ইভেন্টটি হল একটি আইটেমসেট, অর্থাৎ, ট্রিপের সময় গ্রাহক ক্রয় করা আইটেমগুলির একটি ক্রমবিহীন তালিকা৷ আইটেমসেট (বা ইভেন্ট) নির্দেশিত (x1 x2 ···xq ), যেখানে xk একটি আইটেম।

একটি আইটেম একটি ক্রম একটি ইভেন্টে শুধুমাত্র একবার প্রদর্শিত হতে পারে, কিন্তু একটি অনুক্রমের বিভিন্ন ইভেন্টে বেশ কয়েকবার প্রদর্শিত হতে পারে। একটি অনুক্রমের আইটেমের একাধিক দৃষ্টান্তকে ক্রমটির দৈর্ঘ্য বলা হয়। l দৈর্ঘ্য সহ একটি ক্রম l-ক্রম হিসাবে পরিচিত।

একটি সিকোয়েন্স ডাটাবেস, এস, টিপলের একটি গ্রুপ, (SID, s), যেখানে SID একটি sequence_ID এবং s একটি ক্রম। উদাহরণস্বরূপ, S স্টোরের সমস্ত ব্যবহারকারীদের জন্য সিকোয়েন্স অন্তর্ভুক্ত করে। একটি টিপল (SID, s) একটি ক্রম α অন্তর্ভুক্ত করে, যদি α হয় s-এর একটি অনুক্রম।

অনুক্রমিক প্যাটার্ন মাইনিংয়ের এই পর্যায়টি ব্যবহারকারী-শপিং সিকোয়েন্স বিশ্লেষণের একটি বিমূর্ততা। এই ধরনের রেকর্ডে অনুক্রমিক প্যাটার্ন মাইনিংয়ের জন্য মাপযোগ্য কৌশলগুলি নিম্নরূপ -

বেশ কিছু অনুক্রমিক প্যাটার্ন মাইনিং অ্যাপ্লিকেশন এই পর্যায়ের দ্বারা আচ্ছাদিত করা যাবে না. উদাহরণস্বরূপ, ওয়েব ক্লিকস্ট্রিম সিরিজ বিশ্লেষণ করার সময়, পরবর্তী ক্লিক কী হতে পারে তা অনুমান করার প্রয়োজন হলে ক্লিকগুলির মধ্যে ফাঁক থাকা অপরিহার্য হয়ে ওঠে৷

ডিএনএ সিকোয়েন্স বিশ্লেষণে, আনুমানিক প্যাটার্নগুলি সহায়ক হয়ে ওঠে কারণ ডিএনএ সিকোয়েন্সে (প্রতীক) সন্নিবেশ, মুছে ফেলা এবং মিউটেশন অন্তর্ভুক্ত থাকতে পারে। এই ধরনের বিভিন্ন প্রয়োজনীয়তাকে সীমাবদ্ধতা শিথিলকরণ বা প্রয়োগ হিসাবে বিবেচনা করা যেতে পারে।


  1. প্যাটার্ন মাইনিং এর অ্যাপ্লিকেশন কি?

  2. মাইনিং সিকোয়েন্স ডেটার প্রকারগুলি কী কী?

  3. স্প্যাটিওটেম্পোরাল ডেটা মাইনিং কি?

  4. C# 7.0 এ প্যাটার্ন ম্যাচিং কি?