কম্পিউটার

খনন পদ্ধতির বিভিন্ন দিক কি কি?


খনির পদ্ধতির বিভিন্ন দিক রয়েছে যা নিম্নরূপ -

বিভিন্ন এবং নতুন ধরনের জ্ঞান খনি − ডেটা মাইনিং ডেটা বিশ্লেষণ এবং জ্ঞান আবিষ্কার পরিষেবাগুলির একটি বিস্তৃত বর্ণালীকে কভার করে, ডেটা চরিত্রায়ন এবং বৈষম্য থেকে সম্পর্ক এবং পারস্পরিক সম্পর্ক বিশ্লেষণ, শ্রেণীবিভাগ, রিগ্রেশন, ক্লাস্টারিং, আউটলিয়ার পদ্ধতি, ক্রম পদ্ধতি এবং প্রবণতা এবং গণনাগত বিশ্লেষণ।

এই পরিষেবাগুলি একাধিক উপায়ে একই ডাটাবেস ব্যবহার করতে পারে এবং বিভিন্ন ডেটা মাইনিং কৌশলগুলির বিকাশের প্রয়োজন। সফ্টওয়্যারের বৈচিত্র্যের কারণে, নতুন মাইনিং পরিষেবাগুলি আবির্ভূত হতে থাকে, ডেটা মাইনিং একটি শক্তিশালী এবং দ্রুত-বর্ধমান ক্ষেত্র তৈরি করে৷

উদাহরণস্বরূপ, ডেটা নেটওয়ার্কগুলিতে কার্যকর জ্ঞান আবিষ্কারের জন্য, সমন্বিত ক্লাস্টারিং এবং র‌্যাঙ্কিং উচ্চ মানের ক্লাস্টার এবং উচ্চ নেটওয়ার্কগুলিতে অবজেক্ট র‌্যাঙ্ক খুঁজে পেতে পারে৷

মাল্টিডাইমেনশনাল স্পেসে মাইনিং জ্ঞান - উচ্চ ডেটা সেটে জ্ঞানের জন্য অনুসন্ধান করার সময়, এটি বহুমাত্রিক স্থানের তথ্য বিশ্লেষণ করতে পারে। এটি বিমূর্তকরণের বিভিন্ন স্তরে মাত্রার (গুণাবলী) সেটগুলির মধ্যে আকর্ষণীয় নিদর্শনগুলি অনুসন্ধান করতে পারে। এই ধরনের খনির একটি (অন্বেষণমূলক) বহুমাত্রিক ডেটা মাইনিং বলা হয়।

অনেক ক্ষেত্রে, ডেটা সংগ্রহ করা যেতে পারে বা বহুমাত্রিক ডেটা কিউব হিসাবে বিবেচনা করা যেতে পারে। কিউব এলাকায় খনির জ্ঞান ডেটা মাইনিংয়ের শক্তি এবং অভিযোজনযোগ্যতা বাড়াতে পারে।

ডেটা মাইনিং—একটি আন্তঃবিভাগীয় প্রচেষ্টা - বিভিন্ন শাখা থেকে নতুন কৌশল একত্রিত করে ডেটা মাইনিংয়ের শক্তি উন্নত করা যেতে পারে। উদাহরণস্বরূপ, এটি প্রাকৃতিক ভাষার পাঠ্যের সাথে রেকর্ডগুলি খনি করতে পারে, এটি ডেটা পুনরুদ্ধার এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণের পদ্ধতিগুলির সাথে ডেটা মাইনিং পদ্ধতির ফিউজ করার অনুভূতি তৈরি করে৷

নেটওয়ার্কযুক্ত পরিবেশে আবিষ্কারের শক্তি বৃদ্ধি করা − কিছু ডেটা অবজেক্ট একটি সংযুক্ত বা আন্তঃসংযুক্ত পরিবেশে থাকে, তা ওয়েব, ডাটাবেস অ্যাসোসিয়েশন, ফাইল বা রেকর্ড যাই হোক না কেন। বিভিন্ন ডেটা অবজেক্ট জুড়ে শব্দার্থিক সংযোগ ডেটা মাইনিংয়ে সুবিধার জন্য ব্যবহার করা যেতে পারে। বস্তুর একটি সেটে পরিবর্তিত জ্ঞান একটি "সম্পর্কিত" বা শব্দার্থগতভাবে বস্তুর সংযোগ গোষ্ঠীতে জ্ঞানের আবিষ্কার বাড়ানোর জন্য ব্যবহার করা যেতে পারে।

অনিশ্চয়তা, গোলমাল বা ডেটার অসম্পূর্ণতা পরিচালনা করা − ডেটা গোলমাল, ত্রুটি, ব্যতিক্রম, বা অস্পষ্টতা, বা অসম্পূর্ণ অন্তর্ভুক্ত। ত্রুটি এবং গোলমাল ডেটা মাইনিং ফেজকে বিভ্রান্ত করতে পারে, যা ভুল ডিজাইনের উদ্ভবের দিকে পরিচালিত করে। ডেটা ক্লিনিং, ডেটা প্রিপ্রসেসিং, বাহ্যিক সনাক্তকরণ এবং অপসারণ, এবং অস্পষ্টতা যুক্তি হল পদ্ধতিগুলির একটি উদাহরণ যা ডেটা মাইনিং প্রক্রিয়ার সাথে একীভূত হতে হবে৷

প্যাটার্ন মূল্যায়ন এবং প্যাটার্ন- বা বাধা-নির্দেশিত মাইনিং − এটা নয় যে ডেটা মাইনিং প্রক্রিয়া দ্বারা উত্পাদিত কিছু নিদর্শন আকর্ষণীয়। এটি একটি প্যাটার্ন তৈরি করতে পারে যা ব্যবহারকারী থেকে ব্যবহারকারীর জন্য আকর্ষণীয় হতে পারে। তাই, আবিষ্কৃত নিদর্শনগুলির আকর্ষণীয়তা মূল্যায়ন করার জন্য কৌশলগুলি প্রয়োজন হয় বিষয়গত পরিমাপের উপর নির্ভর করে৷

এগুলি ব্যবহারকারীর বিশ্বাস বা প্রত্যাশার উপর নির্ভর করে একটি প্রদত্ত ব্যবহারকারী শ্রেণীর সম্পর্কিত নিদর্শনগুলির মান গণনা করে। তদুপরি, আবিষ্কারের প্রক্রিয়া বোঝার জন্য আকর্ষণীয়তা পরিমাপ বা ব্যবহারকারী-সংজ্ঞায়িত সীমাবদ্ধতা ব্যবহার করে, এটি আরও আকর্ষণীয় নিদর্শন তৈরি করতে পারে এবং অনুসন্ধানের স্থান হ্রাস করতে পারে।


  1. ডেটা মাইনিংয়ে ওএলএপি অপারেশনগুলি কী কী?

  2. ডাটা মাইনিং এ OLAP টুল কি কি?

  3. ওয়েব মাইনিংয়ের পদ্ধতিগুলি কী কী?

  4. স্থানীয় ডেটা মাইনিংয়ের আদিম বিষয়গুলি কী?