কম্পিউটার

ডাটা মাইনিং এর কাজ কি?


ডেটা মাইনিং হল পরিসংখ্যানগত এবং গাণিতিক কৌশল সহ প্যাটার্ন শনাক্তকরণ প্রযুক্তি ব্যবহার করে সংগ্রহস্থলগুলিতে সংরক্ষিত প্রচুর পরিমাণে ডেটা স্থানান্তর করে দরকারী নতুন সম্পর্ক, নিদর্শন এবং প্রবণতাগুলি সন্ধান করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্কগুলি আবিষ্কার করার জন্য এবং ডেটা মালিকের জন্য যৌক্তিক এবং সহায়ক উভয়ই অভিনব পদ্ধতিতে রেকর্ডগুলির সংক্ষিপ্তসার করার জন্য বাস্তবিক ডেটাসেটের বিশ্লেষণ৷

একটি ডেটা মাইনিং কাজ একটি ডেটা মাইনিং প্রশ্নের ডিজাইনে সংজ্ঞায়িত করা যেতে পারে, যা ডেটা মাইনিং সিস্টেমে ইনপুট। একটি ডেটা মাইনিং কোয়েরি ডেটা মাইনিং টাস্ক আদিম অবস্থার মধ্যে উপস্থাপন করা হয়। এই আদিম উপাদানগুলি খনির প্রক্রিয়া পরিচালনা করতে বা একাধিক কোণ বা গভীরতা থেকে ফলাফলগুলি পরীক্ষা করার জন্য আবিষ্কারের সময় ডেটা মাইনিং সিস্টেমের সাথে পারস্পরিকভাবে সংযোগ করতে ব্যবহারকারীকে সক্ষম করে৷

ডেটা মাইনিংয়ের কাজটি নিম্নরূপ -

খনন করা টাস্ক-প্রাসঙ্গিক ডেটার সেট - এটি ডেটাবেসের অংশ বা তথ্যের সেটকে সংজ্ঞায়িত করে যেখানে ব্যবহারকারী উদ্বিগ্ন। এটি ডাটাবেস বৈশিষ্ট্য বা আগ্রহের ডেটা গুদামের মাত্রা জড়িত (প্রাসঙ্গিক বৈশিষ্ট্য বা মাত্রা হিসাবে সংজ্ঞায়িত)।

যে ধরনের জ্ঞান খনন করতে হবে − এটি চরিত্রায়ন, বৈষম্য, সমিতি বা পারস্পরিক সম্পর্ক বিশ্লেষণ, শ্রেণিবিন্যাস, ভবিষ্যদ্বাণী, ক্লাস্টারিং, আউটলিয়ার বিশ্লেষণ, বা বিবর্তন বিশ্লেষণ সহ পরিচালিত ডেটা মাইনিং ফাংশনগুলিকে সংজ্ঞায়িত করে৷

আবিষ্কার প্রক্রিয়ায় ব্যবহৃত পটভূমি জ্ঞান − খনন করা ডোমেন সম্পর্কে এই জ্ঞান জ্ঞান আবিষ্কারের প্রক্রিয়া এবং প্রতিষ্ঠিত নিদর্শনগুলি গণনা করতে সহায়তা করে। ধারণা শ্রেণিবিন্যাস হল পটভূমি জ্ঞানের একটি বিখ্যাত রূপ, যা বিমূর্তকরণের বিভিন্ন পদ্ধতিতে ডেটা খনন করতে সক্ষম করে।

প্যাটার্ন মূল্যায়নের জন্য আকর্ষণীয়তার পরিমাপ এবং থ্রেশহোল্ড − এগুলি খনির প্রক্রিয়া পরিচালনা করতে বা আবিষ্কারের পরে, আবিষ্কৃত নিদর্শনগুলি গণনা করতে ব্যবহার করা যেতে পারে। একাধিক ধরণের জ্ঞানের বিভিন্ন আকর্ষণীয় পরিমাপ থাকতে পারে।

আবিষ্কৃত নিদর্শনগুলিকে কল্পনা করার জন্য প্রত্যাশিত উপস্থাপনা৷ − এটি সেই ফর্মের প্রতিনিধিত্ব করে যেখানে আবিষ্কৃত প্যাটার্নগুলি উপস্থাপন করা হবে, যাতে নিয়ম, টেবিল, চার্ট, গ্রাফ, সিদ্ধান্ত গাছ এবং কিউব থাকতে পারে৷

একটি ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইন করা যেতে পারে এই আদিম বিষয়গুলিকে অন্তর্ভুক্ত করার জন্য, ব্যবহারকারীদের নমনীয়ভাবে ডেটা মাইনিং সিস্টেমের সাথে সংযোগ করতে সক্ষম করে৷ একটি ডেটা মাইনিং কোয়েরি ভাষা এমন একটি কর্তৃপক্ষকে সমর্থন করে যার উপর ব্যবহারকারী-বান্ধব গ্রাফিকাল ইন্টারফেস তৈরি করা যেতে পারে। এটি একটি ডেটা মাইনিং সিস্টেমের অন্যান্য ডেটা সিস্টেমের সাথে যোগাযোগ এবং সম্পূর্ণ ডেটা প্রক্রিয়াকরণ পরিবেশের সাথে এর একীকরণকে প্রচার করে৷

এটি একটি অন্তর্ভুক্তিমূলক ডেটা মাইনিং ল্যাঙ্গুয়েজ ডিজাইন করছে যা চ্যালেঞ্জিং কারণ ডেটা মাইনিং ডেটা চরিত্রায়ন থেকে বিবর্তন বিশ্লেষণ পর্যন্ত বিস্তৃত ফাংশনকে রক্ষা করে। প্রতিটি কাজের বেশ কয়েকটি প্রয়োজনীয়তা রয়েছে। একটি কার্যকর ডেটা মাইনিং ক্যোয়ারী ল্যাঙ্গুয়েজ ডিজাইনের জন্য বিভিন্ন ধরণের ডেটা মাইনিং কাজের ক্ষমতা, সীমাবদ্ধতা এবং অন্তর্নিহিত কাঠামোর বিস্তৃত শিক্ষার প্রয়োজন৷


  1. ডেটা মাইনিংয়ে ঐতিহাসিক তথ্য কি?

  2. ডেটা মাইনিং ইন্টারফেস কি?

  3. টেম্পোরাল ডেটা মাইনিং কি?

  4. ডেটা মাইনিং এর তাত্ত্বিক ভিত্তি কি?