ডেটা মাইনিং
ডেটা মাইনিং হল প্যাটার্ন শনাক্তকরণ প্রযুক্তির পাশাপাশি পরিসংখ্যানগত এবং গাণিতিক কৌশলগুলি ব্যবহার করে রিপোজিটরিতে সঞ্চিত বিপুল পরিমাণ ডেটার মাধ্যমে অর্থপূর্ণ নতুন পারস্পরিক সম্পর্ক, নিদর্শন এবং প্রবণতা আবিষ্কার করার প্রক্রিয়া। এটি সন্দেহাতীত সম্পর্ক খুঁজে পেতে পর্যবেক্ষণমূলক ডেটাসেটগুলির বিশ্লেষণ এবং ডেটা মালিকের কাছে বোধগম্য এবং উপযোগী উভয়ই অভিনব উপায়ে ডেটা সংক্ষিপ্ত করতে৷
৷ডেটা মাইনিং-এ অ্যানালিটিক্স টুল সহ বিভিন্ন ধরনের সফ্টওয়্যার প্যাকেজের ব্যবহার অন্তর্ভুক্ত থাকতে পারে। এটি স্বয়ংক্রিয় হতে পারে, বা এটি মূলত শ্রম-নিবিড় হতে পারে, যেখানে স্বতন্ত্র কর্মীরা একটি সংরক্ষণাগার বা ডাটাবেসে তথ্যের জন্য নির্দিষ্ট প্রশ্ন পাঠায়।
সাধারণত, ডেটা মাইনিং এমন ক্রিয়াকলাপগুলিকে সংজ্ঞায়িত করে যেখানে তুলনামূলকভাবে পরিশীলিত অনুসন্ধান ক্রিয়াকলাপ রয়েছে যা ফোকাস এবং নির্দিষ্ট ফলাফল ফিরিয়ে দেয়। উদাহরণ স্বরূপ, একটি ডেটা মাইনিং টুল কয়েক ডজন বছরের অ্যাকাউন্টিং ডেটার মাধ্যমে দেখতে পারে একটি নির্দিষ্ট অপারেটিং বছরের জন্য খরচ বা প্রাপ্তিযোগ্য অ্যাকাউন্টগুলির একটি নির্দিষ্ট কলাম খুঁজে পেতে৷
বিগ ডেটা
৷বিগ ডেটা বলতে টেরা-বাইটের পরিপ্রেক্ষিতে স্ট্রাকচার্ড, সেমি-স্ট্রাকচার্ড এবং আনস্ট্রাকচার্ড ডেটার সেট হতে পারে এমন বিশাল পরিমাণকে বোঝায়। একটি পৃথক সিস্টেমে প্রচুর পরিমাণে ডেটা প্রক্রিয়া করা জটিল তাই এই কম্পিউটারের RAM প্রক্রিয়াকরণ এবং বিশ্লেষণের সময় অন্তর্বর্তী গণনা সংরক্ষণ করে। যখন আমরা এত বিপুল পরিমাণ ডেটা প্রসেস করার চেষ্টা করি, তখন একক সিস্টেমে এই প্রক্রিয়াকরণগুলি করতে অনেক সময় লাগে। এছাড়াও, ওভারলোডের কারণে আমাদের কম্পিউটার সিস্টেম সঠিকভাবে কাজ করে না।
বিগ ডেটা সেটগুলি হল সেইগুলি যা সাধারণ ধরণের ডেটাবেস এবং ডেটা পরিচালনার কাঠামোকে ছাড়িয়ে যায় যা আগের সময়ে ব্যবহৃত হত যখন বড় ডেটা বেশি দামের এবং কম সম্ভাব্য ছিল৷ উদাহরণস্বরূপ, মাইক্রোসফ্ট এক্সেল স্প্রেডশীটে পরিচালনা করার জন্য খুব বেশি ডেটা সেটগুলিকে বড় ডেটা সেট হিসাবে সংজ্ঞায়িত করা যেতে পারে৷
আসুন আমরা ডেটা মাইনিং এবং বিগ ডেটার মধ্যে তুলনা দেখি৷
৷ডেটা মাইনিং | বিগ ডেটা |
---|---|
ডেটা মাইনিং হল প্যাটার্ন রিকগনিশন প্রযুক্তির পাশাপাশি পরিসংখ্যানগত এবং গাণিতিক কৌশলগুলি ব্যবহার করে রিপোজিটরিতে প্রচুর পরিমাণে ডেটা সঞ্চয় করে অর্থপূর্ণ নতুন সম্পর্ক, নিদর্শন এবং প্রবণতা আবিষ্কার করার প্রক্রিয়া। | বিগ ডেটা হল একটি সর্ব-অন্তর্ভুক্ত শব্দ যা উল্লেখযোগ্যভাবে বিশাল ডেটা সেটের সংগ্রহ এবং পরবর্তী বিশ্লেষণকে সংজ্ঞায়িত করে যাতে লুকানো ডেটা বা অন্তর্দৃষ্টি অন্তর্ভুক্ত থাকতে পারে যা ঐতিহ্যগত পদ্ধতি এবং সরঞ্জামগুলি ব্যবহার করে খুঁজে পাওয়া যায়নি৷ ঐতিহ্যগত কম্পিউটিং সিস্টেমগুলি পরিচালনা এবং বিশ্লেষণ করার জন্য ডেটার পরিমাণ অনেক বেশি৷ |
উদ্দেশ্য হল প্যাটার্ন, অসঙ্গতি এবং পারস্পরিক সম্পর্ক খুঁজে বের করা। | উদ্দেশ্য হল ডেটা সেটগুলি থেকে অন্তর্দৃষ্টি আবিষ্কার করা যা বৈচিত্র্যময়, জটিল এবং বিশাল আকারের। |
ব্যবহারের ক্ষেত্রে আর্থিক পরিষেবা, এয়ারলাইনস এবং ট্রাকিং কোম্পানি, স্বাস্থ্যসেবা খাত, টেলিযোগাযোগ এবং ইউটিলিটি, মিডিয়া এবং বিনোদন, ই-কমার্স, শিক্ষা, IoT, ইত্যাদি অন্তর্ভুক্ত৷ | এটি বিশ্বব্যাপী মেশিন লার্নিং এবং কৃত্রিম বুদ্ধিমত্তা অ্যাপ্লিকেশনের ভিত্তি হিসাবে কাজ করে৷ |