ডেটা সাধারণীকরণ তুলনামূলকভাবে নিম্ন-স্তরের মানগুলি (যেমন একটি বৈশিষ্ট্য বয়সের জন্য সংখ্যাসূচক মান) উচ্চ-স্তরের ধারণাগুলির সাথে (যেমন তরুণ, মধ্যবয়সী এবং প্রবীণ) প্রতিস্থাপন করে ডেটা সংক্ষিপ্ত করে। ডেটাবেসে সংরক্ষিত ডেটার উচ্চ পরিমাণের পরিপ্রেক্ষিতে, বিমূর্তকরণের সাধারণীকৃত (নিম্ন নয়) পদ্ধতিতে ধারণাগুলিকে সংক্ষিপ্ত এবং সংক্ষিপ্ত পরিভাষায় সংজ্ঞায়িত করতে সক্ষম হওয়া উপকারী৷
এটি ডেটা সেটগুলিকে বিমূর্ততার একাধিক স্তরে সাধারণীকরণ করার অনুমতি দেয় যা ব্যবহারকারীদের ডেটার সাধারণ আচরণ পরীক্ষা করতে সহায়তা করে। উদাহরণস্বরূপ, AllElectronics ডাটাবেস দেওয়া, একক গ্রাহক লেনদেন পরীক্ষা করার পরিবর্তে, বিক্রয় পরিচালকরা উচ্চ স্তরে সাধারণীকৃত ডেটা দেখতে পছন্দ করতে পারেন, যার মধ্যে ভৌগলিক অঞ্চল অনুসারে ব্যবহারকারী গোষ্ঠীগুলির দ্বারা সংক্ষিপ্ত করা, প্রতি গোষ্ঠীর ক্রয়ের ফ্রিকোয়েন্সি এবং ব্যবহারকারীদের আয় অন্তর্ভুক্ত। এটি আমাদের ধারণা বর্ণনার ধারণার দিকে নিয়ে যায়, যা ডেটা সাধারণীকরণের একটি রূপ।
একটি ধারণা সাধারণত ঘন ঘন ক্রেতা, স্নাতক ছাত্র, ইত্যাদি সহ ডেটার সেট হিসাবে সংজ্ঞায়িত করে৷ একটি ডেটা মাইনিং কাজ হিসাবে, ধারণার বিবরণ ডেটার একটি সাধারণ গণনা নয়৷ পরিবর্তে, ধারণার বিবরণ ডেটার বৈশিষ্ট্য এবং তুলনার জন্য বর্ণনা তৈরি করে। এটিকে শ্রেণির বর্ণনাও বলা হয়, যখন ধারণাটিকে বস্তুর একটি শ্রেণির সংজ্ঞায়িত করা হয়।
চরিত্রায়ন ডেটার প্রদত্ত সেটের একটি সংক্ষিপ্ত এবং সংক্ষিপ্ত সারসংক্ষেপ সমর্থন করে, যখন ধারণা বা শ্রেণী তুলনা (এটি বৈষম্য হিসাবেও উল্লেখ করা হয়) ডেটার দুই বা ততোধিক সেটের তুলনা করে বর্ণনা সমর্থন করে। নিম্নলিখিত ক্ষেত্রে রয়েছে যা নিম্নরূপ -
জটিল ডেটা প্রকার এবং একত্রীকরণ − ডেটা ওয়ারহাউস এবং OLAP টুলগুলি একটি বহুমাত্রিক ডেটা মডেলের উপর নির্ভর করে যা ডেটা কিউবের আকারে তথ্য দেখায়, যার মধ্যে রয়েছে মাত্রা (বা বৈশিষ্ট্য) এবং পরিমাপ (সমষ্টিগত পরিষেবা)।
যাইহোক, বেশ কিছু বর্তমান ওএলএপি সিস্টেম অ-সংখ্যাসূচক রেকর্ড এবং সংখ্যাসূচক তথ্যের পরিমাপের মাত্রাকে সীমাবদ্ধ করে। ডাটাবেস বিভিন্ন ধরনের ডেটার বৈশিষ্ট্যগুলিকে অন্তর্ভুক্ত করতে পারে, যেমন সংখ্যাসূচক, অ-সংখ্যাসূচক, স্থানিক, পাঠ্য বা চিত্র, যা ধারণার বর্ণনার সাথে জড়িত থাকতে হবে।
ব্যবহারকারী-নিয়ন্ত্রণ বনাম অটোমেশন - ডেটা গুদামগুলিতে অন-লাইন বিশ্লেষণাত্মক প্রক্রিয়াকরণ একটি ব্যবহারকারী-নিয়ন্ত্রিত পর্যায়। মাত্রা নির্বাচন এবং OLAP পরিষেবাগুলির সফ্টওয়্যার, যার মধ্যে ড্রিল-ডাউন, রোল-আপ, স্লাইসিং এবং ডাইসিং, সাধারণত ব্যবহারকারীদের দ্বারা পরিচালিত এবং পরিচালিত হয়৷
যদিও বেশ কয়েকটি OLAP সিস্টেমে নিয়ন্ত্রণ ব্যবহারকারী-বান্ধব, ব্যবহারকারীদের প্রতিটি মাত্রার গুরুত্ব সম্পর্কে সর্বোত্তম বোঝার প্রয়োজন। অধিকন্তু, এটি তথ্যের একটি সন্তোষজনক বিবরণ খুঁজে পেতে পারে, ব্যবহারকারীদের OLAP অপারেশনগুলির একটি দীর্ঘ সিরিজ সংজ্ঞায়িত করার প্রয়োজন হতে পারে৷
একটি আরও স্বয়ংক্রিয় পর্যায় থাকা বাঞ্ছনীয় যা ব্যবহারকারীদের সিদ্ধান্ত নিতে সহায়তা করে যে কোন মাত্রাগুলি (বা বৈশিষ্ট্যগুলি) বিশ্লেষণে অন্তর্ভুক্ত করতে হবে এবং রেকর্ডগুলির একটি আকর্ষণীয় সারসংক্ষেপ তৈরি করার জন্য প্রদত্ত ডেটা সেটটিকে সাধারণীকরণ করতে হবে৷