AOI মানে অ্যাট্রিবিউট-ওরিয়েন্টেড ইন্ডাকশন। ধারণার বর্ণনায় বৈশিষ্ট্য-ভিত্তিক আনয়ন পদ্ধতিটি প্রথম প্রস্তাবিত হয়েছিল 1989 সালে, ডেটা কিউব পদ্ধতির প্রবর্তনের কয়েক বছর আগে। ডেটা কিউব পদ্ধতিটি মূলত ডেটার বস্তুগত দৃষ্টিভঙ্গির উপর ভিত্তি করে, যা সাধারণত ডেটা গুদামে প্রাক-গণনা করা হয়।
সাধারণভাবে, এটি প্রক্রিয়াকরণের জন্য একটি OLAP বা ডেটা মাইনিং কোয়েরি জমা দেওয়ার আগে অফ-লাইন সমষ্টি প্রয়োগ করে। অন্য কথায়, অ্যাট্রিবিউট-ওরিয়েন্টেড ইনডাকশন পদ্ধতি হল সাধারণত একটি প্রশ্ন-ভিত্তিক, সাধারণীকরণ-ভিত্তিক, অন-লাইন ডেটা বিশ্লেষণ পদ্ধতি৷
অ্যাট্রিবিউট-ওরিয়েন্টেড ইনডাকশনের সাধারণ ধারণা হল প্রথমে একটি ডাটাবেস ক্যোয়ারী ব্যবহার করে টাস্ক-প্রাসঙ্গিক ডেটা সংগ্রহ করা এবং তারপর ডেটার প্রাসঙ্গিক সংগ্রহে প্রতিটি অ্যাট্রিবিউটের স্বতন্ত্র মানের সংখ্যার পরীক্ষার ভিত্তিতে সাধারণীকরণ করা।
সাধারণীকরণ বৈশিষ্ট্য অপসারণ বা বৈশিষ্ট্য সাধারণীকরণ দ্বারা বাস্তবায়িত হয়। সমষ্টিটি অভিন্ন সাধারণীকৃত টিপলগুলিকে একত্রিত করে এবং তাদের নির্দিষ্ট গণনাগুলিকে একত্রিত করে প্রয়োগ করা হয়। এটি সাধারণীকৃত ডেটা সেটের আকার হ্রাস করে। ফলস্বরূপ সাধারণীকৃত অ্যাসোসিয়েশনটি চার্ট বা নিয়ম সহ ব্যবহারকারীর কাছে উপস্থাপনের জন্য বিভিন্ন ফর্মে ম্যাপ করা যেতে পারে।
বৈশিষ্ট্য-ভিত্তিক আনয়নের প্রক্রিয়া যা নিম্নরূপ -
-
প্রথমত, অ্যাট্রিবিউট-ভিত্তিক আনয়নের আগে ডেটা ফোকাসিং প্রয়োগ করা আবশ্যক। এই পদক্ষেপটি টাস্ক-প্রাসঙ্গিক রেকর্ডের বর্ণনার সাথে মিলে যায় (যেমন, বিশ্লেষণের জন্য ডেটা)। ডেটা মাইনিং কোয়েরিতে সমর্থিত ডেটার উপর ভিত্তি করে ডেটা সংগ্রহ করা হয়।
-
যেহেতু একটি ডেটা মাইনিং ক্যোয়ারী সাধারণত ডাটাবেসের শুধুমাত্র একটি অংশের সাথে প্রাসঙ্গিক হয়, প্রাসঙ্গিক ডেটার সেট নির্বাচন করা শুধুমাত্র খননকে আরও দক্ষ করে না, পুরো ডাটাবেস খনির চেয়ে আরও উল্লেখযোগ্য ফলাফল পরিবর্তন করে৷
-
এটি প্রাসঙ্গিক বৈশিষ্ট্যগুলির সেট নির্দিষ্ট করা যেতে পারে (অর্থাৎ, খনির জন্য বৈশিষ্ট্যগুলি, যেমনটি DMQL-এ ধারার প্রাসঙ্গিকতার সাথে নির্দেশিত) ব্যবহারকারীর পক্ষে কঠিন হতে পারে। একজন ব্যবহারকারী শুধুমাত্র কয়েকটি বৈশিষ্ট্য বেছে নিতে পারেন যা গুরুত্বপূর্ণ, অন্যদিকে অন্যদের অনুপস্থিত যা প্রতিনিধিত্বে ভূমিকা পালন করতে পারে।
-
উদাহরণ স্বরূপ, ধরুন যে মাত্রা জন্মস্থান শহর, প্রদেশ বা রাজ্য এবং দেশ বৈশিষ্ট্য দ্বারা সংজ্ঞায়িত করা হয়েছে। এটি জন্মস্থানের মাত্রার উপর সাধারণীকরণের অনুমতি দিতে পারে, এই মাত্রা সংজ্ঞায়িত অন্যান্য বৈশিষ্ট্যগুলিও অন্তর্ভুক্ত করা উচিত।
-
অন্য পদে, প্রাসঙ্গিক বৈশিষ্ট্য হিসাবে সিস্টেমটি স্বয়ংক্রিয়ভাবে প্রদেশ বা রাজ্য এবং দেশকে যুক্ত করে, আনয়ন পর্যায়ে শহরকে এই বৃহত্তর ধারণাগত স্তরে সাধারণীকরণ করতে সক্ষম করে।
-
অন্য চরমে, ধরুন যে ব্যবহারকারী "* এর সাথে প্রাসঙ্গিকতার সাথে" ধারার সাথে সম্ভাব্য সমস্ত বৈশিষ্ট্য উল্লেখ করে অনেকগুলি বৈশিষ্ট্য প্রবর্তন করেছেন। এই ক্ষেত্রে, from clause দ্বারা নির্দিষ্ট সম্পর্কের সমস্ত বৈশিষ্ট্য বিশ্লেষণে অন্তর্ভুক্ত করা হবে৷
-
কিছু বৈশিষ্ট্য আকর্ষণীয় উপস্থাপনে অবদান রাখার সম্ভাবনা কম। একটি পারস্পরিক সম্পর্ক-ভিত্তিক বা এনট্রপি-ভিত্তিক বিশ্লেষণ পদ্ধতি বৈশিষ্ট্য প্রাসঙ্গিকতা বিশ্লেষণ করতে এবং বর্ণনামূলক খনির প্রক্রিয়া থেকে পরিসংখ্যানগতভাবে অপ্রাসঙ্গিক বা দুর্বলভাবে প্রাসঙ্গিক বৈশিষ্ট্যগুলি ফিল্টার করতে ব্যবহার করা যেতে পারে।