ডেটা মাইনিংয়ের বিভিন্ন বৈশিষ্ট্য রয়েছে যা নিম্নরূপ -
ডেটার প্রকারগুলি৷ − বেশিরভাগ ডেটা মাইনিং সিস্টেম যা শিল্পে অ্যাক্সেসযোগ্য, সেগুলি ফরম্যাটেড, রেকর্ড-ভিত্তিক, রিলেশনাল-মত পরিসংখ্যানগত, শ্রেণীবদ্ধ, এবং প্রতীকী বৈশিষ্ট্য সহ ডেটা পরিচালনা করে। ডেটা ASCII টেক্সট, রিলেশনাল ডাটাবেস ডেটা বা ডেটা গুদাম ডেটা আকারে হতে পারে। এটি পরীক্ষা করা অপরিহার্য যে সঠিক ফর্ম্যাট(গুলি) প্রতিটি সিস্টেম এটি পরিচালনা করছে৷
কিছু ধরনের ডেটা বা অ্যাপ্লিকেশনের প্যাটার্ন অনুসন্ধানের জন্য বিশেষ অ্যালগরিদমের প্রয়োজন হতে পারে, এবং তাই তাদের প্রয়োজনীয়তাগুলি অফ-দ্য-শেল্ফ, জেনেরিকডেটা মাইনিং সিস্টেম দ্বারা পরিচালিত হতে পারে না। পরিবর্তে, বিশেষায়িত ডেটা মাইনিং সিস্টেমগুলি ব্যবহার করা যেতে পারে, যেগুলি টেক্সট রিপোর্ট, ভূ-স্থানিক ডেটা, মাল্টিমিডিয়া ডেটা, স্ট্রিম ডেটা, টাইম সিকোয়েন্স ডেটা, জৈবিক ডেটা, বা ওয়েব ডেটা, অথবা নির্দিষ্ট অ্যাপ্লিকেশনগুলির জন্য (অর্থ, খুচরা শিল্প সহ) নিবেদিত। , বা টেলিযোগাযোগ)।
সিস্টেম সমস্যা - একটি প্রদত্ত ডেটা মাইনিং সিস্টেম শুধুমাত্র একটি অপারেটিং ফ্রেমওয়ার্ক বা একাধিকতে চলতে পারে। ডাটা মাইনিং সফটওয়্যার হোস্ট করে এমন বিখ্যাত অপারেটিং সিস্টেম হল ইউনিক্স/লিনাক্স এবং মাইক্রোসফট উইন্ডোজ। এছাড়াও ডেটা মাইনিং সিস্টেম রয়েছে যা Macintosh, OS/2 ইত্যাদিতে চলে। বড় বাজার-ভিত্তিক ডেটা
বড় বাজার-ভিত্তিক ডেটা মাইনিং সিস্টেমগুলি প্রায়শই একটি ক্লায়েন্ট/সার্ভার আর্কিটেকচার গ্রহণ করে, যেখানে ক্লায়েন্ট একটি ব্যক্তিগত কম্পিউটার হতে পারে এবং সার্ভারটি শক্তিশালী সমান্তরাল কম্পিউটারগুলির একটি সংগ্রহ হতে পারে। একটি বর্তমান প্রবণতায় ডেটা মাইনিং সিস্টেম রয়েছে যা ওয়েব-ভিত্তিক ইন্টারফেস সমর্থন করে এবং XML ডেটা ইনপুট এবং/অথবা আউটপুট হিসাবে সক্ষম করে৷
ডেটা উৎস - এটি নির্দিষ্ট ডেটা ফর্ম্যাটগুলিকে সংজ্ঞায়িত করে যার উপর ডেটা মাইনিং সিস্টেম কাজ করবে৷ কিছু সিস্টেম শুধুমাত্র ASCII টেক্সট ফাইলে চলে, যেখানে কিছু রিলেশনাল ডেটা বা ডেটা গুদাম ডেটাতে কাজ করে, বিভিন্ন রিলেশনাল ডেটা সোর্স অ্যাক্সেস করে।
একটি ডেটা মাইনিং সিস্টেমকে ODBC সংযোগের জন্য ODBC সংযোগ বা OLE DB প্রদান করতে হবে৷ এগুলি ওপেন ডাটাবেস সংযোগ প্রদান করে, বিশেষ করে, যেকোন রিলেশনাল ডেটা অ্যাক্সেস করার ক্ষমতা (IBM/DB2, Microsoft SQL সার্ভার, Microsoft Access, Oracle, Sybase, ইত্যাদি) এবং ফর্ম্যাট করা ASCII টেক্সট ডেটা।
ডেটা মাইনিং ফাংশন এবং পদ্ধতি - ডেটা মাইনিং ফাংশনগুলি ডেটা মাইনিং সিস্টেমের হৃদয় গঠন করে। কিছু ডেটা মাইনিং সিস্টেম শুধুমাত্র একটি ডেটা মাইনিং ফাংশন সমর্থন করে, যেমন শ্রেণীবিভাগ। অন্যরা ধারণার বর্ণনা, আবিষ্কার-চালিত OLAP বিশ্লেষণ, অ্যাসোসিয়েশন মাইনিং, লিঙ্কেজ বিশ্লেষণ, পরিসংখ্যান বিশ্লেষণ, শ্রেণীবিভাগ, ভবিষ্যদ্বাণী, ক্লাস্টারিং, আউটলিয়ার বিশ্লেষণ, মিল অনুসন্ধান, অনুক্রমিক প্যাটার্ন বিশ্লেষণ এবং ভিজ্যুয়াল ডেটা মাইনিং সহ একাধিক ডেটা মাইনিং ফাংশনে সাহায্য করতে পারে। পি>
প্রদত্ত ডেটা মাইনিং ফাংশনের জন্য (শ্রেণীবিভাগ সহ), কিছু সিস্টেম শুধুমাত্র একটি পদ্ধতি প্রদান করতে পারে, যেখানে অন্যরা বিভিন্ন পদ্ধতি প্রদান করতে পারে (ডিসিশন ট্রি অ্যানালাইসিস, বায়েসিয়ান নেটওয়ার্ক, নিউরাল নেটওয়ার্ক, সমর্থন ভেক্টর মেশিন, নিয়ম-ভিত্তিক শ্রেণীবিভাগ, k-নিকটবর্তী-প্রতিবেশী পদ্ধতি, জেনেটিক অ্যালগরিদম এবং কেস-ভিত্তিক যুক্তি।
ডেটা মাইনিং সিস্টেম যা একাধিক ডেটা মাইনিং ফাংশন এবং প্রতি ফাংশন একাধিক পদ্ধতি প্রদান করে ব্যবহারকারীকে উচ্চ নমনীয়তা এবং বিশ্লেষণ ক্ষমতা সহ সমর্থন করে। কিছু সমস্যার জন্য ব্যবহারকারীদের কয়েকটি ভিন্ন মাইনিং ফাংশন চেষ্টা করতে হতে পারে বা একাধিক একত্রে একত্রিত করতে হতে পারে, এবং বিভিন্ন পদ্ধতি বিভিন্ন ধরণের ডেটার জন্য অন্যদের চেয়ে বেশি দক্ষ হতে পারে।