কম্পিউটার

DENCLUE কি?


ক্লাস্টারিং হল জ্ঞান আবিষ্কারের জন্য গুরুত্বপূর্ণ ডেটা মাইনিং পদ্ধতি। ক্লাস্টারিং হল একটি অনুসন্ধানমূলক ডেটা বিশ্লেষণ পদ্ধতি যা বিভিন্ন ডেটা অবজেক্টকে একই গ্রুপে শ্রেণীবদ্ধ করে, যেমন ক্লাস্টার।

DENCLUE ঘনত্ব-ভিত্তিক ক্লাস্টারিং প্রতিনিধিত্ব করে। এটি একটি ক্লাস্টারিং পদ্ধতির ঘনত্ব বন্টন ফাংশন একটি গ্রুপ উপর নির্ভর করে. DENCLUE অ্যালগরিদম একটি ক্লাস্টার মডেল ব্যবহার করে কার্নেলের ঘনত্ব অনুমানের উপর নির্ভর করে। একটি ক্লাস্টার একটি স্থানীয় সর্বাধিক পূর্বাভাসিত ঘনত্ব ফাংশন দ্বারা প্রতিনিধিত্ব করা হয়৷

DENCLUE অভিন্ন বন্টন সহ রেকর্ডে কাজ করে না। উচ্চমাত্রিক স্থানে, মাত্রার অভিশাপের কারণে ডেটা সবসময় সমানভাবে বিতরণ করা হয়। তাই, DENCLUDE সাধারণভাবে উচ্চ-মাত্রিক রেকর্ডে ভালভাবে কাজ করে না।

পদ্ধতিটি নিম্নলিখিত ধারণাগুলির উপর নির্মিত যা নিম্নরূপ -

  • প্রতিটি ডেটা পয়েন্টের প্রভাব আনুষ্ঠানিকভাবে একটি গাণিতিক ফাংশন ব্যবহার করে মডেল করা যেতে পারে, যাকে একটি প্রভাব ফাংশন বলা হয়, যা তার আশেপাশের মধ্যে একটি ডেটা পয়েন্টের প্রভাব বর্ণনা করে।

  • ডেটা এলাকার সম্পূর্ণ ঘনত্বকে কিছু ডেটা পয়েন্টে ব্যবহৃত প্রভাব ফাংশনের যোগফল হিসাবে বিশ্লেষণাত্মকভাবে মডেল করা যেতে পারে।

  • ঘনত্ব আকর্ষণকারীকে স্বীকৃতি দিয়ে ক্লাস্টারগুলিকে সংখ্যাগতভাবে নির্ধারণ করা যেতে পারে, যেখানে ঘনত্ব আকর্ষণকারীগুলি সম্পূর্ণ ঘনত্ব ফাংশনের স্থানীয় সর্বোচ্চ।

x এবং y কে f d তে বস্তু বা বিন্দু হতে দিন , একটি d-মাত্রিক ইনপুট স্থান। x এর উপর ডেটা অবজেক্ট y এর প্রভাব ফাংশন হল একটি ফাংশন, $\mathrm{f_B^y\colon f^{d}\rightarrow R_0^+}$, যা একটি মৌলিক প্রভাব ফাংশন fB এর পরিপ্রেক্ষিতে সংজ্ঞায়িত করা হয় :

$$\mathrm {f_B^y(X)=f_{B}(X,Y)}$$

এটি x এর উপর y এর প্রভাব প্রতিফলিত করে। নীতিগতভাবে, প্রভাব ফাংশন একটি নির্বিচারে ফাংশন হতে পারে যা একটি প্রতিবেশী দুটি বস্তুর মধ্যে দূরত্ব দ্বারা নির্ধারিত হতে পারে। দূরত্ব ফাংশন, d(x, y), অবশ্যই রিফ্লেক্সিভ এবং সিমেট্রিক হতে হবে, ইউক্লিডীয় দূরত্ব ফাংশন সহ।

এটি সাধারণত একটি বর্গ তরঙ্গ প্রভাব ফাংশন গণনা করতে ব্যবহৃত হয়,

$$\mathrm{f_{square}(X,Y)=\begin{Bmatrix}0 \:\:\:\:\:\:\:\:\:\:\mathrm{if\:d (x, y)> \sigma}\\1\:\:\:\:\:\:\:\:\:\:\:\:\:\:\:\mathrm{অন্যথায় }\end{Bmatrix}}$$

অথবা একটি গাউসিয়ান প্রভাব ফাংশন,

$$\mathrm{f_{Gauss}(x, y)=e-\frac{d(x, y)^2}{2{\sigma}^2}}$$

DENCLUE এর সুবিধা

DENCLUE এর বেশ কিছু সুবিধা রয়েছে যা নিম্নরূপ -

  • এটির একটি দৃঢ় সংখ্যাগত ভিত্তি রয়েছে এবং এটি বিভিন্ন ক্লাস্টারিং পদ্ধতির সাধারণীকরণ করে, যেমন বিভাজন, শ্রেণিবিন্যাস এবং ঘনত্ব-ভিত্তিক পদ্ধতি৷

  • এটিতে প্রচুর পরিমাণে শব্দ সহ ডেটা সেটগুলির জন্য ভাল ক্লাস্টারিং বৈশিষ্ট্য রয়েছে৷

  • এটি উচ্চ-মাত্রিক তথ্য সেটে নির্বিচারে আকারের ক্লাস্টারগুলির একটি কম্প্যাক্ট সংখ্যাসূচক বর্ণনা সক্ষম করে৷

  • এটি গ্রিড সেল ব্যবহার করে, তবুও শুধুমাত্র গ্রিড সেল সম্পর্কে তথ্য রাখে যা আসলে ডেটা পয়েন্ট ধারণ করে। এটি একটি ট্রি-ভিত্তিক অ্যাক্সেস কাঠামোতে এই কোষগুলিকে পরিচালনা করে এবং এইভাবে কিছু প্রভাবশালী অ্যালগরিদমের তুলনায় উল্লেখযোগ্যভাবে দ্রুত, যেমন DBSCAN৷

  • এই পদ্ধতির জন্য ঘনত্বের প্যারামিটার σ এবং নয়েজ থ্রেশহোল্ড ξ সাবধানে নির্বাচন করা প্রয়োজন, কারণ এই ধরনের পরামিতিগুলির নির্বাচন ক্লাস্টারিং ফলাফলের গুণমানকে উল্লেখযোগ্যভাবে প্রভাবিত করতে পারে।


  1. পিএইচপি-তে ইমপ্লোড() ফাংশন কী?

  2. পিএইচপি-তে হেডার() ফাংশন কী?

  3. পাইথনে ফিল্টার() কি?

  4. পাইথনে একটি নামস্থান কি?