কম্পিউটার

আমরা কীভাবে উচ্চ-মাত্রিক ডেটা থেকে সাবস্পেস ক্লাস্টারগুলি খুঁজে পেতে পারি?


সাবস্পেস অনুসন্ধান কৌশল, পারস্পরিক সম্পর্ক-ভিত্তিক ক্লাস্টারিং কৌশল এবং দ্বি-ক্লাস্টারিং কৌশল সহ বেশ কয়েকটি পদ্ধতি তিনটি প্রধান গ্রুপে শ্রেণীবদ্ধ করা হয়েছে।

সাবস্পেস সার্চ টেকনিক - একটি সাবস্পেস অনুসন্ধান পদ্ধতি ক্লাস্টারগুলির জন্য বেশ কয়েকটি সাবস্পেস অনুসন্ধান করে। সুতরাং, একটি ক্লাস্টার হল বস্তুর একটি উপসেট যা একটি সাবস্পেসে একে অপরের মতো একই। দূরত্ব বা ঘনত্ব সহ প্রচলিত পরিমাপ দ্বারা সাদৃশ্য অর্জিত হয়।

উদাহরণস্বরূপ, CLIQUE অ্যালগরিদম হল একটি সাবস্পেস ক্লাস্টারিং কৌশল। এটি একটি মাত্রিকতা-বর্ধমান সিরিজে সেই সাবস্পেসগুলিতে সাবস্পেস এবং ক্লাস্টারগুলি নির্দিষ্ট করতে পারে এবং সাবস্পেসগুলি ছাঁটাই করতে অ্যান্টিমোনোটোনিসিটি ব্যবহার করে যেখানে কোনও ক্লাস্টার চলতে পারে না। একটি বড় চ্যালেঞ্জ যা সাবস্পেস অনুসন্ধান কৌশলের মুখোমুখি হয় তা হল কীভাবে সাবস্পেসের একটি ক্রম কার্যকরভাবে অনুসন্ধান করা যায়।

দুই ধরনের পদ্ধতি নিম্নরূপ -

  • বটম-আপ পদ্ধতি নিম্ন-মাত্রিক সাবস্পেস থেকে শুরু হয় এবং উচ্চ-মাত্রিক সাবস্পেসগুলি অনুসন্ধান করে শুধুমাত্র যখন সেই বৃহত্তর-মাত্রিকগুলিতে ক্লাস্টার থাকতে পারে। একাধিক উচ্চ-মাত্রিক সাবস্পেসগুলিকে অনুসন্ধান করার প্রয়োজন কমাতে বিভিন্ন ছাঁটাই পদ্ধতি বিশ্লেষণ করা হয়েছে। CLIQUE হল একটি বটম-আপ পদ্ধতির উদাহরণ।

  • টপ-ডাউন পদ্ধতি সম্পূর্ণ স্থান থেকে শুরু হয় এবং ছোট এবং ছোট সাবস্পেসগুলি পুনরাবৃত্তিমূলকভাবে অনুসন্ধান করুন। টপ-ডাউন পদ্ধতিগুলি তখনই কার্যকর হয় যখন স্থানীয় অনুমান প্রভাব, যার প্রয়োজন হয় যে একটি ক্লাস্টারের সাবস্পেস স্থানীয় আশেপাশের দ্বারা সিদ্ধান্ত নেওয়া যেতে পারে৷

সম্পর্ক-ভিত্তিক ক্লাস্টারিং পদ্ধতি − যদিও সাবস্পেস অনুসন্ধান পদ্ধতিগুলি ক্লাস্টারগুলির জন্য একটি সাদৃশ্যের সন্ধান করে যা দূরত্ব বা ঘনত্বের মতো প্রচলিত মেট্রিকগুলি ব্যবহার করে গণনা করা হয়, পারস্পরিক সম্পর্ক-ভিত্তিক পদ্ধতিগুলি ক্লাস্টারগুলি খুঁজে পেতে পারে যা উন্নত পারস্পরিক সম্পর্ক মডেল দ্বারা প্রতিনিধিত্ব করা হয়৷

একটি PCA-ভিত্তিক পদ্ধতি প্রথমে PCA (প্রিন্সিপাল কম্পোনেন্টস অ্যানালাইসিস) ব্যবহার করে নতুন, অসংলগ্ন মাত্রার একটি সেট পরিবর্তন করতে এবং সেইজন্য নতুন স্থান বা এর সাবস্পেসে মাইন ক্লাস্টার। উপরন্তু PCA, অন্যান্য স্থান পরিবর্তন ব্যবহার করা যেতে পারে, যার মধ্যে হাফ ট্রান্সফর্ম বা ফ্র্যাক্টাল ডাইমেনশন রয়েছে।

বাইক্লাস্টারিং পদ্ধতি − কিছু অ্যাপ্লিকেশানে, একই সময়ে বস্তু এবং গুণাবলী উভয়কে ক্লাস্টার করা প্রয়োজন। ফলস্বরূপ ক্লাস্টারগুলিকে বাইক্লাস্টার বলা হয় এবং নিম্নরূপ চারটি প্রয়োজনীয়তা পূরণ করে -

  • এটি শুধুমাত্র একটি ছোট গ্রুপ অবজেক্ট একটি ক্লাস্টারে কাজ করে।

  • একটি ক্লাস্টারে শুধুমাত্র অল্প সংখ্যক বৈশিষ্ট্য থাকে।

  • একটি বস্তু বিভিন্ন ক্লাস্টারে অংশগ্রহণ করতে পারে, বা কোনো ক্লাস্টারে জড়িত নয়।

  • একটি বৈশিষ্ট্য বেশ কয়েকটি ক্লাস্টারে অন্তর্ভুক্ত করা যেতে পারে, বা কোনো ক্লাস্টারে থাকে না।

জিন এক্সপ্রেশন ডেটা অন্বেষণের জন্য প্রয়োজনীয়তাগুলিকে মোকাবেলা করার জন্য বাইক্লাস্টারিং কৌশলগুলি প্রথমে সুপারিশ করা হয়েছিল৷ একটি জিন হল একটি জীবন্ত কাঠামো থেকে তার বংশধরদের মধ্যে বৈশিষ্ট্যগুলি প্রেরণের একটি সিস্টেম। সাধারণত, একটি জিন ডিএনএর একটি অংশে গঠিত।

জিনগুলি সমস্ত জীবন্ত জিনিসের জন্য গুরুত্বপূর্ণ কারণ তারা কিছু প্রোটিন এবং কার্যকরী RNA চেইনকে সংজ্ঞায়িত করে। তারা একটি জীবন্ত প্রাণীর কোষ তৈরি এবং সমর্থন করার জন্য ডেটাকে প্রভাবিত করে এবং বংশধরদের মধ্যে জেনেটিক বৈশিষ্ট্যগুলি প্রেরণ করে।

একটি জিনোটাইপ হল একটি কোষ, একটি জীব বা একটি ব্যক্তির জেনেটিক মেকআপ। ফেনোটাইপগুলি একটি জীবের আপাত বৈশিষ্ট্য। জিন এক্সপ্রেশন হল জেনেটিক্সের গুরুত্বপূর্ণ স্তর যে জিনোটাইপগুলি ফিনোটাইপ সৃষ্টি করে৷


  1. ওয়ানপ্লাস থেকে ওয়ানপ্লাসে কীভাবে ডেটা স্থানান্তর করবেন?

  2. হুয়াওয়ে থেকে হুয়াওয়েতে কীভাবে ডেটা স্থানান্তর করবেন

  3. আমি কীভাবে আমার ডেটা ব্যাকআপ করতে পারি?

  4. আপনার কাজের ডেটা খুঁজে পেতে বিং-এ মাইক্রোসফ্ট অনুসন্ধান কীভাবে ব্যবহার করবেন