কম্পিউটার

BLAST স্থানীয় প্রান্তিককরণ অ্যালগরিদম কি?


ব্লাস্ট অ্যালগরিদমটি ন্যাশনাল সেন্টার ফর বায়োটেকনোলজি ইনফরমেশন (এনসিবিআই) এ 1990 সালের দিকে Altschul, Gish, Miller দ্বারা উত্পাদিত হয়েছিল। সিকোয়েন্সের মধ্যে কার্যকরী এবং বিবর্তনীয় সম্পর্ক তৈরি করতে এবং জিন পরিবারের সদস্যদের চিনতে সাহায্য করতে BLAST ব্যবহার করা হয়।

NCBI ওয়েবসাইটে বেশ কিছু সাধারণ BLAST ডাটাবেস রয়েছে। তাদের বিষয়বস্তু অনুসারে, তারা নিউক্লিওটাইড এবং প্রোটিন ডাটাবেসে একত্রিত হয়। NCBI এছাড়াও ভেক্টর স্ক্রীনিং ডাটাবেস সহ বিশেষায়িত BLAST ডাটাবেস সমর্থন করে, একাধিক জীবের জন্য বিভিন্ন জিনোম ডেটাবেস এবং ট্রেস ডেটাবেস রয়েছে৷

BLAST একটি ক্যোয়ারী সিকোয়েন্স এবং একটি ডাটাবেসের মধ্যে বৃহত্তম স্থানীয় প্রান্তিককরণ আবিষ্কার করতে একটি হিউরিস্টিক পদ্ধতি ব্যবহার করে। BLAST খণ্ডের ক্রমগুলির (শব্দ হিসাবে সংজ্ঞায়িত) সাথে তুলনা করার জন্য অনুক্রমগুলিকে ভাগ করে এবং মূলত এই শব্দগুলির মধ্যে মিল খোঁজার মাধ্যমে অনুসন্ধানের সম্পূর্ণ গতি বাড়ায়৷

BLAST-এ, শব্দগুলি কে-টুপল হিসাবে গণ্য করা হয়। ডিএনএ নিউক্লিওটাইডের জন্য, একটি শব্দে সাধারণত 11টি ঘাঁটি (নিউক্লিওটাইড) থাকে, যেখানে প্রোটিনের জন্য, একটি শব্দে সাধারণত 3টি অ্যামিনো অ্যাসিড অন্তর্ভুক্ত থাকে। ব্লাস্ট আশেপাশের (অর্থাৎ প্রায় মিলে যাওয়া) শব্দগুলির একটি হ্যাশ টেবিল তৈরি করে, যখন "ঘনিষ্ঠতা" এর থ্রেশহোল্ড সেট করা হয় তা পরিসংখ্যানের উপর নির্ভর করে। এটি সঠিক মিল থেকে শুরু হয় আশেপাশের শব্দগুলিতে৷

যেহেতু ভাল সারিবদ্ধকরণে অবশ্যই বেশ কয়েকটি ঘনিষ্ঠ ম্যাচ অন্তর্ভুক্ত করতে হবে, কোন ম্যাচগুলি গুরুত্বপূর্ণ তা নির্ধারণ করতে এটি পরিসংখ্যান ব্যবহার করতে পারে। হ্যাশিংয়ের মাধ্যমে, এটি O (n) (লিনিয়ার) সময়ে মিলগুলি আবিষ্কার করতে পারে। উভয় দিকের মিলগুলিতে পৌঁছানোর মাধ্যমে, পদ্ধতিটি বেশ কয়েকটি উচ্চ-স্কোরিং এবং সর্বাধিক সেগমেন্ট জোড়া সহ উচ্চ মানের প্রান্তিককরণ আবিষ্কার করে।

ব্লাস্ট অ্যালগরিদমের বিভিন্ন সংস্করণ এবং সম্প্রসারণ রয়েছে। উদাহরণস্বরূপ, মেগাব্লাস্ট, ডিসকন্টিনিউয়াস মেগাব্লাস্ট এবং ব্লাস্টএন সবই একটি নিউক্লিওটাইড সিকোয়েন্স চিনতে ব্যবহার করা যেতে পারে। MEGABLAST বিশেষভাবে একই ক্রমগুলির মধ্যে দীর্ঘ প্রান্তিককরণগুলি দক্ষতার সাথে খুঁজে বের করার জন্য ডিজাইন করা হয়েছে, এবং তাই একটি ক্যোয়ারী সিকোয়েন্সের সাথে অভিন্ন মিল খুঁজে পেতে এটি ব্যবহার করার জন্য সর্বোত্তম ডিভাইস৷

BLAST অনুসন্ধানের সংবেদনশীলতা নির্দেশক অপরিহার্য পরামিতিগুলির মধ্যে একটি হল মূল শব্দের দৈর্ঘ্য বা শব্দের আকার। শব্দের আকার BLASTN-এ নমনীয় এবং অনুসন্ধানের সংবেদনশীলতা উন্নত করতে ডিফল্ট মান থেকে ন্যূনতম 7-এ হ্রাস করা যেতে পারে। এইভাবে BLASTN বিভিন্ন জীব থেকে সম্পর্কিত নিউক্লিওটাইড ক্রমগুলির সারিবদ্ধতা আবিষ্কার করার ক্ষেত্রে MEGABLAST-এর থেকে উচ্চতর৷

স্ট্যান্ডার্ড প্রোটিন-প্রোটিন ব্লাস্ট (BLASTP) একটি ক্যোয়ারী অ্যামিনো অ্যাসিড সিকোয়েন্স চিনতে এবং প্রোটিন ডাটাবেসে একই সিকোয়েন্স আবিষ্কারের জন্য ব্যবহার করা হয়। অবস্থান-নির্দিষ্ট পুনরাবৃত্তি (PSI)-ব্লাস্ট উচ্চতর সংবেদনশীল প্রোটিন-সাদৃশ্য অনুসন্ধানের জন্য তৈরি করা হয়েছে। এটি খুব দূর থেকে সম্পর্কিত প্রোটিন আবিষ্কারের জন্য উপকারী।

প্যাটার্ন-হিট ইনিশিয়েটেড (PHI)-ব্লাস্ট সীমিত প্রোটিন প্যাটার্ন অনুসন্ধান করতে পারে। এটি এমন প্রোটিন অনুসন্ধান করার জন্য তৈরি করা হয়েছে যা ব্যবহারকারীর দ্বারা সংজ্ঞায়িত একটি প্যাটার্ন অন্তর্ভুক্ত করে এবং প্যাটার্নের কাছাকাছি থাকা ক্যোয়ারী সিকোয়েন্সের অনুরূপ৷


  1. ব্লোফিশ অ্যালগরিদমের অপারেশনগুলি কী কী?

  2. Blowfish এনক্রিপশন অ্যালগরিদম কি?

  3. তথ্য নিরাপত্তা RSA অ্যালগরিদম কি?

  4. C# দ্বারা সমর্থিত পালানোর ক্রমগুলি কী কী?