C++ এ বিকে ট্রি পরিচিতি

বিকে ট্রি বা বুরখার্ড ট্রি হল ডেটা স্ট্রাকচারের একটি রূপ যা সাধারণত লেভেনশটাইন দূরত্বের উপর ভিত্তি করে বানান পরীক্ষা করতে ব্যবহৃত হয়। এটি স্ট্রিং ম্যাচিং এর জন্যও ব্যবহার করা হয় স্বয়ংক্রিয় সংশোধন বৈশিষ্ট্যটি এই ডেটা কাঠামো তৈরি করতে ব্যবহার করা যেতে পারে। ধরা যাক আমাদের একটি অভিধানে কিছু শব্দ আছে এবং আমাদের বানান ত্রুটির জন্য অন্য কিছু শব্দ পরীক্ষা করতে হবে। আমাদের প্রদত্ত শব্দের কাছাকাছি শব্দের একটি সংগ্রহ থাকা দরকার যার বানান পরীক্ষা করতে হবে। উদাহরণস্বরূপ, যদি আমাদের কাছে "uck" শব্দ থাকে তবে সঠিক শব্দটি হতে পারে (ট্রাক, হাঁস, হাঁস, চুষা)। তাই বানান ভুল সংশোধন করা যেতে পারে একটি শব্দ মুছে দিয়ে বা একটি উপযুক্ত অক্ষর দ্বারা একটি অক্ষর প্রতিস্থাপন করে একটি নতুন শব্দ যোগ করে। একটি প্যারামিটার হিসাবে সম্পাদনা দূরত্ব ব্যবহার করা এবং অভিধানের সাথে বানান পরীক্ষা করা।

অন্য সব গাছের মতো, বিকে ট্রিতেও নোড এবং প্রান্ত রয়েছে নোডগুলি একটি অভিধানে শব্দগুলিকে উপস্থাপন করে প্রান্তটিতে কিছু পূর্ণসংখ্যা ওজন রয়েছে যা আমাদের একটি নোড থেকে অন্য নোডের দূরত্ব সম্পাদনা সম্পর্কে তথ্য দেয়৷

{বুক, বই, বু, কেক, কেপ} −

শব্দ সহ একটি অভিধান বিবেচনা করুন

বিকে ট্রি

BK Tree-এর প্রতিটি নোটে একই সম্পাদনা দূরত্ব সহ একটি চাইল্ড নোড রয়েছে। যদি আমরা নোড সন্নিবেশ করার সময় সম্পাদনা দূরত্বে কিছু সংঘর্ষের সম্মুখীন হই, আমরা সঠিক সন্তান না পাওয়া পর্যন্ত সন্নিবেশ প্রক্রিয়াটি প্রচার করব। প্রতিটি সন্নিবেশ রুট নোড দিয়ে শুরু হয় রুট নোড যেকোনো শব্দ হতে পারে। এখন পর্যন্ত আমরা Bk Tree কি তা জেনেছি। এখন দেখা যাক কিভাবে সঠিক নিকটতম শব্দ খুঁজে বের করা যায়। প্রথমত, আমাদের সহনশীলতার মান নির্ধারণ করতে হবে এই সহনশীলতার মান আমার ভুল বানান এবং সঠিক শব্দের মধ্যে সর্বাধিক সম্পাদনা দূরত্ব ছাড়া কিছুই নয়৷

সহনশীলতা সীমার মধ্যে যোগ্য সঠিক শব্দ খুঁজে পেতে আমরা পুনরাবৃত্তি প্রক্রিয়া ব্যবহার করি। কিন্তু এটির একটি উচ্চতর জটিলতা রয়েছে তাই এখন BK ট্রি কাজ করে কারণ আমরা জানি যে বাইনারি ট্রির প্রতিটি নোড প্যারেন্ট থেকে এর সম্পাদনা দূরত্বের উপর ভিত্তি করে তৈরি করা হয়। তাই আমরা সরাসরি রুট নোড থেকে নির্দিষ্ট নোডে যেতে পারি যা সহনশীলতার সীমার মধ্যে থাকে। যদি TOL সহনশীলতার সীমা হয় এবং ভুল বানান নোড থেকে বর্তমান নোডের দূরত্ব সম্পাদনা করে dist। তাই এখন, আমরা কেবলমাত্র সেই শিশুদের পুনরাবৃত্তি করব যাদের পরিসরে দূরত্ব সম্পাদনা করা হয়েছে।

[dist - TOL, dist+TOL], এটি একটি বৃহত্তর পরিমাণে জটিলতা হ্রাস করে৷

উদাহরণ

কাজের চিত্রিত করার জন্য প্রোগ্রাম -

#include "bits/stdc++.h"
using namespace std;
#define MAXN 100
#define TOL 2
#define LEN 10
struct Node {
   string word;
   int next[2*LEN];
   Node(string x):word(x){
      for(int i=0; i<2*LEN; i++)
      next[i] = 0;
   }
   Node() {}
};
Node RT;
Node tree[MAXN];
int ptr;
int min(int a, int b, int c) {
   return min(a, min(b, c));
}
int editDistance(string& a,string& b) {
   int m = a.length(), n = b.length();
   int dp[m+1][n+1];
   for (int i=0; i<=m; i++)
      dp[i][0] = i;
   for (int j=0; j<=n; j++)
      dp[0][j] = j;
   for (int i=1; i<=m; i++) {
      for (int j=1; j<=n; j++) {
         if (a[i-1] != b[j-1])
            dp[i][j] = min( 1 + dp[i-1][j], 1 + dp[i][j-1], 1 + dp[i-1][j-1] );
         else
            dp[i][j] = dp[i-1][j-1];
      }
   }
   return dp[m][n];
}
void insertValue(Node& root,Node& curr) {
   if (root.word == "" ){
      root = curr;
      return;
   }
   int dist = editDistance(curr.word,root.word);
   if (tree[root.next[dist]].word == ""){
      ptr++;
      tree[ptr] = curr;
      root.next[dist] = ptr;
   }
   else{
      insertValue(tree[root.next[dist]],curr);
   }
}
vector <string> findCorrectSuggestions(Node& root,string& s){
   vector <string> corrections;
   if (root.word == "")
      return corrections;
   int dist = editDistance(root.word,s);
   if (dist <= TOL) corrections.push_back(root.word);
      int start = dist - TOL;
   if (start < 0)
      start = 1;
   while (start < dist + TOL){
      vector <string> temp = findCorrectSuggestions(tree[root.next[start]],s);
      for (auto i : temp)
      corrections.push_back(i);
      start++;
   }
   return corrections;
}
int main(){
   string dictionary[] = {"book","cake","cart","books", "boo" };
   ptr = 0;
   int size = sizeof(dictionary)/sizeof(string);
   for(int i=0; i<size; i++){
      Node tmp = Node(dictionary[i]);
      insertValue(RT,tmp);
   }
   string word1 = "ok";
   string word2 = "ke";
   vector <string> match = findCorrectSuggestions(RT,word1);
   cout<<"Correct words suggestions from dictionary for : "<<word1<<endl;
   for (auto correctWords : match)
   cout<<correctWords<<endl;
   match = findCorrectSuggestions(RT,word2);
   cout<<"Correct words suggestions from dictionary for : "<<word2<<endl;
   for (auto correctWords : match)
   cout<<correctWords<<endl;
   return 0;
}

আউটপুট

Correct words suggestions from dictionary for : ok
book
boo
Correct words suggestions from dictionary for : ke
cake