শিক্ষক, লেখক, সম্পাদক এবং অন্যান্য যারা নিয়মিত শব্দ এবং ধারণা নিয়ে কাজ করেন তাদের জন্য সাহিত্য চুরি সবসময়ই একটি সমস্যা হয়ে দাঁড়িয়েছে এবং ইন্টারনেটের আবির্ভাব এবং কপি-পেস্ট ফাংশনের কারণে এটি আরও খারাপ হয়েছে। চৌর্যবৃত্তি-চেকিং সফ্টওয়্যার সাহায্য করতে পারে, কিন্তু প্রতিটি প্রোগ্রামের একটি বড় ডাটাবেস বা একটি সঠিক অ্যালগরিদম নেই। কিছু স্কেচিয়ার পরীক্ষক এমনকি তাদের নিজস্ব উদ্দেশ্যে জমা দেওয়া সামগ্রী ব্যবহার করতে পারে। এমনকি সেরা চেকারদেরও 100 শতাংশ সাফল্যের হার নেই। কিন্তু চুরির জন্য টেক্সট চেক করে এমন টুলগুলি কীভাবে কাজ করে তা জানা থাকলে কোনটি আপনার সময়ের মূল্যবান তা নির্ধারণ করতে সাহায্য করবে।
কিভাবে চুরি-চেকার কাজ করে?
পাঠ্য-ম্যাচিং সফ্টওয়্যারের প্রতিটি অংশের নিজস্ব পদ্ধতি রয়েছে। বেশিরভাগই একই মৌলিক নীতিতে কাজ করে:উৎস উপাদানের একটি ডাটাবেসের বিপরীতে প্রবেশ করা বিষয়বস্তু পরীক্ষা করুন এবং মিলগুলি সন্ধান করুন। বিপুল পরিমাণ সামগ্রী বিবেচনা করে যা সম্ভাব্যভাবে চুরি করা হতে পারে, যদিও, এটি একটি তুচ্ছ কাজ নয়। একটি সাধারণ লাইন-বাই-লাইন অনুসন্ধান চিরকালের জন্য লাগবে এবং অকার্যকরভাবে সম্পদ-নিবিড় হবে।
এই কারণেই চুরির জন্য পাঠ্য পরীক্ষা করে এমন বেশিরভাগ সরঞ্জাম আঙুলের ছাপ ব্যবহার করে। ডাটাবেসের প্রতিটি পাঠ্যের অংশ এবং প্রতিটি পাঠ্যের জন্য তারা পরীক্ষা করে, তারা নমুনার সেট বের করে এবং প্রতিটিকে একটি হ্যাশিং অ্যালগরিদমের মাধ্যমে চালায় যা প্রতিটি ইনপুটের জন্য একটি অনন্য শনাক্তকারী তৈরি করে।
যদি একটি কাগজে একটি আঙ্গুলের ছাপ থাকে যা ডাটাবেসের একটির সাথে অভিন্ন, তাহলে এর অর্থ তাদের উভয়েরই একই ইনপুট রয়েছে এবং এটি চুরি হতে পারে। এটি অনিবার্যভাবে কম নির্ভুলতার ফলাফল দেয়, তবে একটি ভাল ফিঙ্গারপ্রিন্টিং অ্যালগরিদম কাগজ থেকে এমনভাবে নমুনা নিতে পারে যাতে এটি শুধুমাত্র সঠিক মিলই নয় কিন্তু চুরির ঘটনা সনাক্ত করতে পারে যেখানে কিছু বিষয়বস্তু পরিবর্তন করা হয়েছে – যেমন একটি স্পিনিং প্রোগ্রাম দ্বারা। পি>
যদি প্রোগ্রামটি একটি আঙ্গুলের ছাপের মিল খুঁজে পায়, তবে এটি কেবল চুরির সম্ভাব্য উদাহরণটিকে ফ্ল্যাগ করে এবং এটিকে একটি দিন বলে দিতে পারে। উচ্চ-মানের সফ্টওয়্যার, যদিও, প্রায়শই টেক্সট লাইনের লাইন চেক করতে সরাসরি স্ট্রিং ম্যাচিং ব্যবহার করবে। এটি এমন একটি কাজ যা ডাটাবেসটি সংকুচিত হয়ে গেলে গণনাগতভাবে অনেক হালকা হয়ে যায়। এটি প্রাথমিক ফিঙ্গারপ্রিন্ট হিট নিশ্চিত করতে সাহায্য করে এবং চূড়ান্ত সিদ্ধান্ত নেওয়ার জন্য মানুষের জন্য অনেক বেশি ডেটা প্রদান করে৷
একটি ভাল চুরির পরীক্ষকের জন্য জিনিসগুলি সন্ধান করুন
একটি চুরির পরীক্ষকের থাকা উচিত:
- দৃঢ় গোপনীয়তা নীতি (যেমন, তারা আপনার সামগ্রী সংরক্ষণ/বিক্রয় করে না)
- বড় ডাটাবেস
- ভাল অ্যালগরিদম
গোপনীয়তা নীতি
অনেক বিনামূল্যে (বা, প্রায়শই, ফ্রিমিয়াম) চুরির চেকার বৈধ, বিজ্ঞাপনের মাধ্যমে বা প্রিমিয়াম সংস্করণ বিক্রি করে অর্থ উপার্জন করে। যাইহোক, কিছু কম-বিবেকবান ব্যক্তিরা আসলে আপনার চেক করা লেখাটি গ্রহণ করছে এবং তাদের নিজস্ব উদ্দেশ্যে এটি ব্যবহার করছে। এটি একটি অধ্যয়ন ওয়েবসাইটে বিষয়বস্তু হিসাবে ব্যবহার করা হতে পারে বা একটি "স্পিনার" এর মাধ্যমে এটির শব্দ পরিবর্তন করতে এবং ট্র্যাফিক তৈরি করতে একটি নিবন্ধ হিসাবে রাখা হতে পারে। গোপনীয়তা নীতি পরীক্ষা করা এবং সাইটের খ্যাতি দ্রুত পরীক্ষা করা একটি ভাল ধারণা। বিশেষ করে এটি করুন যদি এটি কিছুটা স্ক্যাচি বা সত্য হতে খুব ভাল বলে মনে হয়৷
৷ডাটাবেস
যদি একজন চুরির পরীক্ষকের কাছে সঠিক উৎসের উপাদানের অ্যাক্সেস না থাকে, তাহলে সেই উপাদানটি কখন চুরি করা হয়েছে তা বলতে পারবে না। এটি সাধারণত সবচেয়ে বড় জিনিস যা নিম্ন-মানের চুরি চেকারদের তাদের প্রিমিয়াম প্রতিপক্ষ থেকে আলাদা করে। বই, নিবন্ধ, এবং অন্য কারোর মালিকানাধীন অন্যান্য সামগ্রীর সংগ্রহে অ্যাক্সেস পাওয়া বিনামূল্যে বা সহজ নয়, তাই অনেক সরঞ্জাম শুধুমাত্র ইন্টারনেট পরীক্ষা করতে পারে। সেখানেই প্রচুর চুরির ঘটনা ঘটে, যদিও, তাই বই, জার্নাল নিবন্ধ বা অন্যান্য ব্যক্তিগত সামগ্রীতে অ্যাক্সেস থাকা সবচেয়ে গুরুত্বপূর্ণ যদি আপনি চুরির জন্য পরীক্ষা করছেন যাতে কেউ হয়তো একটু বেশি কাজ করতে পারে।
অ্যালগরিদম
বেশিরভাগ চুরি-পরীক্ষাকারীরা তাদের অ্যালগরিদম স্পষ্টভাবে প্রকাশ করে না, তবে ফলাফলের গুণমান এবং নির্ভুলতা এটি কতটা ভালভাবে নির্মিত তার একটি ভাল সূচক। এটি সরাসরি পরিমাপ করা কঠিন হতে পারে, তবে এটি কতটা বিশদ বিবরণ দেয় তা দেখে, ব্যবহারকারীর পর্যালোচনাগুলি পড়া এবং অন্যান্য উত্স থেকে আপনার অনুলিপি করা উপাদান সনাক্ত করতে পারে কিনা তা পরীক্ষা করা আপনাকে সাইটটি কতটা ব্যাপকভাবে অনুসন্ধান করে তার একটি ভাল ধারণা দিতে পারে৷ যদি বিনামূল্যের সংস্করণটি উইকিপিডিয়া নিবন্ধ থেকে একটি কপি-পেস্ট নিতে ব্যর্থ হয়, উদাহরণস্বরূপ, আপনি সম্ভবত অর্থপ্রদত্ত সংস্করণটি খুব পুঙ্খানুপুঙ্খভাবে আশা করতে পারেন না৷
সেরা চুরির পরীক্ষক
পেশাদার-স্তরের চুরির চেকারগুলি বেশিরভাগই একটি মূল্যে আসে, এবং উপলব্ধ বেশিরভাগ বিনামূল্যের বিকল্পগুলি হয় Google-এর চেয়ে খারাপ বা গোপনীয়তা নীতিগুলি রয়েছে যা বোঝায় যে তারা তাদের নিজস্ব উদ্দেশ্যে আপনার সামগ্রী ব্যবহার করতে পারে৷ আপনি বিনামূল্যে পেতে পারেন এমন সেরাটি হয় কয়েকটি ট্রায়াল পৃষ্ঠা বা একটি সাধারণ প্রতিবেদন যা আপনাকে বলে যে চুরি আছে কিনা। পরবর্তীটি এখনও কার্যকর হতে পারে কারণ এটি আপনাকে মূল্যায়ন করার একটি দ্রুত উপায় দেয় যে আপনার আরও গভীরতার সরঞ্জাম ব্যবহার করা উচিত বা ম্যানুয়ালি একটি কাগজের মাধ্যমে যাওয়া উচিত।
আমি কয়েকটি পাঠ্য (আমি লিখেছি নিবন্ধ, উইকিপিডিয়া এন্ট্রি, এবং সংবাদ উত্স) ব্যবহার করে নীচের প্রতিটি সরঞ্জাম পরীক্ষা করেছি এবং সেগুলি সমস্ত সূত্র সহ চুরি করা বিষয়বস্তু সঠিকভাবে সনাক্ত করতে সক্ষম হয়েছিল। আমি বেশ কয়েকটি সম্পূর্ণ বিনামূল্যের সাইট পরীক্ষা করেছি, কিন্তু তাদের মধ্যে অনেকগুলি আমার নিবন্ধগুলির অনুচ্ছেদগুলি সনাক্ত করতে অক্ষম ছিল এবং এমনকি বিবিসি এবং উইকিপিডিয়া থেকে কপি-পেস্ট ধরতেও ব্যর্থ হয়েছিল, একটি দ্রুত Google অনুসন্ধানের সাথে সাথেই চুরি করা বিষয়বস্তু পপ আপ হওয়া সত্ত্বেও৷পি>
1. Google
যদি কোনও নির্দিষ্ট পাঠ্যের অংশ থাকে যা আপনি চুরি করা হয়েছে বলে সন্দেহ করেন, গুগল আসলে একটি দুর্দান্ত প্রথম স্টপ। আপনি একবারে কেবলমাত্র 32টি শব্দ অনুসন্ধান করতে পারেন, তবে এটি প্রায়শই ওয়েবসাইট, কাগজ বা বইটি চালু করার জন্য যথেষ্ট হতে পারে যা থেকে কেউ কপি করেছে, এমনকি তারা কয়েকটি শব্দ পরিবর্তন করলেও।
2. ব্যাকরণগতভাবে
সম্পূর্ণ চুরির ফলাফল পেতে আপনার জন্য ব্যাকরণগতভাবে এটি সম্পাদনা পরিষেবার সদস্যতা প্রয়োজন, তবে প্রাথমিক চেকের জন্য কোনও চার্জ নেই, যা আপনাকে বলে যে চুরির সম্ভাবনা আছে কি না। এটি আপনি অন্যান্য অনেক অ্যাপের চেয়ে অনেক বেশি, এবং আমি এটিকে বেশিরভাগ সময় সঠিকভাবে ফ্ল্যাগরিজম খুঁজে পেয়েছি, এটিকে একটি ভাল প্রথম-লাইন বিনামূল্যের বিকল্প হিসাবে তৈরি করে৷
3. সার্চ ইঞ্জিন রিপোর্টস
এটি মূলত একটি Google র্যাপার, তবে এটি বিনামূল্যে এবং প্রকৃতপক্ষে অন্যান্য অনেক বিনামূল্যের বিকল্পের চেয়ে ভাল কাজ করে। এটা আমি এটা সঠিক করা অধিকাংশ পেয়েছিলাম. SearchEngineReports আপনাকে প্রতি অনুসন্ধানে 2,000 শব্দের পাঠ্য পরীক্ষা করতে দেয় (অনুসন্ধানের সংখ্যার উপর কোন ঊর্ধ্ব সীমা ছাড়াই) এবং এটিকে টুকরো টুকরো করে Google এর মাধ্যমে চালাতে দেয়, আপনাকে বলে যে কোন বাক্যগুলি হিট করে৷ ভবিষ্যতে সনাক্তকরণ এড়াতে এটি আপনাকে চুরি করা বিষয়বস্তু পুনরায় লেখার বিকল্পও দেয়, যা আমি আপনাকে পরামর্শ দিচ্ছি না।
4. কপিলিকস
কপিলিকস আপনাকে 2,500 শব্দ বা প্রায় 10 পৃষ্ঠা বিনামূল্যে পরীক্ষা করে। এটি বেশ ব্যাপকভাবে ব্যবহৃত, একটি ব্যবহারকারী-বান্ধব ইন্টারফেস রয়েছে এবং এর বিরুদ্ধে পরীক্ষা করার জন্য একাডেমিক এবং বৈজ্ঞানিক কাজের একটি বড় ডাটাবেস অন্তর্ভুক্ত রয়েছে। আপনি যদি ইন্টারনেট সামগ্রীর বাইরে যেতে চান তবে এটি শুরু করার জন্য একটি নির্ভরযোগ্য জায়গা। এটি সমস্ত অনলাইন বিষয়বস্তু পেয়েছে যা আমি এটিতে নিক্ষেপ করেছি৷
৷5. Quetext
আপনি বিনামূল্যে তিনটি 500-শব্দ চেক পাবেন, এবং এর পরে আপনাকে সদস্যতা নিতে হবে। Quetext সঠিকতা এবং পুঙ্খানুপুঙ্খতার জন্য একটি ভাল খ্যাতি আছে, যদিও, এবং, সেই অনুযায়ী, এটি আমার পরীক্ষায় ভাল পারফর্ম করেছে। এর ডাটাবেসে প্রচুর বই এবং নিবন্ধের পাশাপাশি ইন্টারনেট সামগ্রী রয়েছে। আপনি যদি Copyleaks এর চেয়ে ব্যাপক কিন্তু সস্তা কিছু খুঁজছেন, Quetext শুরু করার জন্য একটি ভাল জায়গা।
6. প্লাগস্ক্যান
প্লাগস্ক্যানে বই, নিবন্ধ এবং অন্যান্য পাঠ্যের একটি বিস্তৃত ডাটাবেস রয়েছে এবং একটি বিশদ বিশ্লেষণ প্রদান করে যা, আমার জন্য, চুরি করা উত্সগুলির প্রায় সমস্ত শনাক্ত করা হয়েছে৷ বিনামূল্যের ট্রায়ালটি 2,000 শব্দের জন্য ভাল, এর পরে আপনাকে চালিয়ে যেতে ক্রেডিট কিনতে হবে। যদি আপনার কাছে পরীক্ষা করার জন্য প্রচুর পরিমাণে পাঠ্য না থাকে, তবে নির্দিষ্ট সংখ্যক শব্দ পরীক্ষা করার জন্য ক্রেডিট কেনার সিস্টেমটি বেশিরভাগ অন্যান্য চুরি চেককারীদের দ্বারা অফার করা সাবস্ক্রিপশন বিকল্পগুলির তুলনায় সস্তা হতে পারে৷
কোন ম্যাজিক বুলেট নেই
চুরির পরীক্ষকরা, বিশেষ করে বাজেটের, প্রায় নিশ্চিতভাবে সবকিছু ধরতে সক্ষম হবে না। যদি একজন চুরিকারী অস্পষ্ট উত্স ব্যবহার করে বা যথেষ্ট পুনর্লিখন করে, তবে তাদের পতাকাঙ্কিত করার জন্য একটি মেশিন খুব বেশি কিছু করতে পারে না, এমনকি জ্ঞানী মানুষকেও বোকা বানানো যায়। যদিও তারা প্রতিরক্ষার একটি ভাল প্রথম লাইন হতে পারে, এবং অন্ততপক্ষে কম-প্রচেষ্টা চুরি প্রতিরোধ করতে পারে।