কম্পিউটার

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

সম্প্রতি, সত্যিই দুর্দান্ত, নতুন, অনন্য লিনাক্স সফ্টওয়্যার খুঁজে পাওয়া একটি কঠিন কাজ হয়ে উঠেছে। টুকিটাকি. এবং সম্প্রতি, আমি আসলে এই গত চার বা পাঁচ বছর বোঝাতে চেয়েছিলাম, এমনকি ডেস্কটপ স্পেসে উৎসাহ এবং উদ্ভাবনের ধীর পতন শুরু হওয়ার পর থেকে। সর্বোপরি, একটি সীমিত বুদ্ধিমত্তার মধ্যে কতটা ভাল জিনিস থাকতে পারে তার একটা সীমা আছে, কিন্তু আসুন মোবাইলে ফোকাস করার ভুল স্থানান্তর এবং লিনাক্স-এর বছরের স্বপ্নকে ভেঙে ফেলার কথা ভুলে যাই না।

এটি OCRFeeder নামে একটি চার বছর বয়সী সফ্টওয়্যারের আমার পরীক্ষাকে বৈধ করে তোলে, আমি মনে করি। দুটি কারণে। এটা ভাল হলে, এটা ভাল. দ্বিতীয়ত, আমি সর্বদা অপটিক্যাল ক্যারেক্টার রিকগনিশনের অগ্রগতিতে আগ্রহী ছিলাম এবং আমাদের টুলস (এআই পড়ুন) এখানে যুক্তিসঙ্গত কাজ করতে পারে কিনা। আমি কিছুক্ষণ আগে এই বিষয়ে বিস্তারিত লিখেছিলাম, এবং তারপর 2015 সালে YAGF পর্যালোচনা করেছি। এখন, OCRFeeder এবং এটি কী করতে পারে তা দেখে নেওয়া যাক। আমার পরে, সাহসী লিনাক্স যোদ্ধা।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

শব্দগুলি সহজে jpg করতে আসে না

আমি প্রোগ্রাম ইনস্টল. বেশ কয়েকটি লাইব্রেরি রয়েছে যা আপনাকে দখল করতে হবে। উবুন্টু 18.04 এ, তালিকাটি বেশ কয়েকটি লাইন জুড়ে ছিল। আপনি এই প্রোগ্রামের জন্য ডিফল্ট কিট হিসাবে Tesseract OCR ইঞ্জিন পাবেন৷

নিম্নলিখিত অতিরিক্ত প্যাকেজগুলি ইনস্টল করা হবে:
blt gir1.2-goocanvas-2.0 gir1.2-gtkspell3-3.0 libgoocanvas-2.0-9 libgoocanvas-2.0-common libgtkspell3-3-0 liblept5 libtesseract4-python-python4 দ্বারা chardet python-enchant python-html5lib python-lxml python-numpy python-olefile python-pil python-renderpm python-reportlab python-reportlab-accel python-sane python-tk python-tk python-soctessereng-webjectoctessereng -osd tk8.6-blt2.5 unpaper yelp yelp-xsl

প্রস্তাবিত প্যাকেজ:
blt-demo python-gobject python-wxgtk3.0 python-genshi python-lxml-dbg পাইথন- lxml-doc gfortran python-dev python-nose python-numpy-dbg python-numpy-doc python-pil-doc python-pil-dbg python-renderpm-dbg পাইথন-ইজেনিক্স-mxtexttools-পাইথন-ল্যাবপোর্ট tix python-tk-dbg

এটি চালু করেছে। ইন্টারফেসটি কিছুটা উপযোগী। আপনাকে প্রথমে এক বা একাধিক ছবি লোড করতে হবে, যা আপনি আপনার ওসিআর ইঞ্জিনকে খাওয়ানোর জন্য ব্যবহার করবেন এবং আশা করি, এটি অন্য প্রান্তে যুক্তিসঙ্গত-নির্ভুল পাঠ্য তৈরি করবে। একবার আপনার এটি করা হয়ে গেলে, আপনি পাঠ্যটি LibreOffice-এ রপ্তানি করতে পারেন৷

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCR ইঞ্জিন

আমি যেমন উল্লেখ করেছি, ডিফল্টরূপে, OCRFeeder Tesseract ব্যবহার করবে, কিন্তু আপনি আপনার পছন্দ মতো অন্য কোনো ইঞ্জিন যোগ করতে পারেন। প্রকৃতপক্ষে, আমি CuneiForm, GOCR এবং Ocrad চেষ্টা করেছি এবং প্রোগ্রামটি সঠিকভাবে সনাক্ত করেছে এবং সেগুলিকে লোড করেছে। খুব ঝরঝরে. এটি আপনাকে একাধিক উপায়ে আপনার দস্তাবেজগুলি চেষ্টা করার ক্ষমতা দেয়, কারণ এই ইঞ্জিনগুলির মধ্যে আপনার ভাগ্য বেশি হতে পারে৷

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

sudo apt-get install cuneiform gocr ocrad

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

চিত্র থেকে পাঠ্য রূপান্তর

এখন, গুরুত্বপূর্ণ অংশ। আমি এখানে একটু সংগ্রাম করেছি। আমি প্রোগ্রামটিকে সমস্ত উপলব্ধ চিত্রগুলিতে পাঠ্য স্বয়ংক্রিয়ভাবে সনাক্ত করতে দিয়েছি (সমস্ত পৃষ্ঠাগুলি সনাক্ত করতে) এবং আমি কিছু অদ্ভুত রঙ-চিহ্নিত আউটপুট পেয়েছি। এই জিনিসটি তিনটি লোড করা PNG ফাইলের জন্য সম্পূর্ণ হতে প্রায় তিন মিনিট সময় নেয় এবং সেই সময়ে, OCRFeeder CPU ব্যবহার ছিল প্রায় 17%, এবং Tesseract প্রায় 4-5% ব্যবহার করে। তাই সময় অবশ্যই ছোট করা যেতে পারে যদি অ্যাপ্লিকেশনটি সমস্ত প্রসেসর কোর ব্যবহার করে আরও ভাল কাজ করে। তারপর, অদ্ভুত আউটপুট. আমি কি করব পুরোপুরি নিশ্চিত ছিলাম না। অস্বাভাবিক. দেখে মনে হচ্ছিল আমি মোটেও অগ্রগতি করছি না।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

তারপর, আমি বুঝতে পেরেছিলাম যে আমি প্রদর্শিত চিত্রগুলির অংশগুলিকে টেনে আনতে এবং নির্বাচন করতে মাউস ব্যবহার করতে পারি, এবং তারপরে, একটি পৃথক ফলক খুলবে, যেখানে আমি পছন্দসই OCR ইঞ্জিন চয়ন করতে পারি এবং প্রকৃত রূপান্তর চালাতে পারি। ভিজ্যুয়াল গ্লিচ বাদ দিয়ে, এটি যুক্তিসঙ্গতভাবে ভাল কাজ করেছে, এবং প্রতিটি ছবি প্রক্রিয়া করতে মাত্র কয়েক সেকেন্ড সময় লেগেছে।

কোনো প্রশিক্ষণ বা ডিফল্ট পরিবর্তন ছাড়াই, চারটি উপলব্ধ ইঞ্জিনের মধ্যে ফলাফলের বৈচিত্র ছিল বিশাল। Tesseract সেরা প্রদর্শন করেছে - এবং শুধুমাত্র গ্রহণযোগ্য রূপান্তর। বাকি সব ব্যবহার বিবেচনা করার জন্য যথেষ্ট ভাল ছিল না. আমি নিশ্চিত নই কেন, ঠিক সেভাবেই।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

আমি ধূসর-ব্যাকগ্রাউন্ড চিত্রের সাথে আরও ভাল ফলাফল লক্ষ্য করেছি। অতীতে, Tesseract সংগ্রাম করেছিল, তাই এই ইঞ্জিনে যা কিছু উন্নতি হয়েছে, সেগুলিকে স্বাগত জানাই৷ কিন্তু তারপরে, এটি কঠোরভাবে একটি OCRFeeder জিনিস নয়, এবং আপনি চাইলে, কমান্ড লাইন থেকে, আপনি নিজে থেকে Tesseract চালাতে পারেন।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

ডেস্কিং এবং আনপেপারিং

OCRFeeder দুটি নিফটি ফাংশনের সাথে আসে - তির্যক চিত্র স্ক্যানে পাঠ্য স্বয়ংক্রিয়ভাবে ঘোরানোর চেষ্টা করার ক্ষমতা এবং শব্দ কমাতে এবং আরও সঠিক রূপান্তর করার জন্য কাগজের পটভূমি সরানোর ক্ষমতা। আমি উভয় বিকল্প চেষ্টা করেছি, এবং Deskew ঠিক কাজ করেছে। কাগজবিহীন, তাই কিন্তু আমি পাঠ্যটি ঘোরানোর পরে (যা আমি জিআইএমপি ইন কন্ট্রোল ইমেজে করেছিলাম যখন), রূপান্তরের ফলাফল আরও ভাল ছিল।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

ODT-এ রপ্তানি করুন

এই একটি বিট চতুর ছিল. আমি এটি কয়েকবার চেষ্টা করেছি, এবং আমি একটি গুচ্ছ ত্রুটি আঘাত করেছি। অবশেষে এটি কাজ করেছে। আউটপুটটি সবচেয়ে সুন্দর নয়, তবে ভাল জিনিস হল, আপনি একই সময়ে একাধিক রূপান্তর রপ্তানি করতে পারেন, বিভিন্ন ইমেজের জন্য বিভিন্ন ইঞ্জিন ব্যবহার করা সহ। বেশ নিফটি।

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

পছন্দগুলি

অবশেষে, আপনার কাছে প্রোগ্রামের আচরণ পরিবর্তন করার বিকল্প আছে। খুব বড় কিছু নয়, তবে এটি সনাক্তকরণ এবং নির্ভুলতার সাথে সাহায্য করতে পারে। আপনি কীভাবে পাঠ্য কলামের প্রস্থ, মার্জিন, ভাষা নির্বাচন এবং একইভাবে সনাক্ত করেন তা বেশিরভাগ ক্ষেত্রেই আসে। বেশিরভাগ মানুষের জন্য, ডিফল্টগুলি একটি যুক্তিসঙ্গত শুরুর পয়েন্ট হবে৷

OCRFeeder - যেখানে চিত্রগুলি পাঠ্যে যায়

উপসংহার

OCRFeeder হল একটি যুক্তিসঙ্গত, নমনীয় সফটওয়্যার। এটি একাধিক ইঞ্জিন ব্যবহার করতে পারে এবং ইমেজ-ফিক্সিং অ্যালগরিদম একটি চমৎকার সংযোজন। এটি OCRFeederকে মুক্তবাজারে সম্ভবত এই ধরণের সবচেয়ে প্রতিশ্রুতিশীল সফ্টওয়্যার করে তোলে, কিন্তু তারপরে আপনার আশা এখনই ভেস্তে যেতে হবে, কারণ এটি শীঘ্রই কোনও আপডেট দেখার সম্ভাবনা নেই, যদি না কেউ এটি তুলে নেয়। কারণ এর মধ্যে বাজার আছে, কিন্তু লিনাক্স বিশ্ব ক্লান্তি এবং উদাসীনতার মধ্যে একটি কঠিন অবস্থানে আটকে আছে।

তা একদিকে, বয়স এবং আপডেটগুলি একপাশে, বেশিরভাগ অংশের জন্য, OCRFeeder বিতরণ করেছে। রূপান্তরের গুণমান খারাপ ছিল না, আপনি আপনার কাজ করার জন্য একটি UI ব্যবহার করে কিছু হারাবেন না এবং এক্সপোর্ট ফাংশন আপনাকে আরও সম্পাদনা করার জন্য চমৎকার নথি তৈরি করতে দেয়। আমি Tesseract এর উন্নতিতেও খুশি। তাই যদি আপনার কাছে একগুচ্ছ টেক্সট-হ্যাপি ইমেজ থাকে এবং আপনি প্রাচীন আকারে হাতে লেখা পাঠকে আধুনিক এবং ব্যবহারযোগ্য কিছুতে রূপান্তর করার চেষ্টা করতে চান, আপনি এটি করতে পারেন। OCRFeeder স্ক্যানার থেকে সরাসরি পড়ার পাশাপাশি PDF সমর্থন করে। ভাল পরীক্ষা মূল্য. এখন যাবার পালা, বাই বাই।

চিয়ার্স।


  1. Go-oo - একটি মোচড় দিয়ে OpenOffice

  2. 5টি দুর্দান্ত নোটপ্যাড++ কৌশল

  3. OpenOffice 3 - চমৎকার! - পর্যালোচনা

  4. মিরো - ইন্টারনেট টিভি