কম্পিউটার

কিভাবে পাইথন দিয়ে মাইক্রোসফট ওয়ার্ড পড়তে হয়?


পরিচয়...

কোন অপরাধ নেই, আমি মাইক্রোসফ্ট শব্দ বা স্প্রেডশীট পছন্দ করি না। একজন ডেটা ইঞ্জিনিয়ারিং বিশেষজ্ঞ হওয়ার কারণে, আমি প্রায়ই মাইক্রোসফ্ট শব্দে পরীক্ষকদের কাছ থেকে পরীক্ষার ফলাফল পাই। দীর্ঘশ্বাস! তারা স্ক্রিন শট, লিঙ্ক, বড়, খুব বড়, খুব বড় অনুচ্ছেদগুলি ক্যাপচার করা থেকে ওয়ার্ড ডকুমেন্টে অনেক তথ্য রাখে। সাধারণ টেক্সট নথি বা ছোট তথ্যকে বড়, ধীর, বাজে থেকে খোলা জন্তুতে পরিণত করার জন্য মাইক্রোসফ্ট শব্দের বিশেষ প্রতিভা ছিল যা প্রায়শই মেশিন থেকে মেশিনে ফর্ম্যাটিং হারায়৷

তবে, আমাকে এই সত্যটি মেনে নিতে হবে যে আমার জন্য যা খারাপ তা অন্যদের জন্য খুব ভাল এবং এর বিপরীতে।

প্রসঙ্গে ফিরে যান, শব্দের জন্য পাইথন সমর্থন দুর্দান্ত নয়। Python-docx লাইব্রেরি ব্যবহারকারীদের নথি তৈরি করতে এবং ফাইলের আকার এবং শিরোনামের মতো মৌলিক ফাইল ডেটা পড়ার ক্ষমতা দেয়, প্রকৃত বিষয়বস্তু নয়। তাই, পরীক্ষার ফলাফল প্রক্রিয়া করার জন্য আমাকে কাস্টম কোড নিয়ে আসতে হবে।

আমি ইন্টারনেটে উপলব্ধ একটি নমুনা শব্দ নথি আমদানি করব। ফাইলটি অবস্থানে রয়েছে - https://file-examples-com.github.io/uploads/2017/02/file-sample_100kB.docx।

কিভাবে করবেন...

1. আসুন আমরা আমদানি দিয়ে শুরু করি।

from zipfile import ZipFile
from urllib.request import urlopen
from io import BytesIO

2.এখন আমরা বাইনারি ফাইল অবজেক্ট হিসেবে রিমোট ওয়ার্ড ডকুমেন্ট পড়ব। তারপরে আমরা জিপফাইল লাইব্রেরি ব্যবহার করে এটিকে আনজিপ করি এবং তারপরে আনজিপ করা ফাইলটি পড়ি, যা হল XML৷

অবশ্যই, আমরা বিষয়বস্তু প্রিন্ট করব।

file_url = 'https://file-examples-com.github.io/uploads/2017/02/file-sample_100kB.docx'

# read the word document
wordDocx = urlopen(file_url).read()
wordDocx = BytesIO(wordDocx)
document = ZipFile(wordDocx)

#get the xml content
xml_content = document.read('word/document.xml')

# print the xml content
print(xml_content.decode('utf-8'))



Lorem ipsum 



লোরেম ইপসাম ডলোর সিট amet, consectetur adipiscing elit. Nunc ac faucibus odio. 



 Vestibulum neque massa, scelerisque sit amet ligula eu, congue molestie mi. বিভিন্ন ধরনের অনুরোধ করুন. নুল্লাম এট পোর্টটিটর আরকু, নেক ল্যাকিনিয়া নিসি। ইউটি এসি ডলোর ভিটা অডিও ইন্টারডাম কনডিমেন্টাম। Vivamus dapibus sodales ex, vitae malesuada ipsum cursus convallis. Maecenas sed egestas nulla, ac condimentum orci. Mauris diam felis, vulputate ac suscipit et, iaculis non est. স্থির করা সেম্পার আরকিউ এসি লিগুলা সেম্পার, nec luctus nisl blandit. পূর্ণসংখ্যা ল্যাকিনিয়া পূর্বে এসি libero lobortis imperdiet. Nullam mollis convallis ipsum, accomsan Nunc vehicula vitae. ফেলিস ট্রিস্টিক ফ্রিংগিলাতে নুলা এগেট জাস্টো। Morbi বসে amet tortor quis risus auctor condimentum. মরবি উললামকরপার এলিট. Nulla iaculis tellus sit amet mauris tempus fringilla.

   Maecenas mauris lectus, lobortis et purus mattis, blandit dictum Tellus.

 Maecenas non lorem quis telus placerat varius. 

Nulla facilisi. 

Aenean congue fringilla justo ut aliquam. 

Mauris id ex erat. Nunc vulputate neque vitae justo facilisis, non condimentum ante sagittis. 

Morbi viverra Semper lorem NEC molestie. 

Maecenas tincidunt est efficitur ligula euismod, sit amet ornare est vulputate.

 

 

 



  



 

 

  

 অ মৌরিস জাস্টোতে। দুস যানবাহন আমার বা আমার প্রিমিয়াম, একটি ভাইভাররা সময় কার্যকরী. Cras aliquam est ac eros varius, id iaculis dui auctor. এই প্রিমিয়াম নেক লিগুলা, এবং পালভিনার মাই প্লেসরাট এবং। নুলা নেক nunc সিট amet nunc posuere vestibulum. আপনি id neque eget tortor mattis tristique. এটা আগে, blandit sit amet tristique vel, lacinia pulvinar arcu. Pellentesque scelerisque fermentum erat, id posuere justo pulvinar ut. Cras id eros sed enim aliquam lobortis. Sed lobortis nisl ut eros efficitur tincidunt. Cras justo mi, porttitor quis mattis vel, ultricies ut purus. Ut facilisis et lacus eu cursus.

  ইলিফেন্ড ভেলিট ভিটা লিবারো সলিসিটুডিন ইউইসমোডে। ফিউস ভিটা ভেস্টিবুলাম ভেলিট। Pellentesque vulputate lectus quis pellentesque commodo. আলিকুম ইরাত ভলুটপাট। এজেস্টাস ভেলিটে ভেস্টিবুলাম। Pellentesque fermentum nisl vitae fringilla venenatis. Etiam id mauris vitae orci maximus ultricies. 



 C ras fringilla ipsum magna, in fringilla dui commodo a.

 
 
 
 w:right w:val='nil'/>
 লোরেম ইপসাম
 
লোরেম ইপসাম

লোরেম ইপসাম

1

 
                              
                
  1. বোকেহ (পাইথন) এর চিত্রগুলির সাথে কীভাবে কাজ করবেন?

  2. পাইথন ওপেনসিভিতে একটি চিত্র কীভাবে পড়তে হয়?

  3. কিভাবে মাইক্রোসফ্ট ওয়ার্ড অনুচ্ছেদ তৈরি করবেন এবং পাইথনে চিত্রগুলি সন্নিবেশ করবেন?

  4. কিভাবে বিনামূল্যে মাইক্রোসফট ওয়ার্ড দিয়ে ব্যাকরণ ব্যবহার করবেন