একটি ফোল্ডারে সমস্ত এক্সেল ফাইল একত্রিত করতে, গ্লোব মডিউল এবং অ্যাপেন্ড() পদ্ধতি ব্যবহার করুন৷
আসুন আমরা বলি যেগুলি ডেস্কটপে আমাদের এক্সেল ফাইল −
Sales1.xlsx
Sales2.xlsx
দ্রষ্টব্য − আপনাকে openpyxl এবং xlrd প্যাকেজ ইনস্টল করতে হতে পারে।
প্রথমে, আপনি যে সমস্ত এক্সেল ফাইলগুলিকে মার্জ করতে চান সেই পথটি সেট করুন। এক্সেল ফাইলগুলি পান এবং গ্লোব −
ব্যবহার করে সেগুলি পড়ুনপথ ="C:\\Users\\amit_\\Desktop\\"filenames =glob.glob(path + "\*.xlsx")প্রিন্ট('ফাইলের নাম:', ফাইলের নাম)
এরপরে, মার্জড আউটপুট এক্সেল ফাইলের জন্য একটি খালি ডেটাফ্রেম তৈরি করুন যা উপরের দুটি এক্সেল ফাইল থেকে ডেটা পাবে -
outputxlsx =pd.DataFrame()
এখন, আসল প্রক্রিয়াটি দেখা যাবে যেমন প্রথমে, লুপ ব্যবহার করে এক্সেল ফাইলগুলিকে পুনরাবৃত্তি করুন। এক্সেল ফাইলগুলি পড়ুন, সেগুলিকে সংযোজন করুন এবং ডেটা যোগ করুন -
ফাইলের নামের ফাইলের জন্য:df =pd.concat(pd.read_excel(file, sheet_name=None), ignore_index=True, sort=False) outputxlsx =outputxlsx.append(df, ignore_index=True)
উদাহরণ
নিম্নলিখিত কোড -
pdimport গ্লোব হিসেবে পান্ডা আমদানি করুন# ডেস্কটপ পাথ থেকে এক্সেল ফাইল একত্রিত করা হচ্ছে ="C:\\Users\\amit_\\Desktop\\"# এক্সটেনশন .xlsx সহ সমস্ত ফাইল পড়ুন অর্থাৎ এক্সেল ফাইলের নাম =গ্লোব। glob(path + "\*.xlsx")প্রিন্ট('ফাইলের নাম:', ফাইলের নাম)# একত্রিত এক্সেল ফাইলের সাথে নতুন আউটপুট এক্সেল ফাইলের জন্য খালি ডাটা ফ্রেম outputxlsx =pd.DataFrame()# লুপের জন্য সমস্ত এক্সেল ফাইল পুনরাবৃত্তি করার জন্য ফাইলের নামগুলিতে ফাইল:# এক্সেল ফাইলগুলির জন্য concat ব্যবহার করে # read_excel() df =pd.concat(pd.read_excel( ফাইল, শীট_নাম=কোনও নয়), ignore_index=True, sort=False) # এক্সেল ফাইলের ডেটা যুক্ত করার পরে outputxlsx =outputxlsx.append( df, ignore_index=True)প্রিন্ট('ফাইনাল এক্সেল শীট এখন একই স্থানে তৈরি হয়েছে:')outputxlsx.to_excel("C:/Users/amit_/Desktop/Output.xlsx", index=False)প্রে>আউটপুট
এটি নিম্নলিখিত আউটপুট তৈরি করবে অর্থাৎ, মার্জ করা এক্সেল ফাইল একই অবস্থানে তৈরি হবে −