CSV ফাইল বা কমা বিভক্ত মান ফাইল হল প্ল্যাটফর্ম জুড়ে ডেটা সঞ্চয় এবং হেয়ার করার জন্য সর্বাধিক ব্যবহৃত ফ্ল্যাট ফাইলগুলির মধ্যে একটি৷ কলামগুলি কমা দ্বারা পৃথক করা হয় এবং ঐচ্ছিক হেডার সারিও রয়েছে যা প্রতিটি কলামের নাম নির্দেশ করবে। পাইথন অনেক মডিউল ব্যবহার করে CSV ফাইল পড়তে পারে। এই নিবন্ধে আমরা দেখতে পাব কিভাবে পাইথনের CSV লাইব্রেরি একটি CSV ফাইল পড়তে এবং লিখতে ব্যবহার করা যেতে পারে। CSV ফাইল পড়ার জন্য আমরা পান্ডাস লাইব্রেরিও দেখতে পারি।
CSV মডিউল ব্যবহার করে CSV ফাইল পড়া
আমরা (https://www.guru99.com/python-csv.html) থেকে CSV ফাইল পেতে পারি
উদাহরণ
csv আমদানি করুন ওপেন ('C:\\iris.csv','rt') ফাইল হিসাবে:csv_rows =csv.reader(ফাইল) csv_rows এ সারির জন্য:প্রিন্ট(সারি)
আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
['sepal.length', 'sepal.width', 'petal.length', 'petal.width', 'variety']['5.1', '3.5', '1.4', '.2', 'সেটোসা']['4.9', '3', '1.4', '.2', 'সেটোসা']['4.7', '3.2', '1.3', '.2', 'সেটোসা'][' 4.6', '3.1', '1.5', '.2', 'Setosa']['5', '3.6', '1.4', '.2', 'Setosa']['5.4', '3.9' , '1.7', '.4', 'Setosa']['4.6', '3.4', '1.4', '.3', 'Setosa']………………………………
পান্ডাস ব্যবহার করে CSV ফাইল পড়া
পান্ডাস লাইব্রেরি সিএসভি ফাইলগুলি পড়ার জন্যও ব্যবহার করা যেতে পারে। এটিতে csv পড়ার পদ্ধতি রয়েছে যা পাথ এবং ফাইলের নাম বাইপাস করে সরাসরি প্রয়োগ করা যেতে পারে। ফাইলটি পড়া হয়ে গেলে এটি একটি ডেটা সেটে পরিণত হয় এবং তারপরে আমরা প্রয়োজনীয় ডেটা সেটের বিভিন্ন অংশ প্রিন্ট করতে পারি।
উদাহরণ
pddatainput =pd.read_csv('C:\\iris.csv')প্রিন্ট ("প্রদত্ত ডেটাসেট মান :\n", ডেটাইনপুট) #ডেটাসেটপ্রিন্টের আকার ("\nডেটাসেটের আকার হল:\n",datainput.shape)#ডেটাসেটপ্রিন্ট থেকে কয়েকটি সারি প্রিন্ট করা হচ্ছে("\n ডেটাসেট থেকে কয়েকটি সারি প্রিন্ট করা হচ্ছে :\n",datainput[0:6])
আউটপুট
উপরের কোডটি চালানোর ফলে আমাদের নিম্নলিখিত ফলাফল পাওয়া যায় -
প্রদত্ত ডেটাসেট মান:sepal.length sepal.width petal.length petal.width variety0 5.1 3.5 1.4 0.2 Setosa1 4.9 3.0 1.4 0.2 Setosa2 4.7 3.2 1.3 0.2 Setosa2 4.7 3.2 1.3 0.2 Setosa34..2614..26140..2 Setosa34..2614..26140..2614.. ... ... ... ... 145 6.7 3.0 5.2 2.3 Virginica146 6.3 2.5 5.0 1.9 Virginica147 6.5 3.0 5.2 2.0 Virginica148 6.2 3.4 5.4 2.3 of the Virginicas .514 data.5014 . হল :(150, 5)ডেটাসেট থেকে কয়েকটি সারি প্রিন্ট করা হচ্ছে :sepal.leng th sepal.width petal.length petal.width varieties0 5.1 3.5 1.4 0.2 Setosa1 4.9 3.0 1.4 0.2 Setosa2 4.7 3.2 1.3 0.2 Setosa3 4.6 3.1 0.2 Setosa3 4.6 3.1 1.5 Setosa3 4.6 3.1 1.5 Se.47 Se.41 0.47 Se.47 0.47 Se. 5.5 0.47 0.47.CSV মডিউল ব্যবহার করে CSV ফাইল লেখা
একটি csv ফাইল তৈরি করতে আমরা পাইথন তালিকা ব্যবহার করি আমরা একটি তালিকা হিসাবে প্রতিটি সারি সম্বলিত একটি ডেটা সেট ঘোষণা করি এবং সমস্ত সারি একটি বড় গায়ক তালিকায় সাবলিস্ট করা হয়। আমরা আরেকটি ডেটা সেট তৈরি করি যা কেবল হেডার সারিকে উপস্থাপন করে। তারপরে আমরা বিভিন্ন পদ্ধতি ব্যবহার করি যেমন writerow() এবং csv.writer অবশেষে স্থানীয় সিস্টেমে ফাইলটি লিখতে।
উদাহরণ
csvdata =["মাস", "1958", "1959", "1960"]x =[["JAN", 340, 360, 417],["FEB", 318, 342, 391], ["MAR", 362, 406, 419], ["এপিআর", 348, 396, 461], ["মে", 363, 420, 472], ["জুন", 435, 472, 535],[" JUL", 491, 548, 622], ["AUG", 505, 559, 606], ["SEP", 404, 463, 508], ["OCT", 359, 407, 461], ["নভে" , 310, 362, 390],["DEC", 337, 405, 432],]y ="C:\\years.csv" কাজ হিসাবে open(y, 'w') সহ:z =csv.writer( কাজ) z.writerow(ডেটা) z.writerows(x)আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
মাস, 1958,1959,1960JAN, 340,360,417FEB, 318,342,391MAR, 362,406,419APR, 348,396,461MAY, 363,420,472JUN, 435,472,535JUL, 491,548,622AUG, 505,559,606SEP, 404,463,508OCT, 359,407,461NOV, 310,362,390DEC, 337.405.432পান্ডা ব্যবহার করে CSV ফাইল লেখা
পান্ডা ব্যবহার করে আমরা একটি ডেটা ফ্রেম তৈরি করি কোন দেশটি সারি এবং সারির শিরোনাম। তারপরে আমরা to_csv পদ্ধতি ব্যবহার করি যা ফাইলের নাম এবং পাথকে প্যারামিটার হিসেবে টেক্সট করে এবং ডেটাকে csv ফাইলে চালায়।
উদাহরণ
পান্ডা থেকে আমদানি DataFrameC ={'মাস':['JAN', 'FEB', 'MAR'], '1958':['345', '435', '545'], '1959':[ '377', '135', '985'], '1960':['498', '354', '765'],}df =DataFrame(C, columns=["মাস", "1958", " 1959", "1960"])export_csv =df.to_csv (r'C:\\years_p.csv', index =None, header=True) # এখানে আপনাকে পাথ লিখতে হবে, যেখানে ফলাফল ফাইল সংরক্ষণ করা হবে প্রিন্ট (df)আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
মাস 1958 1959 19600 জানুয়ারী 345 377 4981 ফেব্রুয়ারী 435 135 3542 MAR 545 985 765