পাইথন প্রোগ্রাম চালানোর সময়, আমাদের ডেটা বিশ্লেষণের জন্য ডেটাসেট ব্যবহার করতে হবে। পাইথনের বিভিন্ন মডিউল রয়েছে যা আমাদেরকে পাইথন প্রোগ্রামে বিভিন্ন ফাইল ফরম্যাটে বাহ্যিক ডেটা আমদানি করতে সহায়তা করে। এই উদাহরণে আমরা দেখতে পাব কিভাবে একটি পাইথন প্রোগ্রামে বিভিন্ন ফরম্যাটের ডেটা আমদানি করা যায়।
csv ফাইল আমদানি করুন
csv মডিউল আমাদেরকে ফাইলের প্রতিটি সারিতে একটি বিভাজক হিসাবে কমা ব্যবহার করে পড়তে সক্ষম করে। আমরা প্রথমে শুধুমাত্র রিড মোডে ফাইল খুলি এবং তারপর ডিলিমিটার বরাদ্দ করি। অবশেষে csv ফাইল থেকে প্রতিটি সারি পড়ার জন্য একটি লুপ ব্যবহার করুন।
উদাহরণ
সারিগুলিতে r এর জন্য custfile:rows=csv.reader(custfile,delimiter=',') হিসেবেimport csv with open("E:\\customers.csv",'r') as custfile: rows=csv.reader(custfile,delimiter=',') for r in rows: print(r)
আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn'] ['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No'] ['5575-GNVDE', 'Male', 'One year', 'No', 'No'] ['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes'] ['7795-CFOCW', 'Male', 'One year', 'No', 'No'] …… …….
পান্ডাদের সাথে
পান্ডাস লাইব্রেরি আসলে csv ফাইল সহ বেশিরভাগ ফাইল প্রকার পরিচালনা করতে পারে। এই প্রোগ্রামে দেখা যাক কিভাবে পান্ডাস লাইব্রেরি read_excel মডিউল ব্যবহার করে এক্সেল ফাইল পরিচালনা করে। নীচের উদাহরণে আমরা উপরের ফাইলটির এক্সেল সংস্করণটি পড়ি এবং যখন আমরা ফাইলটি পড়ি তখন একই ফলাফল পাই৷
উদাহরণ
import pandas as pd df = pd.ExcelFile("E:\\customers.xlsx") data=df.parse("customers") print(data.head(10))
আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
customerID gender Contract PaperlessBilling Churn 0 7590-VHVEG Female Month-to-month Yes No 1 5575-GNVDE Male One year No No 2 3668-QPYBK Male Month-to-month Yes Yes 3 7795-CFOCW Male One year No No 4 9237-HQITU Female Month-to-month Yes Yes 5 9305-CDSKC Female Month-to-month Yes Yes 6 1452-KIOVK Male Month-to-month Yes No 7 6713-OKOMC Female Month-to-month No No 8 7892-POOKP Female Month-to-month Yes Yes 9 6388-TABGU Male One year No No
pyodbc সহ
আমরা pyodbc নামক একটি মডিউল ব্যবহার করে ডাটাবেস সার্ভারের সাথে সংযোগ করতে পারি। এটি আমাদের একটি sql ক্যোয়ারী ব্যবহার করে রিলেশনাল সোর্স থেকে ডেটা আমদানি করতে সাহায্য করবে। অবশ্যই আমাদের ক্যোয়ারী পাস করার আগে db-এর সাথে সংযোগের বিশদ সংজ্ঞায়িত করতে হবে।
উদাহরণ
import pyodbc sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;") data_sql = pd.read_sql_query(SQL QUERY’, sql_conn) data_sql.head()
আউটপুট
SQL কোয়েরির উপর নির্ভর করে ফলাফল প্রদর্শিত হবে।