কম্পিউটার টিউটোরিয়াল

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

 

এক্সেলের মধ্যে পাইথন একটি শক্তিশালী মাইক্রোসফ্ট 365 বৈশিষ্ট্য যা আপনাকে সরাসরি এক্সেল কোষের মধ্যে পাইথন কোড লিখতে এবং চালাতে দেয়। এটি এক্সেলের মধ্যে পাইথন বিশ্লেষণের শক্তি নিয়ে আসে। আপনি একটি ঘরে সরাসরি পাইথন টাইপ করেন, মাইক্রোসফ্ট ক্লাউডে পাইথন গণনা চালানো হয় এবং আপনার ফলাফলগুলি ওয়ার্কশীটে ফিরে আসে। আপনি স্প্রেডশীট ছেড়ে বা স্থানীয়ভাবে কিছু ইনস্টল না করে ডেটা বিশ্লেষণ, পরিচ্ছন্নতা, পরিসংখ্যান এবং ভিজ্যুয়ালাইজেশনের জন্য পাইথনের সমৃদ্ধ ইকোসিস্টেমের সাথে এক্সেলের পরিচিত ইন্টারফেস এবং পুনঃগণনাকে একত্রিত করতে পারেন।

এই টিউটোরিয়ালে, আমরা দেখাব কিভাবে এক্সেলে পাইথন ব্যবহার করতে হয় এবং কখন এবং কিভাবে এটি দরকারী। জুপিটার বা ভিএস কোডের মতো অন্যান্য সরঞ্জামগুলিতে স্যুইচ করার পরিবর্তে, আপনি সরাসরি এক্সেলে পাইথন ব্যবহার করতে পারেন।

প্রয়োজনীয়তা এবং উপলব্ধতা

  • Microsoft 365 সদস্যতা: অনেক পেইড প্ল্যানে পাওয়া যায় (ভোক্তা পরিবার/ব্যক্তিগত, বাণিজ্যিক, শিক্ষা, এন্টারপ্রাইজ)। কিছু বৈশিষ্ট্য বা উচ্চতর গণনার একটি অ্যাড-অনের প্রয়োজন হতে পারে।
  • প্ল্যাটফর্ম: প্রাথমিকভাবে উইন্ডোজ ডেস্কটপ এক্সেলে উপলব্ধ; ওয়েব, ম্যাক এবং মোবাইলের জন্য সমর্থন পরিবর্তিত হয়। iPad-এর জন্য Excel, iPhone-এর জন্য Excel, বা Android-এর জন্য Excel-এ উপলভ্য নয়৷
  • কোন স্থানীয় পাইথনের প্রয়োজন নেই: প্রাক-ইনস্টল করা লাইব্রেরি সহ সবকিছুই ক্লাউডে চলে। এক্সেলে পাইথন ব্যবহার করার জন্য আপনার পাইথনের স্থানীয় সংস্করণের প্রয়োজন নেই। আপনার কম্পিউটারে পাইথনের স্থানীয় সংস্করণ ইনস্টল করা থাকলে, সেই ইনস্টলেশনে আপনার করা যেকোনো কাস্টমাইজেশন এক্সেল গণনায় পাইথনে প্রতিফলিত হবে না।

গুরুত্বপূর্ণ: এক্সেলে পাইথন ব্যবহার করতে আপনার ইন্টারনেট অ্যাক্সেস প্রয়োজন। এর কারণ হল পাইথন ইন এক্সেল গণনাগুলি মাইক্রোসফ্ট ক্লাউডে পাইথন ভাষার একটি আদর্শ সংস্করণ ব্যবহার করে চলে৷

Excel এ Python ব্যবহার করা শুরু করা

একটি কক্ষে পাইথন সক্ষম করুন:

  • একটি ঘর নির্বাচন করুন
  • সূত্র-এ যান ট্যাব>> পাইথন সন্নিবেশ করুন নির্বাচন করুন
  • অথবা =PY টাইপ করুন একটি কক্ষে এবং ট্যাব টিপুন
  • সূত্র বার সবুজ হয়ে যায়, পাইথন মোড নির্দেশ করে

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

xl() ফাংশন:ব্রিজিং এক্সেল এবং পাইথন

এক্সেলে পাইথন ব্যবহার করার চাবিকাঠি হল xl() ফাংশন, যা আপনার পাইথন কোডকে সরাসরি আপনার স্প্রেডশীট থেকে ডেটা পড়তে দেয়:

  • সম্পাদনা মোডে থাকাকালীন, একটি ঘর বা পরিসর নির্বাচন করতে ক্লিক করুন এবং টেনে আনুন (যেমন, A1:D100)
  • এক্সেল xl("A1:D100") বা অনুরূপ একটি রেফারেন্স সন্নিবেশ করায়

# একটি পান্ডা ডেটাফ্রেম হিসাবে একটি পরিসর উল্লেখ করুন
df =xl(“A1:D100”, হেডার=True)

# একটি একক ঘরের মান উল্লেখ করুন
লক্ষ্য =xl("F1")

এইভাবে পাইথন আপনার স্প্রেডশীট ডেটা "দেখে"। আপনি এটি একটি =PY() সেলের ভিতরে লিখুন এবং একটি সাধারণ পাইথন অবজেক্ট হিসাবে ফলাফলের সাথে কাজ করুন৷

আউটপুট বিকল্প:

  • এক্সেল মান হিসাবে ফিরে আসতে সূত্র বারে ড্রপডাউন ব্যবহার করুন (নেটিভ এক্সেল সেল/টেবিলে রূপান্তরিত করে) অথবা পাইথন অবজেক্ট হিসেবে রাখুন (অন্যান্য পাইথন কোষে চেইন করার জন্য)
  • Ctrl + Alt + Shift + M টিপুন আউটপুট টাইপ টগল করতে
  • কিছু ক্ষেত্রে ডিবাগিং বা আউটপুটের জন্য print() ব্যবহার করুন

পুনঃগণনা: পাইথন কোষগুলি স্বয়ংক্রিয়ভাবে পুনরায় গণনা করে, অন্যান্য সূত্রের মতো, যখন ইনপুটগুলি পরিবর্তন হয় (স্বয়ংক্রিয় মোডে)।

টিপ: ছোট শুরু করুন। আপনার ডেটা নির্বাচন করুন, পাইথন সন্নিবেশ করুন, এটিকে একটি ডেটাফ্রেমে রূপান্তর করুন, তারপর .head(), .describe(), বা সাধারণ ক্রিয়াকলাপগুলির সাথে অন্বেষণ করুন৷

যখন এক্সেলের পাইথন কাজে লাগে

1. অ্যাডভান্সড ডেটা ক্লিনিং এবং ট্রান্সফরমেশন

পাইথন সহজেই অগোছালো তারিখগুলি ঠিক করতে পারে, টেক্সটকে মানসম্মত করতে পারে (ক্যাপিটালাইজেশন, স্পেসিং), নাল এবং ডুপ্লিকেটগুলি পরিচালনা করতে পারে, প্রশস্ত ডেটাকে দীর্ঘ ফর্ম্যাটে আনপিভট করতে পারে এবং অসঙ্গত ফর্ম্যাট বা অনুপস্থিত মানগুলি পরিচালনা করতে পারে। পান্ডা এই কাজগুলিকে সংক্ষিপ্ত এবং পুনরুত্পাদনযোগ্য করে তোলে৷

পাইথন:

import pandas as pd
df = xl("A1:I56", headers=True)
df.columns = df.columns.str.strip().str.title()
# Fix names: Title Case
df["Customer_Name"] = df["Customer_Name"].str.strip().str.title()
# Fix region: Title Case
df["Region"] = df["Region"].str.strip().str.title()
# Standardize product: Title Case
df["Product"] = df["Product"].str.strip().str.title()
# Standardize status and feedback
df["Status"] = df["Status"].str.strip().str.capitalize()
df["Feedback"] = df["Feedback"].str.strip().str.capitalize()
# Parse all messy date formats into one
df["Order_Date"] = pd.to_datetime(df["Order_Date"], dayfirst=True, errors="coerce")
# Fill missing quantity with median
df["Quantity"] = pd.to_numeric(df["Quantity"], errors="coerce")
df["Quantity"] = df["Quantity"].fillna(df["Quantity"].median())
df
  • টিক চিহ্ন-এ ক্লিক করুন অথবা Ctrl+Enter টিপুন কোড চালাতে
  • আউটপুট ঘরে কার্ড আইকনে ক্লিক করুন>> অ্যারেপ্রিভিউ নির্বাচন করুন

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

পরিষ্কার করা ডেটাফ্রেম স্বয়ংক্রিয়ভাবে শীটে ফিরে আসে। আরও বিশ্লেষণ এবং গণনার জন্য পরিষ্কার ডেটা ব্যবহার করতে এক্সেল মান হিসাবে ফলাফলটি ফেরত দিন।

  • সূত্র বার থেকে ড্রপডাউনটি প্রসারিত করুন>> এক্সেল মান নির্বাচন করুন

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

  • এখন অন্যান্য উদাহরণে নতুন, পরিষ্কার করা ডেটা ব্যবহার করুন

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

2. জটিল ডেটা বিশ্লেষণ এবং পরিসংখ্যান

পাইথন এক্সেলের অন্তর্নির্মিত ফাংশনগুলির বাইরে ক্রিয়াকলাপগুলিকে সক্ষম করে, যার মধ্যে রয়েছে জটিল গ্রুপিং, বহু-পদক্ষেপ রূপান্তর এবং পরিসংখ্যানগত সারাংশ। এটি টাইম-সিরিজ অ্যানালাইসিস, রিগ্রেশন, ক্লাস্টারিং, আউটলিয়ার ডিটেকশন, টেক্সটের সেন্টিমেন্ট অ্যানালাইসিস এবং মন্টে কার্লো সিমুলেশনকেও সমর্থন করে।

পাইথন:

import pandas as pd
# Load data from the SalesData sheet
df = xl("SalesData!K1:S156", headers=True)
df["Revenue"] = df["Quantity"] * df["Unit_Price"]
# Revenue summary + outlier flag (> 2 std devs)
summary = df.groupby("Region")["Revenue"].agg(["sum", "mean", "std"])
summary["outlier_threshold"] = summary["mean"] + 2 * summary["std"]
summary.round(2)

ফলাফল একটি টেবিল হিসাবে সরাসরি আপনার শীট ফিরে spills. এছাড়াও আপনি df.describe() ব্যবহার করতে পারেন সমগ্র ডেটাফ্রেমের সারাংশ পরিসংখ্যান দেখাতে।

পাইথন:

import pandas as pd
# Load data from the SalesData sheet
df = xl("SalesData!K1:S156", headers=True)
df["Revenue"] = df["Quantity"] * df["Unit_Price"]
df.describe()

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

3. আরও ভাল চার্ট এবং ভিজ্যুয়ালাইজেশন

ঘনত্বের প্লট, সোয়ার্ম প্লট, ওয়ার্ড ক্লাউড বা ম্যাটপ্লটলিব, সিবোর্ন বা প্লটনাইন দিয়ে ছোট মাল্টিপলের মতো পেশাদার প্লট তৈরি করা সহজ। এগুলো এক্সেল চার্টের চেয়ে অনেক বেশি নমনীয়। matplotlib এবং seaborn সহ Excel এর নেটিভ চার্টের বাইরে যান:

পাইথন:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Load data from the SalesData sheet
df = xl("SalesData!K1:S156", headers=True)
df["Revenue"] = df["Quantity"] * df["Unit_Price"]
fig, ax = plt.subplots(figsize=(8, 4))
sns.boxplot(data=df, x="Region", y="Revenue", palette="Set2", ax=ax)
ax.set_title("Revenue Distribution by Region")
ax.set_xlabel("Region")
ax.set_ylabel("Revenue ($)")
fig

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

চার্টটি সরাসরি ওয়ার্কশীটে একটি ইমেজ অবজেক্ট হিসাবে রেন্ডার করে, যেকোন এক্সেল চার্টের মত আকার পরিবর্তনযোগ্য এবং পুনরায় স্থাপনযোগ্য।

4. আপনার স্প্রেডশীট ডেটাতে মেশিন লার্নিং

পাইথন ভবিষ্যদ্বাণীমূলক মডেলিং এবং পূর্বাভাস সক্ষম করে। আপনি স্ট্যাটমডেল ব্যবহার করে আরও নির্ভুল পূর্বাভাস বা সাধারণ মেশিন লার্নিং মডেল তৈরি করতে পারেন বা আপনার এক্সেল ডেটাতে সরাসরি স্কিট-লার্ন করতে পারেন।

এক্সেল ছাড়াই ভবিষ্যদ্বাণীমূলক মডেল চালান:

পাইথন:

import pandas as pd
from sklearn.linear_model import LinearRegression
# Load data from the SalesData sheet
df = xl("SalesData!K1:S156", headers=True)
# Convert to numeric and fill missing values with median
df["Quantity"] = pd.to_numeric(df["Quantity"], errors="coerce")
df["Unit_Price"] = pd.to_numeric(df["Unit_Price"], errors="coerce")
df["Quantity"] = df["Quantity"].fillna(df["Quantity"].median())
df["Unit_Price"] = df["Unit_Price"].fillna(df["Unit_Price"].median())
# Calculate Revenue
df["Revenue"] = df["Quantity"] * df["Unit_Price"]
# One-hot encode Product
X = pd.get_dummies(df[["Product", "Unit_Price"]], drop_first=True)
y = df["Revenue"]
# Fit the Linear Regression model
model = LinearRegression().fit(X, y)
# Add predictions
df["Predicted_Revenue"] = model.predict(X).round(2)
# Create final result with useful columns
result = df[["Order_Id", "Product", "Revenue", "Predicted_Revenue"]].copy()
result["Difference"] = (result["Revenue"] - result["Predicted_Revenue"]).round(2)
# Optional: Show model performance
print("Model R² Score:", round(model.score(X, y), 4))
result

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

ব্যবসায়িক বিশ্লেষকরা আলাদা পরিবেশে স্যুইচ না করে তাদের বিদ্যমান ডেটাতে মেশিন লার্নিং মডেল প্রয়োগ করতে পারেন।

5. রোলিং গণনা এবং সময় সিরিজ

শুধুমাত্র এক্সেল সূত্র ব্যবহার করে চলমান গড়, ক্রমবর্ধমান সমষ্টি বা ল্যাগ বৈশিষ্ট্যগুলি গণনা করা কঠিন। পাইথন এই কাজগুলোকে সহজ করে।

পাইথন:

import pandas as pd
# Load your full sales data
df = xl("SalesData!K1:S156", headers=True)
# Calculate Daily Revenue
df["Revenue"] = df["Quantity"] * df["Unit_Price"]
# Rolling Calculations (Time Series)
# Sort by date first (important for time series)
df = df.sort_values("Order_Date").reset_index(drop=True)
# 7-day Rolling Metrics on Revenue (weekly trend)
df["Revenue_7d_Mean"] = df["Revenue"].rolling(window=7, min_periods=1).mean().round(2)
df["Revenue_7d_Sum"] = df["Revenue"].rolling(window=7, min_periods=1).sum().round(2)
df["Revenue_7d_Max"] = df["Revenue"].rolling(window=7, min_periods=1).max().round(2)
df["Revenue_7d_Std"] = df["Revenue"].rolling(window=7, min_periods=1).std().round(2)
# 30-day Rolling Mean (monthly trend)
df["Revenue_30d_Mean"] = df["Revenue"].rolling(window=30, min_periods=1).mean().round(2)
# Cumulative Revenue (running total)
df["Cumulative_Revenue"] = df["Revenue"].cumsum().round(2)
# Select columns to display
result = df[["Order_Id", "Order_Date", "Product", "Revenue", 
 "Revenue_7d_Mean", "Revenue_7d_Sum", "Revenue_30d_Mean", 
 "Cumulative_Revenue"]]
result

এই পদ্ধতিটি বিক্রয় প্রবণতা বিশ্লেষণ, দৈনিক বা সাপ্তাহিক ওঠানামা মসৃণ করতে, অসঙ্গতি সনাক্তকরণ এবং গতির পূর্বাভাস দেওয়ার জন্য দরকারী৷

আনলক অ্যাডভান্সড অ্যানালাইসিস:এক্সেলের পাইথন ডেটা বিশ্লেষণ উন্নত করে

  • উপার্জন_7d_Mean: 7-দিনের চলমান গড় (সাপ্তাহিক বিক্রয় প্রবণতা মসৃণ করে)
  • রেভিনিউ_7d_Sum: গত 7 দিনে মোট রাজস্ব
  • Rvenue_30d_Mean: 30-দিনের চলমান গড় (দীর্ঘমেয়াদী প্রবণতা)
  • ক্রমিক_রাজস্ব: সেই তারিখ পর্যন্ত সমস্ত রাজস্বের মোট চলমান

টিপস এবং সর্বোত্তম অভ্যাস

  • চেইন কোষ: একটি একক কক্ষ বিশৃঙ্খল না করে বহু-পদক্ষেপের ওয়ার্কফ্লো তৈরি করতে পূর্ববর্তী পাইথন অবজেক্টগুলিকে উল্লেখ করুন (এগুলি ভেরিয়েবল হিসাবে উপস্থিত হয়)
  • পারফরম্যান্স: ভারী গণনার জন্য, ক্লাউড কোটা মনে রাখবেন। বড় কাজগুলিকে ধাপে ভাগ করুন বা প্রয়োজনে প্রিমিয়াম কম্পিউট ব্যবহার করুন
  • নিরাপত্তা: কোড বিচ্ছিন্ন ক্লাউড পাত্রে চলে। সংবেদনশীল অপারেশন এড়িয়ে চলুন; Microsoft গোপনীয়তা পরিচালনা করে
  • ডিবাগিং: ধাপে ধাপে print() বা আউটপুট DataFrames ব্যবহার করুন। কক্ষে ত্রুটি দেখা দেয়
  • Excel এর সাথে একত্রিত করুন: ভারী উত্তোলনের জন্য পাইথন এবং ফর্ম্যাটিং, পিভট বা ড্যাশবোর্ডের জন্য এক্সেল ব্যবহার করুন
  • লার্নিং কার্ভ: আপনি যদি পাইথনে নতুন হন তবে প্রথমে পান্ডাগুলিতে ফোকাস করুন। অনেক বিনামূল্যের টিউটোরিয়াল এবং নমুনা ফাইল পাওয়া যায়
  • শেয়ারিং:৷ সামঞ্জস্যপূর্ণ Microsoft 365 সহ প্রাপকরা ফলাফল দেখতে বা রিফ্রেশ করতে পারেন; অন্যথায়, ফলাফলগুলি স্ট্যাটিক মানগুলিতে রূপান্তরিত হয়

জানার সীমাবদ্ধতা

  • কেবল-ক্লাউড এক্সিকিউশন; একটি ইন্টারনেট সংযোগ প্রয়োজন
  • স্ট্যান্ডার্ড প্ল্যানগুলিতে কোটা গণনা করুন
  • পাইথন পরিবেশ অ্যানাকোন্ডা-পরিচালিত; আপনি আপনার নিজস্ব প্যাকেজ ইনস্টল করতে বা স্থানীয় কাস্টমাইজেশন ব্যবহার করতে পারবেন না
  • ডেস্কটপের তুলনায় মোবাইল এবং ওয়েব সমর্থন সীমিত
  • খুব বড় ডেটাসেট বা দীর্ঘ-চলমান কোড টাইমআউট আঘাত করতে পারে

উপসংহার

আপনার কাজ যখন মৌলিকভাবে স্প্রেডশীট-ভিত্তিক, তবে বিশ্লেষণ নিজেই আরও উন্নত হয়ে উঠলে এক্সেলে পাইথন সবচেয়ে কার্যকর। এটি ডেটা ক্লিনিং, ডেটাফ্রেম-শৈলী বিশ্লেষণ, উন্নত পরিসংখ্যান এবং ভিজ্যুয়ালাইজেশনে পারদর্শী। এটি দৈনন্দিন স্প্রেডশীট কাজের জন্য কম উপযোগী, যা এক্সেল ইতিমধ্যেই ভালভাবে পরিচালনা করে। এক্সেলের পাইথন স্প্রেডশীট ব্যবহারকারী এবং ডেটা বিজ্ঞানীদের মধ্যে ব্যবধান পূরণ করে, পরিচিত কর্মপ্রবাহকে ব্যাহত না করেই উন্নত বিশ্লেষণকে অ্যাক্সেসযোগ্য করে তোলে। এক্সেলকে পাইথন দিয়ে প্রতিস্থাপন করার পরিবর্তে, বিশ্লেষণগুলি একা সূত্রের জন্য খুব জটিল হয়ে গেলে বেছে বেছে পাইথন ব্যবহার করুন।

সমাধান সহ বিনামূল্যে উন্নত এক্সেল ব্যায়াম পান!
  1. এক্সেলে সম্পর্কগুলি কীভাবে পরিচালনা করবেন (বিস্তারিত পদক্ষেপ সহ)

  2. Windows 10 এ কর্মক্ষমতা মসৃণ করতে গেম মোড সক্ষম করুন

  3. উজ্জ্বল ভবিষ্যতের জন্য দুর্দান্ত ধারণা গ্যাজেট- পর্ব 4

  4. WordPad-এ ওয়ার্ড ডক্স সংরক্ষণ করা হচ্ছে; ওয়ার্ডের পরিবর্তে ওয়ার্ডপ্যাডে ডকুমেন্ট খোলা