রেজেক্স দ্বারা পান্ডাসে সারিগুলি কীভাবে ফিল্টার করবেন?

একটি নিয়মিত অভিব্যক্তি (regex) অক্ষরের একটি ক্রম যা একটি অনুসন্ধান প্যাটার্ন সংজ্ঞায়িত করে। রেজেক্স দ্বারা পান্ডাসে সারি ফিল্টার করতে, আমরা str.match() ব্যবহার করতে পারি পদ্ধতি।

পদক্ষেপ

একটি দ্বি-মাত্রিক, আকার-পরিবর্তনযোগ্য, সম্ভাব্য ভিন্ন ভিন্ন ট্যাবুলার ডেটা তৈরি করুন, df .
ইনপুট ডেটাফ্রেম প্রিন্ট করুন, df .
একটি পরিবর্তনশীল শুরু করুন regex অভিব্যক্তির জন্য। রেজেক্স হিসাবে একটি স্ট্রিং মান সরবরাহ করুন, উদাহরণস্বরূপ, স্ট্রিং 'J.*' 'J' অক্ষর দিয়ে শুরু হওয়া সমস্ত এন্ট্রি ফিল্টার করবে।
df.column_name.str.match(regex) ব্যবহার করুন সরবরাহকৃত রেজেক্স দ্বারা প্রদত্ত কলাম নামের সমস্ত এন্ট্রি ফিল্টার করতে৷

উদাহরণ

import pandas as pd

df = pd.DataFrame(
   dict(
      name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'],
      marks=[89, 23, 100, 56, 90],
      subjects=["Math", "Physics", "Chemistry", "Biology", "English"]
   )
)

print "Input DataFrame is:\n", df

regex = 'J.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

regex = 'A.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

আউটপুট

Input DataFrame is:

     name    marks   subjects
0    John     89        Math
1   Jacob     23     Physics
2     Tom    100   Chemistry
3     Tim     56     Biology
4    Ally     90     English

After applying J.* DataFrame is:

    name   marks   subjects
0   John     89        Math
1  Jacob     23     Physics

After applying A.* DataFrame is:

    name   marks   subjects
4   Ally     90     English