একটি নিয়মিত অভিব্যক্তি (regex) অক্ষরের একটি ক্রম যা একটি অনুসন্ধান প্যাটার্ন সংজ্ঞায়িত করে। রেজেক্স দ্বারা পান্ডাসে সারি ফিল্টার করতে, আমরা str.match() ব্যবহার করতে পারি পদ্ধতি।
পদক্ষেপ
- একটি দ্বি-মাত্রিক, আকার-পরিবর্তনযোগ্য, সম্ভাব্য ভিন্ন ভিন্ন ট্যাবুলার ডেটা তৈরি করুন, df .
- ইনপুট ডেটাফ্রেম প্রিন্ট করুন, df .
- একটি পরিবর্তনশীল শুরু করুন regex অভিব্যক্তির জন্য। রেজেক্স হিসাবে একটি স্ট্রিং মান সরবরাহ করুন, উদাহরণস্বরূপ, স্ট্রিং 'J.*' 'J' অক্ষর দিয়ে শুরু হওয়া সমস্ত এন্ট্রি ফিল্টার করবে।
- df.column_name.str.match(regex) ব্যবহার করুন সরবরাহকৃত রেজেক্স দ্বারা প্রদত্ত কলাম নামের সমস্ত এন্ট্রি ফিল্টার করতে৷
উদাহরণ
import pandas as pd df = pd.DataFrame( dict( name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'], marks=[89, 23, 100, 56, 90], subjects=["Math", "Physics", "Chemistry", "Biology", "English"] ) ) print "Input DataFrame is:\n", df regex = 'J.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)] regex = 'A.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]
আউটপুট
Input DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics 2 Tom 100 Chemistry 3 Tim 56 Biology 4 Ally 90 English After applying J.* DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics After applying A.* DataFrame is: name marks subjects 4 Ally 90 English