ইমেল ঠিকানাগুলি বেশ জটিল এবং সারা বিশ্বে অনুসরণ করা একটি মান নেই যা একটি রেজেক্সে একটি ইমেল সনাক্ত করা কঠিন করে তোলে৷ RFC 5322 একটি ইমেল ঠিকানার বিন্যাস নির্দিষ্ট করে। আমরা পাঠ্য থেকে ইমেল ঠিকানাগুলি বের করতে এই বিন্যাসটি ব্যবহার করব।
উদাহরণস্বরূপ, একটি প্রদত্ত ইনপুট স্ট্রিং -
এর জন্যHi my name is John and email address is [email protected] and my friend's email is [email protected]
আমাদের আউটপুট পাওয়া উচিত -
[email protected] [email protected]
আমরা −
নিষ্কাশনের জন্য নিম্নলিখিত রেজেক্স ব্যবহার করতে পারি[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+
আমরা re মডিউল থেকে find all পদ্ধতি ব্যবহার করে ইমেল ঠিকানাগুলি বের করতে পারি। উদাহরণস্বরূপ,
উদাহরণ
import re my_str = "Hi my name is John and email address is [email protected] and my friend's email is [email protected]" emails = re.findall("([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)", my_str) for mail in an email: print(mail)
আউটপুট
এটি −
আউটপুট দেবে[email protected] [email protected]