ইমেল ঠিকানাগুলি বেশ জটিল এবং সারা বিশ্বে অনুসরণ করা একটি মান নেই যা একটি রেজেক্সে একটি ইমেল সনাক্ত করা কঠিন করে তোলে৷ RFC 5322 একটি ইমেল ঠিকানার বিন্যাস নির্দিষ্ট করে। আমরা পাঠ্য থেকে ইমেল ঠিকানাগুলি বের করতে এই বিন্যাসটি ব্যবহার করব।
উদাহরণস্বরূপ, একটি প্রদত্ত ইনপুট স্ট্রিং -
এর জন্যHi my name is John and email address is john.doe@somecompany.co.uk and my friend's email is jane_doe124@gmail.com
আমাদের আউটপুট পাওয়া উচিত -
john.doe@somecompany.co.uk jane_doe124@gmail.com
আমরা −
নিষ্কাশনের জন্য নিম্নলিখিত রেজেক্স ব্যবহার করতে পারি[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+
আমরা re মডিউল থেকে find all পদ্ধতি ব্যবহার করে ইমেল ঠিকানাগুলি বের করতে পারি। উদাহরণস্বরূপ,
উদাহরণ
import re my_str = "Hi my name is John and email address is john.doe@somecompany.co.uk and my friend's email is jane_doe124@gmail.com" emails = re.findall("([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)", my_str) for mail in an email: print(mail)
আউটপুট
এটি −
আউটপুট দেবেjohn.doe@somecompany.co.uk jane_doe124@gmail.com