একটি পাঠ্য থেকে শুধুমাত্র সংখ্যা নিষ্কাশন পাইথন ডেটা বিশ্লেষণে একটি খুব সাধারণ প্রয়োজন। এটি পাইথন রেগুলার এক্সপ্রেশন লাইব্রেরি ব্যবহার করে সহজেই করা হয়। এই লাইব্রেরিটি আমাদেরকে অঙ্কের প্যাটার্নগুলিকে সংজ্ঞায়িত করতে সাহায্য করে যা সাবস্ট্রিং হিসাবে বের করা যেতে পারে৷
উদাহরণ
নিচের উদাহরণে আমরা re মডিউল থেকে findall() ফাংশন ব্যবহার করি। এই ফাংশনের পরামিতি হল প্যাটার্ন যা আমরা বের করতে চাই এবং যে স্ট্রিং থেকে আমরা বের করতে চাই। অনুগ্রহ করে মনে রাখবেন নীচের উদাহরণের সাহায্যে আমরা কেবলমাত্র সংখ্যা পাই এবং দশমিক বিন্দু বা ঋণাত্মক চিহ্ন নয়।
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list = re.findall(r'\d+', str) print(num_list)
আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '8', '4', '112']
দশমিক বিন্দু এবং চিহ্ন ক্যাপচার করা
আমরা সার্চের ফলাফলে দশমিক বিন্দু এবং নেতিবাচক বা ইতিবাচক চিহ্নগুলি অন্তর্ভুক্ত করার জন্য অনুসন্ধান প্যাটার্নটি প্রসারিত করতে পারি।
উদাহরণ
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list=re.findall(r'[-+]?[.]?[\d]+',str) print(num_list)
আউটপুট
উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '.8', '-4', '.112']