কম্পিউটার

ইউআরএল হ্যান্ডলিং পাইথন মডিউল (urllib)


পাইথন ভাষা ওয়েব প্রোগ্রামিং এর জন্য ব্যাপকভাবে ব্যবহৃত হয়। যখন আমরা ওয়েবসাইট ব্রাউজার করি তখন আমরা ওয়েব ঠিকানা ব্যবহার করি যা URL বা ইউনিফর্ম রিসোর্স লোকেটার নামেও পরিচিত। পাইথনের অন্তর্নির্মিত উপকরণ রয়েছে যা URL-এ কলগুলি পরিচালনা করতে পারে এবং সেই সাথে URL পরিদর্শন করার ফলে যে ফলাফল আসে তা পাস করতে পারে। এই নিবন্ধে আমরা urllib নামে একটি মডিউল দেখতে পাব . আমরা এই মডিউলে উপস্থিত বিভিন্ন ফাংশনও দেখব যা URL থেকে ফলাফল পেতে সাহায্য করে।

urllib ইনস্টল করা হচ্ছে

পাইথন এনভায়রনমেন্টে urllib ইন্সটল করতে, আমরা পিপ ব্যবহার করে নিচের কমান্ডটি ব্যবহার করি।

pip install urllib

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -

একটি URL খোলা হচ্ছে

request.urlopen পদ্ধতিটি একটি URL পরিদর্শন করতে এবং পাইথন পরিবেশে এর সামগ্রী আনতে ব্যবহৃত হয়৷

উদাহরণ

import urllib.request
address = urllib.request.urlopen('https://www.tutorialspoint.com/')
print(address.read())

আউটপুট

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -

b'<!DOCTYPE html>\r\n<!--[if IE 8]><html class="ie ie8"> <![endif]-->\r\n<!--[if IE 9]><html class……..
……………
……………….
new Date());\r\ngtag(\'config\', \'UA-232293-6\');\r\n</script>\r\n</body>\r\n</html>\r\n' -->

urllib.parse

ইউআরএলটি বৈধ কিনা তা পরীক্ষা করার জন্য আমরা সেটিকে পার্স করতে পারি। আমরা অনুসন্ধান বিকল্পে একটি ক্যোয়ারী স্ট্রিং পাস করতে পারি। প্রতিক্রিয়াটির বৈধতা পরীক্ষা করা যেতে পারে এবং যদি এটি বৈধ হয় তবে আমরা সম্পূর্ণ প্রতিক্রিয়াটি প্রিন্ট করতে পারি।

উদাহরণ

import urllib.request
import urllib.parse
url='https://tutorialspoint.com'
values= {'q':'python'}
data = urllib.parse.urlencode(values)
data = data.encode('utf-8') # data should be bytes
print(data)
req = urllib.request.Request(url, data)
resp = urllib.request.urlopen(req)
print(resp)
respData = resp.read()
print(respData)

আউটপুট

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -

b'q=python'
<http.client.HTTPResponse object at 0x00000195BF706850>
b'<!DOCTYPE html>\r\n<!--[if IE 8]><html class="ie ie8"> <![endif]…………
…………………
\r\n</script>\r\n</body>\r\n</html<\r\n' -->

urllib.parse.urlsplit

urlsplit একটি url নেওয়ার জন্য ব্যবহার করা যেতে পারে, তারপরে এটিকে অংশে বিভক্ত করুন যা আরও ডেটা ম্যানিপুলেশনের জন্য ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, যদি আমরা প্রোগ্রামগতভাবে বিচার করতে চাই যে একটি URL SSL প্রত্যয়িত কিনা তাহলে আমরা urlsplit প্রয়োগ করি এবং সিদ্ধান্ত নেওয়ার জন্য স্কিম মান পাই। নীচের উদাহরণে আমরা সরবরাহ করা URL এর বিভিন্ন অংশ পরীক্ষা করি।X

আউটপুট

import urllib.parse
url='https://tutorialspoint.com/python'
value = urllib.parse.urlsplit(url)
print(value)

উপরের কোডটি চালানো আমাদের নিম্নলিখিত ফলাফল দেয় -

SplitResult(scheme='https', netloc='tutorialspoint.com', path='/python', query='', fragment='')

  1. পাইথন মডিউল:কিভাবে একটি মডিউল তৈরি করবেন

  2. পাইথনে পিডিএফ থেকে হাইপারলিঙ্কগুলি বের করুন

  3. পাইথনে ব্যতিক্রম হ্যান্ডলিং কি?

  4. পাইথন ফাইল হ্যান্ডলিং