কম্পিউটার

urllib.parse — পাইথনের উপাদানগুলিতে URL গুলিকে পার্স করুন


এই মডিউলটি উপাদানগুলির মধ্যে ইউনিফর্ম রিসোর্স লোকেটার (URL) স্ট্রিং ভাঙতে বা উপাদানগুলিকে একটি URL স্ট্রিংয়ে আবার একত্রিত করতে একটি আদর্শ ইন্টারফেস প্রদান করে। এটি একটি "বেস ইউআরএল" দেওয়া একটি "আপেক্ষিক URL" কে একটি পরম URL তে রূপান্তর করার ফাংশনও রয়েছে৷

এই মডিউল নিম্নলিখিত URL স্কিম সমর্থন করে -

  • ফাইল
  • ftp
  • গোফার
  • hdl
  • http
  • https
  • imap
  • mailto
  • mms
  • সংবাদ
  • এনএনটিপি
  • prospero
  • rsync
  • rtsp
  • rtspu
  • sftp
  • shttp
  • চুমুক
  • চুমুক
  • snews
  • svn
  • svn+ssh
  • টেলনেট
  • ওয়াইস
  • ws
  • wss

urlparse()

এই ফাংশনটি একটি ইউআরএলকে ছয়টি উপাদানে পার্স করে, একটি 6-টুপল প্রদান করে। এটি একটি URL এর সাধারণ কাঠামোর সাথে মিলে যায়। প্রতিটি tuple আইটেম একটি স্ট্রিং. উপাদানগুলি ছোট অংশে বিভক্ত করা হয় না (উদাহরণস্বরূপ, নেটওয়ার্ক অবস্থান একটি একক স্ট্রিং), এবং % এস্কেপগুলি প্রসারিত হয় না। রিটার্ন মান হল নিম্নোক্ত গুণাবলী দ্বারা গঠিত টিপলের একটি সাবক্লাসের একটি উদাহরণ:

অ্যাট্রিবিউট সূচক মান উপস্থিত না থাকলে মান
স্কিম 0 URL স্কিম স্পেসিফায়ার স্কিম প্যারামিটার
netloc 1 নেটওয়ার্ক অবস্থান অংশ স্কিম প্যারামিটার
পথ 2 অনুক্রমিক পথ খালি স্ট্রিং
পরামর্শ 3 শেষ পাথ উপাদানের জন্য পরামিতি খালি স্ট্রিং
কোয়েরি 4 কোয়েরি উপাদান খালি স্ট্রিং
খণ্ড 5 খণ্ড শনাক্তকারী খালি স্ট্রিং
ব্যবহারকারীর নাম
ব্যবহারকারীর নাম কিছুই নয়
পাসওয়ার্ড
পাসওয়ার্ড কিছুই নয়
হোস্টনাম
হোস্টের নাম (লোয়ার কেস) কিছুই নয়
পোর্ট
পূর্ণসংখ্যা হিসাবে পোর্ট নম্বর, যদি উপস্থিত থাকে কিছুই নয়

উদাহরণ

>>> urllib.parse থেকে urlparse আমদানি করুন>>> url ='https://mail.google.com/mail/u/0/?tab=rm#inbox'>>> t =urlparse(url) পার্স রেজাল্ট(স্কিম ='https', netloc ='mail.google.com', path ='/mail/u/0/', params ='', query ='tab =rm', fragment ='inbox') 

urlunparse(parts)

এই ফাংশনটি urlparse() দ্বারা প্রত্যাবর্তিত একটি tuple থেকে একটি URL তৈরি করে। পার্টস আর্গুমেন্ট যেকোন ছয়-আইটেম পুনরাবৃত্তিযোগ্য হতে পারে।

>>> urllib.parse থেকে urlunparse আমদানি করুন>>> urlunparse(t)'https://mail.google.com/mail/u/0/?tab =rm#inbox'urlsplit(urlstring, স্কিম =' ', allow_fragments =সত্য):

এটি urlparse() এর অনুরূপ, কিন্তু URL থেকে প্যারামগুলিকে বিভক্ত করে না। এই ফাংশনটি একটি 5-টুপল প্রদান করে:(অ্যাড্রেসিং স্কিম, নেটওয়ার্ক অবস্থান, পথ, ক্যোয়ারী, ফ্র্যাগমেন্ট শনাক্তকারী)।

>>> urllib.parse থেকে urlsplit আমদানি করুন>>> urlsplit(url)SplitResult(scheme ='https', netloc ='mail.google.com', path ='/mail/u/0/', প্রশ্ন ='tab =rm', fragment ='inbox')

urlunsplit(অংশ)

এই ফাংশনটি urlsplit() দ্বারা প্রত্যাবর্তিত একটি টিপলের উপাদানগুলিকে একটি স্ট্রিং হিসাবে একটি সম্পূর্ণ URL-এ একত্রিত করে৷

URL উদ্ধৃতি ফাংশনগুলি বিশেষ অক্ষর উদ্ধৃত করে এবং নন-ASCII পাঠ্যকে যথাযথভাবে এনকোড করার মাধ্যমে প্রোগ্রাম ডেটা গ্রহণ এবং এটিকে URL উপাদান হিসাবে ব্যবহারের জন্য নিরাপদ করার উপর ফোকাস করে৷

উদ্ধৃতি()

এই ফাংশনটি %xx এস্কেপ ব্যবহার করে স্ট্রিং-এ বিশেষ অক্ষর প্রতিস্থাপন করে। অক্ষর, অঙ্ক এবং অক্ষর '_.-~' কখনই উদ্ধৃত হয় না।

>>> urllib.parse ইম্পোর্ট কোট থেকে>>> q =quote(url)'https%3A//mail.google.com/mail/u/0/%3Ftab%3Drm%23inbox'quote_plus():

উদ্ধৃতি() এর মতো, কিন্তু ইউআরএল-এ যাওয়ার জন্য একটি ক্যোয়ারী স্ট্রিং তৈরি করার সময় HTML ফর্ম মান উদ্ধৃত করার জন্য প্রয়োজন অনুসারে প্লাস চিহ্ন দ্বারা স্পেসগুলি প্রতিস্থাপন করুন৷

আনকোট()

এই ফাংশনটি %xx এস্কেপকে তাদের একক-অক্ষরের সমতুল্য দ্বারা প্রতিস্থাপন করে।

>>> urllib.parse থেকে আনকোট আমদানি করুন>>> unquote(q)'https://mail.google.com/mail/u/0/?tab =rm#inbox'

urlencode()

এই ফাংশনটি একটি ম্যাপিং অবজেক্ট বা দুই-উপাদান টিপলের একটি ক্রমকে শতাংশ-এনকোডেড ASCII পাঠ্য স্ট্রিং-এ রূপান্তরিত করে। ফলস্বরূপ স্ট্রিং হল কী =মান জোড়া '&' অক্ষর দ্বারা পৃথক করা একটি সিরিজ।

>>> urllib.parse থেকে urlencode আমদানি করুন>>> qry ={"name":"রাজীব", "বেতন":20000}>>> urlencode(qry)'name =রাজীব ও বেতন =20000'

  1. একটি পান্ডাস টাইমডেল্টা অবজেক্টকে পাইথন টাইমডেল্টা অবজেক্টে রূপান্তর করুন

  2. Python Pandas - tuple-এর মতো নামক একটি উপাদান ফেরত দিন

  3. Python - সেটে পান্ডা টাইপকাস্ট করা হচ্ছে

  4. পাইথনে (tkinter) একটি ওয়েব ব্রাউজারে প্রোগ্রাম্যাটিকভাবে ইউআরএল খোলা হচ্ছে