কম্পিউটার

AWS গ্লু ডেটা ক্যাটালগে একটি ক্রলার শুরু করতে Boto3 কীভাবে ব্যবহার করবেন


এই নিবন্ধে, আমরা দেখব কিভাবে একজন ব্যবহারকারী AWS Glue Data Catalog-এ একটি ক্রলার শুরু করতে পারে।

উদাহরণ

সমস্যা বিবৃতি: boto3 ব্যবহার করুন একটি ক্রলার শুরু করতে পাইথনে লাইব্রেরি৷

এই সমস্যা সমাধানের জন্য অ্যাপ্রোচ/অ্যালগরিদম

  • ধাপ 1: boto3 আমদানি করুন৷ এবং বোটোকোর ব্যতিক্রমগুলি পরিচালনা করার জন্য ব্যতিক্রমগুলি

  • ধাপ 2: ক্রলার_নাম এই ফাংশনের প্যারামিটার।

  • ধাপ 3: boto3 lib ব্যবহার করে একটি AWS সেশন তৈরি করুন . region_name নিশ্চিত করুন৷ ডিফল্ট প্রোফাইলে উল্লেখ করা আছে। যদি এটি উল্লেখ না থাকে, তাহলে স্পষ্টভাবে অঞ্চল_নাম পাস করুন সেশন তৈরি করার সময়।

  • পদক্ষেপ 4: আঠালো এর জন্য একটি AWS ক্লায়েন্ট তৈরি করুন .

  • ধাপ 5: এখন start_crawler ব্যবহার করুন ফাংশন এবং প্যারামিটার পাস করুন crawler_name নাম হিসাবে।

  • ধাপ 6: এটি প্রতিক্রিয়া মেটাডেটা ফেরত দেয় এবং তার সময়সূচী নির্বিশেষে ক্রলার শুরু করে। যদি ক্রলারের অবস্থা চলমান থাকে, তাহলে এটি CrawlerRunningException নিক্ষেপ করে .

  • পদক্ষেপ 7: একটি ক্রলার শুরু করার সময় কিছু ভুল হলে জেনেরিক ব্যতিক্রম পরিচালনা করুন।

উদাহরণ কোড

নিম্নলিখিত কোডটি AWS Glue Data Catalog −

-এ একটি ক্রলার শুরু করে
import boto3
from botocore.exceptions import ClientError

def start_a_crawler(crawler_name)
   session = boto3.session.Session()
   glue_client = session.client('glue')
   try:
      response = glue_client.start_crawler(Name=crawler_name)
      return response
   except ClientError as e:
      raise Exception("boto3 client error in start_a_crawler: " + e.__str__())
   except Exception as e:
      raise Exception("Unexpected error in start_a_crawler: " + e.__str__())

#1st time start the crawler
print(start_a_crawler("Data Dimension"))
#2nd time run, before crawler completes the operation
print(start_a_crawler("Data Dimension"))

আউটপুট

#1st time start the crawler
{'ResponseMetadata': {'RequestId': '73e50130-*****************8e', 'HTTPStatusCode': 200, 'HTTPHeaders': {'date': 'Sun, 28 Mar 2021 07:26:55 GMT', 'content-type': 'application/x-amz-json-1.1', 'content-length': '2', 'connection': 'keep-alive', 'x-amzn-requestid': '73e50130-***************8e'}, 'RetryAttempts': 0}}

#2nd time run, before crawler completes the operation
Exception: boto3 client error in start_a_crawler: An error occurred (CrawlerRunningException) when calling the StartCrawler operation: Crawler with name Data Dimension has already started

  1. AWS গ্লু ডেটা ক্যাটালগ থেকে টেবিলের একটি নির্দিষ্ট সংস্করণ মুছতে Boto3 কীভাবে ব্যবহার করবেন?

  2. AWS গ্লু ডেটা ক্যাটালগ থেকে একটি টেবিল মুছতে Boto3 কীভাবে ব্যবহার করবেন?

  3. AWS ডেটা ক্যাটালগ থেকে একটি ডাটাবেস মুছতে Boto3 কীভাবে ব্যবহার করবেন?

  4. AWS গ্লু ডেটা ক্যাটালগ থেকে একটি ক্রলার মুছতে Boto3 কীভাবে ব্যবহার করবেন?