এই নিবন্ধে, আমরা দেখব কিভাবে একজন ব্যবহারকারী AWS Glue Data Catalog-এ একটি ক্রলার শুরু করতে পারে।
উদাহরণ
সমস্যা বিবৃতি: boto3 ব্যবহার করুন একটি ক্রলার শুরু করতে পাইথনে লাইব্রেরি৷
এই সমস্যা সমাধানের জন্য অ্যাপ্রোচ/অ্যালগরিদম
-
ধাপ 1: boto3 আমদানি করুন৷ এবং বোটোকোর ব্যতিক্রমগুলি পরিচালনা করার জন্য ব্যতিক্রমগুলি
-
ধাপ 2: ক্রলার_নাম এই ফাংশনের প্যারামিটার।
-
ধাপ 3: boto3 lib ব্যবহার করে একটি AWS সেশন তৈরি করুন . region_name নিশ্চিত করুন৷ ডিফল্ট প্রোফাইলে উল্লেখ করা আছে। যদি এটি উল্লেখ না থাকে, তাহলে স্পষ্টভাবে অঞ্চল_নাম পাস করুন সেশন তৈরি করার সময়।
-
পদক্ষেপ 4: আঠালো এর জন্য একটি AWS ক্লায়েন্ট তৈরি করুন .
-
ধাপ 5: এখন start_crawler ব্যবহার করুন ফাংশন এবং প্যারামিটার পাস করুন crawler_name নাম হিসাবে।
-
ধাপ 6: এটি প্রতিক্রিয়া মেটাডেটা ফেরত দেয় এবং তার সময়সূচী নির্বিশেষে ক্রলার শুরু করে। যদি ক্রলারের অবস্থা চলমান থাকে, তাহলে এটি CrawlerRunningException নিক্ষেপ করে .
-
পদক্ষেপ 7: একটি ক্রলার শুরু করার সময় কিছু ভুল হলে জেনেরিক ব্যতিক্রম পরিচালনা করুন।
উদাহরণ কোড
নিম্নলিখিত কোডটি AWS Glue Data Catalog −
-এ একটি ক্রলার শুরু করেimport boto3
from botocore.exceptions import ClientError
def start_a_crawler(crawler_name)
session = boto3.session.Session()
glue_client = session.client('glue')
try:
response = glue_client.start_crawler(Name=crawler_name)
return response
except ClientError as e:
raise Exception("boto3 client error in start_a_crawler: " + e.__str__())
except Exception as e:
raise Exception("Unexpected error in start_a_crawler: " + e.__str__())
#1st time start the crawler
print(start_a_crawler("Data Dimension"))
#2nd time run, before crawler completes the operation
print(start_a_crawler("Data Dimension")) আউটপুট
#1st time start the crawler
{'ResponseMetadata': {'RequestId': '73e50130-*****************8e', 'HTTPStatusCode': 200, 'HTTPHeaders': {'date': 'Sun, 28 Mar 2021 07:26:55 GMT', 'content-type': 'application/x-amz-json-1.1', 'content-length': '2', 'connection': 'keep-alive', 'x-amzn-requestid': '73e50130-***************8e'}, 'RetryAttempts': 0}}
#2nd time run, before crawler completes the operation
Exception: boto3 client error in start_a_crawler: An error occurred (CrawlerRunningException) when calling the StartCrawler operation: Crawler with name Data Dimension has already started