এই নিবন্ধে, আমরা দেখব কিভাবে একজন ব্যবহারকারী AWS Glue Data Catalog-এ একটি ক্রলার শুরু করতে পারে।
উদাহরণ
সমস্যা বিবৃতি: boto3 ব্যবহার করুন একটি ক্রলার শুরু করতে পাইথনে লাইব্রেরি৷
এই সমস্যা সমাধানের জন্য অ্যাপ্রোচ/অ্যালগরিদম
-
ধাপ 1: boto3 আমদানি করুন৷ এবং বোটোকোর ব্যতিক্রমগুলি পরিচালনা করার জন্য ব্যতিক্রমগুলি
-
ধাপ 2: ক্রলার_নাম এই ফাংশনের প্যারামিটার।
-
ধাপ 3: boto3 lib ব্যবহার করে একটি AWS সেশন তৈরি করুন . region_name নিশ্চিত করুন৷ ডিফল্ট প্রোফাইলে উল্লেখ করা আছে। যদি এটি উল্লেখ না থাকে, তাহলে স্পষ্টভাবে অঞ্চল_নাম পাস করুন সেশন তৈরি করার সময়।
-
পদক্ষেপ 4: আঠালো এর জন্য একটি AWS ক্লায়েন্ট তৈরি করুন .
-
ধাপ 5: এখন start_crawler ব্যবহার করুন ফাংশন এবং প্যারামিটার পাস করুন crawler_name নাম হিসাবে।
-
ধাপ 6: এটি প্রতিক্রিয়া মেটাডেটা ফেরত দেয় এবং তার সময়সূচী নির্বিশেষে ক্রলার শুরু করে। যদি ক্রলারের অবস্থা চলমান থাকে, তাহলে এটি CrawlerRunningException নিক্ষেপ করে .
-
পদক্ষেপ 7: একটি ক্রলার শুরু করার সময় কিছু ভুল হলে জেনেরিক ব্যতিক্রম পরিচালনা করুন।
উদাহরণ কোড
নিম্নলিখিত কোডটি AWS Glue Data Catalog −
-এ একটি ক্রলার শুরু করেimport boto3 from botocore.exceptions import ClientError def start_a_crawler(crawler_name) session = boto3.session.Session() glue_client = session.client('glue') try: response = glue_client.start_crawler(Name=crawler_name) return response except ClientError as e: raise Exception("boto3 client error in start_a_crawler: " + e.__str__()) except Exception as e: raise Exception("Unexpected error in start_a_crawler: " + e.__str__()) #1st time start the crawler print(start_a_crawler("Data Dimension")) #2nd time run, before crawler completes the operation print(start_a_crawler("Data Dimension"))
আউটপুট
#1st time start the crawler {'ResponseMetadata': {'RequestId': '73e50130-*****************8e', 'HTTPStatusCode': 200, 'HTTPHeaders': {'date': 'Sun, 28 Mar 2021 07:26:55 GMT', 'content-type': 'application/x-amz-json-1.1', 'content-length': '2', 'connection': 'keep-alive', 'x-amzn-requestid': '73e50130-***************8e'}, 'RetryAttempts': 0}} #2nd time run, before crawler completes the operation Exception: boto3 client error in start_a_crawler: An error occurred (CrawlerRunningException) when calling the StartCrawler operation: Crawler with name Data Dimension has already started