ওয়েব স্ক্র্যাপিং হল একটি স্বয়ংক্রিয় পদ্ধতি ব্যবহার করে ওয়েবসাইট থেকে ডেটা, তথ্য বা ছবি তোলার কাজ। এটিকে সম্পূর্ণ স্বয়ংক্রিয়ভাবে কপি এবং পেস্ট হিসাবে মনে করুন।
আমরা যে ওয়েবসাইটগুলিতে যেতে চাই সেগুলিতে যেতে আমরা একটি অ্যাপ লিখি বা ব্যবহার করি এবং সেই ওয়েবসাইটগুলি থেকে আমরা যে নির্দিষ্ট জিনিসগুলি চাই তার একটি অনুলিপি তৈরি করি। এটি একটি সম্পূর্ণ ওয়েবসাইট ডাউনলোড করার চেয়ে অনেক বেশি সুনির্দিষ্ট।
যেকোনো টুলের মতো, ওয়েব স্ক্র্যাপিং ভালো বা মন্দের জন্য ব্যবহার করা যেতে পারে। ওয়েবসাইট স্ক্র্যাপ করার কিছু ভালো কারণ হল এটির বিষয়বস্তু, মূল্য তুলনা কেনাকাটা, বা স্টক মার্কেটের তথ্যের উপর ভিত্তি করে এটিকে অনুসন্ধান ইঞ্জিনে র্যাঙ্কিং করা। এমনকি আপনি এটিকে বিভিন্ন ধরণের গবেষণার সরঞ্জাম হিসাবে ব্যবহার করতে পারেন।
আমি কিভাবে এক্সেল দিয়ে ওয়েবসাইট স্ক্র্যাপ করতে পারি?
বিশ্বাস করুন বা না করুন, অন্তত এক্সেল 2003 সাল থেকে এক্সেলের ওয়েবসাইটগুলি থেকে ডেটা বের করার ক্ষমতা দীর্ঘ সময়ের জন্য রয়েছে। এটি এমন একটি বিষয় যা বেশিরভাগ লোকেরা ভাবেন না, কাজটি করার জন্য অ্যাসপ্রেডশীট প্রোগ্রাম ব্যবহার করার কথা ভাবুন। . কিন্তু এটি আশ্চর্যজনকভাবে সহজ এবং শক্তিশালী। আসুন জেনে নিই কিভাবে Microsoft Office কীবোর্ড শর্টকাট সংগ্রহ করে এটি করা হয়।
আপনি স্ক্র্যাপ করতে চান এমন সাইটগুলি খুঁজুন
আমরা যা করতে যাচ্ছি তা হল নির্দিষ্ট ওয়েব পৃষ্ঠাগুলি খুঁজে বের করা যা থেকে আমরা তথ্য পেতে চাই। আসুন সোর্সে যাই এবং https://support.office.com/ এ অনুসন্ধান করি। আমরা "প্রায়শ ব্যবহৃত শর্টকাট" অনুসন্ধান শব্দটি ব্যবহার করতে যাচ্ছি। আউটলুক, এক্সেল, ওয়ার্ড ইত্যাদির মতো নির্দিষ্ট অ্যাপের নাম ব্যবহার করে আমরা এটিকে আরও নির্দিষ্ট করতে পারি। ফলাফল পৃষ্ঠা বুকমার্ক করা একটি ভাল ধারণা হতে পারে যাতে আমরা সহজেই সেখানে ফিরে যেতে পারি৷
সার্চ রেজাল্টে ক্লিক করুন, "Windows এর জন্য Excel এ কীবোর্ড শর্টকাট"। একবার সেই পৃষ্ঠায়, Excel সংস্করণগুলির তালিকা খুঁজুন এবং নতুন সংস্করণ-এ ক্লিক করুন৷ . এখন আমরা সর্বশেষ এবং সর্বশ্রেষ্ঠ সাথে কাজ করছি।
আমরা আমাদের অনুসন্ধান ফলাফল পৃষ্ঠায় ফিরে যেতে পারি এবং অন্যান্য সমস্ত অফিস অ্যাপের জন্য তাদের নিজস্ব ট্যাবে ফলাফল খুলতে পারি এবং সেগুলি বুকমার্ক করতে পারি। এটি একটি ভাল ধারণা, এমনকি এই অনুশীলনের জন্যও। এখানেই বেশিরভাগ লোক অফিস শর্টকাট সংগ্রহ করা বন্ধ করবে, কিন্তু আমাদের নয়। আমরা সেগুলিকে Excel-এ রাখব যাতে আমরা যখনই চাই তাদের সাথে যা খুশি করতে পারি৷
এক্সেল খুলুন এবং স্ক্র্যাপ করুন
এক্সেল খুলুন এবং একটি নতুন ওয়ার্কবুক শুরু করুন। ওয়ার্কবুকটিকে অফিস শর্টকাট হিসেবে সংরক্ষণ করুন . আপনার যদি OneDrive থাকে, তাহলে সেটিকে সেখানে সেভ করুন যাতে AutoSave বৈশিষ্ট্য কাজ করবে।
ওয়ার্কবুকটি সংরক্ষিত হয়ে গেলে, ডেটা-এ ক্লিক করুন ট্যাব।
ডেটা ট্যাবের রিবনে, ওয়েব থেকে ক্লিক করুন .
ওয়েব থেকে উইজার্ড উইন্ডো খুলবে। এখানেই আমরা ওয়েবসাইটটির ওয়েব ঠিকানা বা URL রাখি যেখান থেকে আমরা ডেটা স্ক্র্যাপ করতে চাই। আপনার ওয়েব ব্রাউজারে স্যুইচ করুন এবং কপি করুন URL।
URLটিকে URL-এ আটকান৷ ওয়েব উইজার্ডের ক্ষেত্র। আমরা এটিকে বেসিক-এ ব্যবহার করতে বেছে নিতে পারি অথবা উন্নত মোড. অ্যাডভান্সড মোড আমাদের ওয়েবসাইট থেকে ডেটা অ্যাক্সেস করার জন্য আরও অনেক বিকল্প দেয়। এই অনুশীলনের জন্য, আমাদের শুধুমাত্র বেসিকমোড প্রয়োজন। ঠিক আছে ক্লিক করুন .
এক্সেল এখন ওয়েবসাইটের সাথে সংযোগ করার চেষ্টা করবে। এই কয়েক সেকেন্ড সময় লাগতে পারে. আমরা একটি অগ্রগতি উইন্ডো দেখতে পাব, যদি এটি হয়।
নেভিগেটর উইন্ডো খুলবে, এবং আমরা বাম দিকের ওয়েবসাইট থেকে টেবিলের একটি তালিকা দেখতে পাব। যখন আমরা একটি নির্বাচন করব, তখন আমরা ডানদিকে একটি টেবিলের পূর্বরূপ দেখতে পাব। চলুন প্রায়শ ব্যবহৃত শর্টকাট নির্বাচন করি টেবিল।
আমরা ওয়েবভিউ-এ ক্লিক করতে পারি আসল ওয়েবসাইট দেখতে ট্যাব, যদি আমাদের চারপাশে দেখতে হয় টেবিলের জন্য আমরা চাই। যখন আমরা এটি খুঁজে পাই, আমরা এটিতে ক্লিক করতে পারি এবং এটি আমদানির জন্য নির্বাচন করা হবে৷
এখন, আমরা লোড-এ ক্লিক করি এই উইন্ডোর নীচে বোতাম। আমরা বেছে নিতে পারি এমন অন্যান্য বিকল্প রয়েছে, যা আরও জটিল এবং আমাদের প্রথম স্ক্র্যাপ করার সুযোগের বাইরে। শুধু সাবধান যে তারা সেখানে আছে. এক্সেলের ওয়েব স্ক্র্যাপিং ক্ষমতা খুবই শক্তিশালী।
ওয়েব টেবিলটি কয়েক সেকেন্ড পর এক্সেলে লোড হবে। আমরা বাম দিকে ডেটা দেখতে পাব, যেখানে 1 নম্বর নিচের ছবিতে আছে। নম্বর 2 কোয়েরি হাইলাইট করে ওয়েবসাইট থেকে ডেটা পেতে ব্যবহৃত হয়। যখন আমাদের একটি ওয়ার্কবুকে একাধিক প্রশ্ন থাকে, তখন এখানেই আমরা একটি নির্বাচন করি যা আমাদের ব্যবহার করতে হবে৷
৷লক্ষ্য করুন যে ডেটা একটি এক্সেলটেবল হিসাবে স্প্রেডশীটে আসে। ডেটা ফিল্টার বা সাজাতে সক্ষম হওয়ার জন্য এটি ইতিমধ্যেই সেট আপ করা হয়েছে৷
৷আমরা Outlook, Word, Access, PowerPoint, এবং অন্য যেকোন Office অ্যাপের জন্য যে অফিস শর্টকাটগুলি চাই সেই সমস্ত অন্যান্য ওয়েব পৃষ্ঠাগুলির জন্য আমরা এই প্রক্রিয়াটি পুনরাবৃত্তি করতে পারি৷
এক্সেল এ স্ক্র্যাপ করা ডেটা বর্তমান রাখা
আপনার জন্য একটি বোনাস হিসাবে, আমরা শিখতে যাচ্ছি কিভাবে আমাদের স্ক্র্যাপ করা ডেটাকে Excel-এ তাজা রাখা যায়। ডেটা স্ক্র্যাপিংয়ের জন্য এক্সেল কতটা শক্তিশালী তা বোঝানোর এটি একটি দুর্দান্ত উপায়। এমনকি এটির সাথে, আমরা কেবলমাত্র সবচেয়ে মৌলিক স্ক্র্যাপিং করছি যা এক্সেল করতে পারে।
এই উদাহরণের জন্য, আসুন একটি স্টক তথ্য ওয়েব পৃষ্ঠা ব্যবহার করি যেমন https://www.cnbc.com/stocks/.
আমরা আগে যা করেছি তার মধ্য দিয়ে যান এবং ঠিকানা বার থেকে নতুন URL টি কপি এবং পেস্ট করুন।
আপনি নেভিগেটর উইন্ডোতে পাবেন এবং উপলব্ধ টেবিলগুলি দেখতে পাবেন। আসুন প্রধান মার্কিন স্টক সূচক নির্বাচন করি।
ডেটা স্ক্র্যাপ হয়ে গেলে আমরা নিম্নলিখিত স্প্রেডশীটটি দেখতে পাব।
ডানদিকে, আমরা মেজর ইউএস স্টক ইনডেক্সের জন্য ক্যোয়ারী দেখতে পাচ্ছি। নির্বাচন করুন যাতে এটি হাইলাইট হয়। নিশ্চিত করুন যে আমরা টেবিল টুলস-এ আছি ট্যাব এবং ডিজাইন-এ এলাকা তারপর রিফ্রেশ-এর অধীনে নিচের তীরটিতে ক্লিক করুন তারপর সংযোগ বৈশিষ্ট্য-এ ক্লিক করুন .
কোয়েরি প্রোপার্টিজ -এ উইন্ডো, ব্যবহার এর অধীনে ট্যাব, আমরা এই তথ্য রিফ্রেশ কিভাবে নিয়ন্ত্রণ করতে পারেন. আমরা রিফ্রেশ করার জন্য একটি নির্দিষ্ট টাইমপিরিয়ড সেট করতে পারি, বা আমরা যখন পরের বার ওয়ার্কবুক খুলব, বা পটভূমিতে রিফ্রেশ করব, বা এইগুলির যেকোন সমন্বয়। একবার আমরা যা চাই তা বেছে নিলে, ঠিক আছে এ ক্লিক করুন উইন্ডো বন্ধ করে চালিয়ে যেতে।
এটাই! এখন আপনি এক্সেল স্প্রেডশীট থেকে স্টক মূল্য, খেলাধুলার স্কোর বা অন্য যেকোন ডেটা যা ঘন ঘন পরিবর্তিত হয় ট্র্যাক করতে পারেন৷ আপনি যদি এক্সেল সমীকরণ এবং ফাংশনগুলির সাথে ভাল হন তবে ডেটা দিয়ে আপনি যা চান তা করতে পারেন।
হতে পারে স্টক প্রবণতা সনাক্ত করার চেষ্টা করুন, কর্মক্ষেত্রে একটি ফ্যান্টাসি স্পোর্টস পুল চালান, বা হয়তো আবহাওয়ার উপর নজর রাখুন। কে জানে? আপনার কল্পনা এবং ইন্টারনেটে উপলব্ধ ডেটা, একমাত্র সীমা।