ডেটা অ্যানালিটিক্স সিদ্ধান্ত নেওয়ার জন্য মেশিনকে সমর্থন করে এমন দরকারী তথ্য বের করার জন্য ডেটা প্রক্রিয়াকরণ। ডেটা প্রক্রিয়াকরণের মধ্যে রয়েছে পরিষ্কার করা, পুনর্নির্মাণ করা এবং ডেটা পরিদর্শন করা৷
ডেটা অ্যানালিটিক্সের জন্য উচ্চ কম্পিউটিং শক্তি প্রয়োজন কারণ ডেটা প্রক্রিয়া করার জন্য খুব বড়। সুতরাং ডেটা বিশ্লেষণের জন্য বিশেষ সরঞ্জাম রয়েছে৷
কিছু জনপ্রিয় ডেটা অ্যানালিটিক্স টুল হল −
-
আর প্রোগ্রামিং
উইন্ডোজ, ম্যাকওএস, ইউনিক্সের মতো সমস্ত প্রধান প্ল্যাটফর্মের জন্য উপলব্ধ ডেটা বিশ্লেষণের জন্য R হল অন্যতম সেরা এবং বহুল ব্যবহৃত টুল। এটি ডেটা মডেলিং এবং পরিসংখ্যানে ব্যবহার খুঁজে পেয়েছে। R ব্যবহার করে সহজেই ম্যানিপুলেশন এবং বড় ডেটা উপস্থাপন করা হয় কারণ এতে ডেটা বিশ্লেষণের জন্য বিশাল লাইব্রেরি সমর্থন রয়েছে। R-এ 11,556 প্যাকেজ পাওয়া যায় যা ডেটা সায়েন্টিস্টের কাজকে সহজ করে তোলে।
-
পাইথন
তালিকার আরেকটি প্রোগ্রামিং ভাষা, পাইথন একটি বহুমুখী এবং সবচেয়ে বহুমুখী প্রোগ্রামিং ভাষা। এটির বৃহৎ লাইব্রেরি এবং সহজে বোঝার প্রকৃতির কারণে এটি ব্যাপকভাবে ব্যবহৃত হয়। এটি এমন একজন ব্যবহারকারীর মধ্যে সাধারণ যার মেশিন লার্নিং এবং ডেটা অ্যানালিটিক্স উভয় বৈশিষ্ট্য সহ একটি টুলের প্রয়োজন হয় কারণ এতে প্যাকেজের একটি বিশাল সেট রয়েছে যা উভয়কেই সমর্থন করে৷
-
টেবিল পাবলিক
একটি বিনামূল্যের ডেটা ভিজ্যুয়ালাইজেশন টুল যা ভিজ্যুয়ালাইজেশন, ম্যাপ এবং ড্যাশবোর্ড ইত্যাদি তৈরি করে। এটি ভিজ্যুয়ালাইজেশনের জন্য ডেটা বের করতে ডেটা সোর্সের সাথে সহজেই সংযোগ করতে পারে এবং ক্লায়েন্ট বা সোশ্যাল মিডিয়াতে ভিজ্যুয়ালাইজেশন শেয়ার করতেও সমর্থন করে। এটিতে বড় ডেটা প্রক্রিয়া করার ক্ষমতা রয়েছে এবং এটি আরও ভাল উপায়ে ডেটা কল্পনা করতে পারে৷
-
SAS
Sas হল একটি প্রোগ্রামিং ভাষা এবং পরিবেশ যা ডেটা ম্যানিপুলেশনের জন্য ব্যবহৃত হয়। এটি ডেটার বড় সেট বিশ্লেষণ এবং সেগুলি পরিচালনা করতে ব্যবহৃত হয়। এটি একটি দক্ষ সোশ্যাল মিডিয়া মার্কেটিং টুল।
-
Microsoft Excel
এটি একটি সহজ এবং মৌলিক টুল যা বিশ্লেষণের জন্য ব্যবহার করা যেতে পারে। ডেটা বিজ্ঞানীরা এটিকে প্রথম-স্তরের সরঞ্জাম হিসাবে ব্যবহার করেন। এটি ডেটা সেটের পূর্বরূপ দেখার এবং ডেটাতে ফিল্টার যোগ করার একটি গুরুত্বপূর্ণ টুল। মডেলিংয়ে ব্যবহারকারীদের সাহায্য করার জন্য এটিতে অনেক উন্নত ব্যবসা বিশ্লেষণ রয়েছে৷
-
অ্যাপাচি স্পার্ক
Apache Spark Apache spark হল একটি মাপযোগ্য ডেটা প্রসেসিং টুল যা Hadoop ডেটা ক্লাস্টারগুলির সাথে কাজ করতে ব্যবহৃত হয়। এটি এমন একটি টুল যা ডেটা সায়েন্সকে সাহায্য করে এবং মেশিন লার্নিং মডেল ডেভেলপমেন্টের জন্য ব্যবহৃত হয় কারণ এটি ডেটা সেট থেকে শেখার জন্য শ্রেণীবিভাগ, রিগ্রেশন, ক্লাস্টারিং এবং ফিল্টারিংয়ের মতো কৌশলগুলিকে সমর্থন করে।