ক্রস ইন্ডাস্ট্রি স্ট্যান্ডার্ড প্রসেস ফর ডেটা মাইনিং (CRISP-DM) M&V পদ্ধতিকে আরও মানসম্মত করার একটি পদ্ধতি হিসাবে স্বীকৃত এবং শক্তি সঞ্চয়ের আরও দক্ষ অনুমানের অনুমতি দেয়। CRISP-DM-এর বেশ কয়েকটি অ্যাপ্লিকেশন রয়েছে যা নিম্নরূপ -
ব্যবসায়িক বোঝাপড়া − M&V-কে সাহায্য করার জন্য DM-এর আবেদনের সম্ভাব্যতা তৈরি করার জন্য কেস স্টাডি হিসেবে একটি বায়োমেডিকেল ম্যানুফ্যাকচারিং সুবিধা নির্বাচন করা হয়েছিল। প্রক্রিয়াটির মডেলিং এবং মূল্যায়ন পর্যায়ে ফলাফলগুলি কার্যকর করার জন্য বিশ্লেষণের অধীনে ব্যবসার একটি গুণমান বোঝা গুরুত্বপূর্ণ ছিল। এটি একটি প্রসেস ওয়াক-থ্রু, লার্নিং প্রসেস ফ্লো ডায়াগ্রাম এবং পাইপিং এবং ইন্সট্রুমেন্টেশন ডায়াগ্রামের মাধ্যমে বাস্তবায়িত হয়েছিল৷
এই পর্যায় থেকে বিশ্লেষণের সীমানার মধ্যে সিস্টেমগুলির একটি জ্ঞান প্রয়োজন ছিল এবং সুবিধার প্রকৌশল দলের সাথে আরও কিছু সমস্যা বোঝা গিয়েছিল। বিশ্লেষণের সীমা ছিল সমগ্র উৎপাদন সুবিধা জুড়ে বৈদ্যুতিক শক্তি খরচ৷
ডেটা বোঝা − CRISP-DM রেফারেন্স মডেলের ডেটা বোঝার প্রক্রিয়াটি সুবিধার ডেটা প্রযুক্তি পরিকাঠামোর তদন্তের মাধ্যমে সম্পন্ন হয়েছিল। শক্তি খরচ ডেটার প্রবাহ এবং যে ডেটাবেসগুলিতে এটি সংরক্ষণ করা হয়েছিল তার একটি বোঝাপড়া অর্জিত হয়েছিল৷
ডেটা প্রস্তুতি − মিটারিংয়ের বৈশিষ্ট্যের কারণে শক্তি খরচ ডেটা গণনা করা জটিল। ক্রমবর্ধমান মিটারগুলি বৈদ্যুতিক শক্তির জন্য ব্যবহৃত হয় এবং ফলস্বরূপ, আউটপুট করা ডেটাতে প্রাক-প্রসেসিং সম্পন্ন করা উচিত। তদন্তাধীন ক্ষেত্রে, এটি ব্যবহারকারীর কাছে আউটপুট হওয়ার আগে অর্জন করা হয়েছিল।
কিন্তু ডেটার এই প্রাক-শুদ্ধকরণ নির্বিশেষে, বহিরাগতরা ডেটা সেটে রয়ে গেছে কারণ প্রাক-পরিষ্কার পদ্ধতি সমস্ত অসঙ্গতি দূর করেনি। তাই, ব্যবহারকারীর কাছে বিতরণ করা ডেটা সেটের কিছু অবশিষ্ট আউটলায়ারগুলিকে বাদ দিতে ডেটা প্রস্তুতি পর্ব ব্যবহার করা হয়েছিল৷
সাইটটিতে বৈদ্যুতিক শক্তি ভোক্তাদের সম্পূর্ণ বিশ্লেষণের জন্য প্রয়োজনীয় ডেটা সংগ্রহ করতে দুটি ডেটা উত্স ব্যবহার করা হয়েছিল - শক্তি ব্যবস্থাপনা অ্যাপ্লিকেশন এবং বায়ু টারবাইন পরিচালনা অ্যাপ্লিকেশন৷
সাইটে মুগ্ধ বৈদ্যুতিক শক্তি ক্রমবর্ধমান কিলোওয়াট-ঘন্টা (kWh) মিটার দ্বারা গণনা করা হয়। এই ডেটার প্রাক-প্রক্রিয়াকরণের মধ্যে রয়েছে মিটারের ত্রুটির দ্বারা উৎপন্ন আউটলায়ার সনাক্ত করা এবং ডেটাকে kWh থেকে গড় বৈদ্যুতিক লোডে কিলোওয়াট (kW) এ রূপান্তর করা। দ্বিতীয় ধাপে কিছু ডেটা সমান বিন্যাস এবং ইউনিটে বিশ্লেষণ করার প্রয়োজন ছিল।
মডেলিং − ডেটা তৈরির পদ্ধতি থেকে ডেটাসেট আউটপুট বাস্তবায়িত ডেটা পরিষ্কারের ফলাফল হিসাবে একটি পরিষ্কার এবং কার্যকরী বিন্যাসে ছিল। এই কেস স্টাডির গ্যালগুলির জন্য, সংকুচিত বায়ু লোডটি ছিল মডেল করার জন্য নির্বাচিত পরিমাণ, কারণ এটি উপলব্ধ শক্তি ডেটার শক্তি বৈশিষ্ট্যের জন্য সবচেয়ে উপযুক্ত পরিবর্তনশীল।
যখন লোডটিকে উচ্চ-স্তরে বিবেচনা করা হয়েছিল, তখন সাইটের অন্যান্য প্রয়োজনীয় শক্তি ব্যবহারকারীদের সাথে কোনও স্পষ্ট এবং আপাত সম্পর্ক ছিল না। সরবরাহের সময়সূচী এবং স্ট্যান্ডার্ড অপারেটিং প্রক্রিয়ার উপস্থিতির কারণে অন্যান্য প্রয়োজনীয় শক্তি ব্যবহারকারীরা আরও অনুমানযোগ্য ছিল৷