Upscayl - AI এর সাহায্যে, স্থানীয়ভাবে, কোনো ক্লাউড ছাড়াই আপনার ছবিগুলিকে উন্নত করুন
আপডেট করা হয়েছে:সেপ্টেম্বর 6, 2024
সাধারণত, আমি এআই-এর অনেক কিছুর প্রতিই ঘৃণা করি। কৃত্রিম বুদ্ধিমত্তার ধারণার সাথে সহজাতভাবে কিছু ভুল আছে বলে নয়। না। আমি যেটা অপছন্দ করি তা হল প্রযুক্তি এবং পণ্যের আশেপাশে গুঞ্জন এবং হাইপ যাকে এআই বলে অভিহিত করা হয়, যখন সেগুলি সর্বোত্তমভাবে, পরিসংখ্যানকে মহিমান্বিত করে, বিপণন বাজে কথার মোটা স্তর দিয়ে লেদার করা হয়। এখন... বলুন আপনার কাছে অনেক পুরনো, কম-রেজোয়াল, ঝাপসা ছবি আছে। আপনি তাদের ভাল করতে পারেন? AI এর সাথে?
আপনি যদি 2000-এর দশকের গোড়ার দিকে টিভি ক্রাইম শো দেখে থাকেন, তাহলে আপনি শুধু "বর্ধিত" করেন৷ শুধুমাত্র, যখনই আপনি একটি ছবিকে উন্নীত করেন, জেমস ম্যাক্সওয়েল এবং লুডভিগ বোল্টজম্যান তাদের কবরে ঘুরতে থাকেন, কারণ আপনি তাপগতিবিদ্যার আইন লঙ্ঘন করছেন। এনট্রপি এবং যে. কিছুই না আউট তথ্য তৈরি. জাদু. কিন্তু এআই-চালিত প্রোগ্রামগুলি আসলে সেই প্রতিশ্রুতি দেয়। প্রশ্ন হল, ক্লাউড ওভারলোডের কাছে আপনার আত্মা সমর্পণ না করে আপনি কি এআই করতে পারেন? আহ, মনে হচ্ছে আপনি পারেন, সব পরে! এরকম একটি টুল হল Upscayl. ওপেন সোর্স, ক্রস-প্ল্যাটফর্ম, এআই ইমেজ বর্ধক। চমত্কার শোনাচ্ছে. এখন, দেখা যাক এটা আসলে বিজ্ঞাপনের মত কাজ করে কিনা।
সহজ সেটআপ, সত্যিই অফলাইন
যেকোন ধরণের AI স্টাফের জন্য আমার প্রয়োজনীয়তা হল স্থানীয় সেটআপ তৈরি করার ক্ষমতা। এবং অনেকগুলি পদক্ষেপ ছাড়াই। Upscayl এই উভয় বাক্স চেক করে। আমি স্ন্যাপ স্টোর থেকে টুলটির স্ন্যাপ সংস্করণ ডাউনলোড করেছি এবং কুবুন্টু 24.04 (লিনাক্স) এ প্রোগ্রামটি ইনস্টল করেছি। কোন সমস্যা নেই, একটি সহজ এবং দ্রুত স্থাপনা।
পরবর্তী, আমি প্রোগ্রামের নেটওয়ার্ক সংযোগ নিষ্ক্রিয় করেছি। স্ন্যাপগুলি হল স্যান্ডবক্সড লিনাক্স অ্যাপ্লিকেশন, এবং আপনি ঘোষিত সংস্থানগুলিতে তাদের অ্যাক্সেসকে বেছে বেছে সক্রিয় বা অক্ষম করার ক্ষমতা রাখেন। এই বিশেষ ক্ষেত্রে, Upscayl আপনার বাড়িতে (ফাইলের জন্য), OpenGL এবং এই ধরনের (প্রকৃত রেন্ডারিং এবং প্রক্রিয়াকরণের জন্য), এবং অন্যান্য অনেক সংস্থান অ্যাক্সেস করতে হবে। নেটওয়ার্ক প্লাগটিও তালিকাভুক্ত, এবং ডিফল্টরূপে সক্ষম। এটি বেশিরভাগ স্ন্যাপগুলির জন্য সত্য, এবং এটি প্রতি নিজের সমস্যা নয়৷
৷কিন্তু Upscayl সত্যিই 100% স্থানীয় জাদু করতে পারে কিনা তা দেখার জন্য, আমি নিজে নেটওয়ার্ক প্লাগ সংযোগ বিচ্ছিন্ন করেছি। সমস্ত ব্যবহারিক উদ্দেশ্যে, যতদূর প্রোগ্রামটি উদ্বিগ্ন, আমার মেশিনের কোনও নেটওয়ার্ক নেই। এর পরে, আমি Upscayl চালু করেছি এবং এটিকে বেশ কয়েকটি ছবি "ঠিক" করতে ব্যবহার করেছি। কোন সমস্যা নেই, কোন অভিযোগ নেই। চমৎকার।
বিচ্ছিন্ন গ্রাফিক্স কার্ডের প্রয়োজনীয়তা (ভুলকান-সামঞ্জস্যপূর্ণ)
আপনি যদি Upscayl ব্যবহার করতে চান, আপনার এমন একটি মেশিনের প্রয়োজন হবে যাতে একটি অপেক্ষাকৃত আধুনিক এবং সক্ষম বিচ্ছিন্ন গ্রাফিক্স কার্ড থাকে। বেশিরভাগ ইন্টিগ্রেটেড জিপিইউ কাজ করবে না। প্রশ্ন হলো, আধুনিক ও সক্ষম বলতে আসলে কী বোঝায়? ভাল, আমার পরীক্ষার বাক্স হল একটি 2014 আইডিয়াপ্যাড ল্যাপটপ, যেটিতে আমি সম্প্রতি একটি SSD আপগ্রেডের পরে কুবুন্টু 24.04 ইনস্টল করেছি৷ সিস্টেমে একটি পুরানো এনভিডিয়া কার্ড রয়েছে। এবং এটা ঠিক কাজ. হয়তো সাম্প্রতিক প্রজন্মের ডিভাইসের মতো দ্রুত নয়, কিন্তু Upscayl কোনো সমস্যা বা সমস্যা ছাড়াই কাজগুলো পরিচালনা করেছে। সেখানে, মনে হবে একটি 10 বছরের পুরোনো ল্যাপটপ যথেষ্ট ভালো৷
৷আসল কাজ, কোন ভাল?
এখন, গুরুত্বপূর্ণ অংশ। Upscayl আসলে ভাল ফলাফল দিতে পারে? এটি পরীক্ষা করার জন্য, আমি আমার পুরানো ফটোগুলির অস্ত্রাগার দিয়ে আঁচড়াতে গিয়েছিলাম, কিছু পছন্দের প্রার্থীর সন্ধান করছিলাম। আমি তিনটি ফটো খুঁজে পেয়েছি যা আমি ভেবেছিলাম পরীক্ষার জন্য ভাল বিকল্প হবে৷
৷- একটি স্কি শ্যালেটের একটি 1983 সালের ছবি (একটি চমৎকার 35 মিমি অ্যানালগ ফিল্ম ক্যামেরা দিয়ে তোলা) এবং পরে একটি সস্তায় হোম-ইউজ স্ক্যানার (300 ডিপিআই-এ) ব্যবহার করে প্রিন্ট করা ছবি স্ক্যান করে ডিজিটাইজ করা হয়।
- একজন মানুষের 2004 সালের ছবি, মিশ্র-আলো অবস্থায়, কিছু অতিরিক্ত ঝাপসা সহ।
- একটি ঘুমন্ত বিড়ালের একটি 2005 সালের ছবি, একটি নম্র 720x540px রেজোলিউশনে, ফোন চ্যাট এবং মেইল এবং হোয়াটনোটের মাধ্যমে পাঠানো হয়েছিল, এবং সম্ভবত যে কোনও প্রোগ্রাম ব্যবহার করা হয়েছিল এবং এ জাতীয় যে কোনও উপায়ে দুই বা তিনবার সংকুচিত হয়েছিল৷
Upscayl একটি চমত্কার সুন্দর, বন্ধুত্বপূর্ণ UI আছে. ব্যবহার করা খুব সুবিধাজনক. বাম দিকে, আপনার একটি সাইডবার রয়েছে যা আপনাকে আপনার ছবিগুলি (ব্যাচ প্রক্রিয়াকরণের জন্য একাধিক ফাইল সহ), বর্ধিতকরণ মডেলের নির্বাচন, স্কেল এবং আউটপুট ফোল্ডার লোড করতে দেয়৷ খুব সোজা। ডানদিকে, আপনি আসল ফটোটি দেখতে পাবেন, এবং একবার প্রক্রিয়াকরণ সম্পন্ন হলে, একটি উল্লম্ব স্লাইডারও থাকবে, যা আপনাকে "আগে" এবং "পরে" ফলাফলগুলি পরীক্ষা করতে দেয়৷
আমি আপসকেলে ফটোগুলি লোড করেছি এবং প্রোগ্রামটি চালাতে দিয়েছি ...
আমার বার্ধক্য 2014 মেশিনে, একটি 2500x2500px ফটোকে 4 এর ফ্যাক্টর দ্বারা আপস্কেল করতে প্রায় 7 মিনিট সময় লাগে। এটি বেশ যুক্তিসঙ্গত। যাইহোক, সময়গুলি উল্লেখযোগ্যভাবে পরিবর্তিত হতে পারে, মডেলটি ছবিতে পাওয়া তথ্যের উপর নির্ভর করে। দানাদারতা এবং আলোর স্তরও শেষ ফলাফলকে প্রভাবিত করে। আপনি যদি একটি এমনকি উচ্চ ইমেজ স্কেল ফ্যাক্টর ব্যবহার করেন, বা একটি আসল চিত্র ব্যবহার করেন যা ইতিমধ্যে বেশ বড়, সময়গুলি সহজেই 20-30 মিনিট হয়ে যেতে পারে। যাইহোক, সব মিলিয়ে পারফরম্যান্স বেশ ভালো।
ঘুমন্ত বিড়াল ইমেজ সঙ্গে, ফলাফল চমৎকার ছিল. দ্রুত রেন্ডার (10 সেকেন্ড), কঠিন উন্নতি। আপনি স্পষ্টভাবে আরো বিস্তারিত দেখতে পারেন. সুতরাং, আমাদের কাছে একটি ফাইল রয়েছে যাতে 16x বেশি পিক্সেল রয়েছে, এবং তবুও, এটি আরও পরিষ্কার এবং তীক্ষ্ণ। নিখুঁত নয়, তবে অবশ্যই দুর্দান্ত। এখন, ভাল আলো, স্বচ্ছতা এবং বৈসাদৃশ্য সহ এটি একটি কম-রেজোলিউশনের ছবি ছিল৷
৷
আমি পরের মানুষের ছবি দিয়ে চেষ্টা করেছি। ফলাফল ছিল ... নিরপেক্ষ. আমি সত্যিই নতুন ছবির মানের কোন উন্নতি দেখতে পারেনি. এটি বড় ছিল, কিন্তু তাই "ত্রুটি" ছিল। এখানে, আমাদের কাছে একটি বড় ছবি আছে, দুই ধরনের আলো, ডান দিকের তুলনায় (আসল) ছবির বাম অর্ধেকটি ঝাপসা (এবং গাঢ়) এবং যথেষ্ট পরিমাণে দানাদার। আপস্কাইল এখানে তেমন কিছু করতে পারেনি।
স্কি শ্যালেটের ফলাফলগুলি আসলে আসলটির বিপরীত ছিল। আমি যা দিয়ে শুরু করেছি তার চেয়ে উচ্চমানের পণ্যটি খারাপ ছিল। যদিও ফটোতে ভাল আলো রয়েছে, সেখানে প্রচুর দানাদারতা এবং প্রচুর পরিমাণে সূক্ষ্ম বিবরণ (গাছ এবং ঘাস) রয়েছে। আমার অনুমান হল যে চিত্রের ইতিমধ্যেই অতি-ব্যস্ত অংশে যে কোনও ধরণের এক্সট্রাপোলেশনের ফলে আরও বেশি শব্দ হয়। আমি একাধিক মডেল চেষ্টা করেছি, যার মধ্যে সবচেয়ে সেরা ULTRASHARP রয়েছে, এবং এটি এখনও কোনো উন্নতি করতে পারেনি৷
এগুলোর কোনোটিই আমার ফটো নং 3 এর সাথে কাজ করেনি।
এখানে একটি ঘাস বিভাগের অংশ জুম করা হয়েছে। আপনি মূল (বাম দিকে) দেখতে পাচ্ছেন, প্রচুর দানাদারতা রয়েছে। এটি পুরানো অ্যানালগ ফিল্ম ব্যবহার, ফিল্ম ডেভেলপমেন্ট, কয়েক দশক ধরে একটি শেলফে বসে থাকা ফটো, প্রায় পনেরো বছর আগে একটি সস্তা, অফ-দ্য-শেল্ফ ডিজিটাল স্ক্যানার (যদিও 300 DPI সহ) ব্যবহার করে পরবর্তী স্ক্যানিং এবং এখন AI-উন্নত ফলাফলের সংমিশ্রণ। "উন্নত" ঘাসটি অস্পষ্ট। আকাশ এবং ট্রেস জন্য একই যায়. এই ক্ষেত্রে, চিত্রটি সম্ভবত যতটা তীক্ষ্ণ হতে পারে, যদি না একটি নতুন মডেল তৈরি করা যায় এবং নির্দিষ্ট "ডট" প্যাটার্নে প্রশিক্ষিত করা যায় যা আপনি আসলটিতে দেখতে পাচ্ছেন। কিন্তু এটি অন্য যেকোন কিছুর চেয়ে বেশি শব্দ কমানো, কারণ ছবির একটি শালীন আকার রয়েছে (2500x2000px কম বা বেশি)।
ইঙ্গিত:আপনার ছবি বড় করার দরকার নেই
এখানে একটি গুরুত্বপূর্ণ পর্যবেক্ষণ। ছবিগুলো বড় করার দরকার নেই। আপনি x1 স্কেলিং ফ্যাক্টর ব্যবহার করে আসল আকার ধরে রাখতে পারেন। অ্যালগরিদমগুলি যতটা সম্ভব অনুপস্থিত তথ্যকে ইন্টারপোলেট করার চেষ্টা করবে। আপনি কোন উন্নতি পান কিনা তা দেখার জন্য এটি একটি ভাল, প্রথম-পাস পদ্ধতি হতে পারে। সময়ও বাঁচায়।

সামগ্রিক ফলাফল, প্রাক-উপসংহার, Nvidia PRIME-এ একপাশে
প্রোগ্রামের সাথে মোটামুটি 50-বিজোড় ইমেজ প্রক্রিয়া করার পরে, মানুষ এবং দৃশ্যাবলী উভয়ই সহ, আমি বেশ কয়েকটি অনুসন্ধানে এসেছি। এর মধ্যে কিছু বিস্ময়করভাবে আসে, অন্যগুলি প্রোগ্রামের প্রায়শই জিজ্ঞাসিত প্রশ্নাবলীতে স্পষ্টভাবে বর্ণিত হয়৷
- অলৌকিক ঘটনা আশা করবেন না। আপনি কিছু উন্নতি পেতে পারেন, কিন্তু এটি আপনার কল্পনা যা করে তা করতে পারে না।
- আপসকেল কম দানাদার, ভাল আলো এবং মাঝারি পরিমাণ বিশদ সহ চিত্রগুলিতে সবচেয়ে ভাল কাজ করে।
- আপনার যদি ইতিমধ্যেই বড়, হাই-রিস, হাই-ডিপিআই ফটোগুলি থাকে যেগুলি কেবল খারাপ, অর্থাৎ ঝাপসা এবং কোলাহলপূর্ণ, তাহলে Upscayl কাজের জন্য সঠিক টুল নয়৷ এটি জিনিসগুলিকে কিছুটা উন্নত করতে পারে, তবে যদি কোনও মডেল অ্যালগরিদম স্মুথিং এবং আনুমানিকতার চেয়ে শব্দের ফ্যাক্টর "বড়" হয়, আপনি কোনও অর্থবহ ফলাফল দেখতে পাবেন না৷
- REAL-ESRGAN ULTRASHARP-এর চেয়ে মসৃণ চিত্র তৈরি করে, তাই উপরে বর্ণিত সীমাবদ্ধতার মধ্যে এটি দানাদার বা আরও অস্পষ্ট চিত্রগুলির জন্য আরও উপযুক্ত। যদিও আপনি এখানে এবং সেখানে কিছু স্বচ্ছতা হারাবেন। সর্বদা একটি ট্রেডঅফ।
তার উপরে, আমি লিনাক্স সেটআপ নিয়ে বেশ সন্তুষ্ট ছিলাম:
- কুবুন্টু 24.04 এর সাথে প্রাথমিক সমস্যা থাকা সত্ত্বেও, এটি এখন স্থির হয়েছে এবং ভাল কাজ করে৷
- ইন্সটলেশনটি সহজ ছিল (স্ন্যাপ এর মাধ্যমে), এবং ব্যবহার সোজা - এবং সত্যিই অফলাইন৷
- প্রোগ্রামটির পরিমিত প্রয়োজনীয়তা রয়েছে - আমার 10 বছর বয়সী ল্যাপটপটি সুন্দরভাবে কাজ করেছে।
- আমার হাইব্রিড গ্রাফিক্স সেটআপ ত্রুটিহীনভাবে কাজ করছিল। Nvidia কার্ডটি PRIME অন-ডিমান্ডের জন্য কনফিগার করা হয়েছে, তাই এটি প্রয়োজনের সময় আরও শক্তিশালী কার্ড ব্যবহার করে, বাকি সময় ব্যাটারি সংরক্ষণের জন্য, এটি সমন্বিত কার্ড ব্যবহার করে। আমি Upscayl চালানোর সময় আচরণ পরীক্ষা করেছিলাম, এবং প্রকৃতপক্ষে, nvidia-smi প্রোগ্রামটি Nvidia GPU এর সাথে চলমান দেখাচ্ছে। অতিরিক্ত গরম করার দরকার নেই।
Nvidia 535 ড্রাইভার, অন-ডিমান্ড সেটআপ, স্বাভাবিক তাপমাত্রা, সত্যিই চমৎকার।
উপসংহার
অধিকাংশ আধুনিক প্রোগ্রাম মেহ. সত্যিই. Upscayl এই আধুনিক মধ্যমতার একটি ব্যতিক্রম। একটি বড় ব্যতিক্রম। এটি একটি সুন্দর, মার্জিত প্রোগ্রাম। চমৎকার GUI, সহজ ব্যবহার, সহজ এবং পরিষ্কার ইনস্টলেশন, সত্যিকারের অফলাইন কাজের মোড, একাধিক মডেল, ভাল পারফরম্যান্স, GPU-এর তুলনায় পরিমিত প্রয়োজনীয়তা, এবং ফলাফল যা নিখুঁত না হলে একেবারেই ঠিক। আমার বইতে, এই সত্যিই একটি চমত্কার ভাল যোগফল. আমার প্রত্যাশার চেয়ে অনেক বেশি।
আপনি যদি ছোট, বিশদ-সহজ ফটো বা ছবি, এমনকি আলো এবং কম পরিমাণে অস্পষ্টতা এবং শব্দের সাথে, আপনি সর্বোত্তম ফলাফল পাবেন। যদি আপনার ফাইলগুলি এই শর্তগুলি পূরণ করে, আপনি Upscayl থেকে একটি খুব আনন্দদায়ক ফলাফল আশা করতে পারেন৷ যদি না হয়, ফলাফল ভাল থেকে হতাশাজনক পরিবর্তিত হবে. শুধু যে সচেতন হতে. এখন, যা বলেছে, এটি সত্যিই একটি চমত্কার ছোট হাতিয়ার এবং পরীক্ষা করার মতো। এর পরে, আমি ImageMagick এবং GIMP ব্যবহার করে ম্যানুয়ালি উপরের সমস্তটি করার চেষ্টা করতে যাচ্ছি। আমি দেখতে চাই যে লিনাক্সে কমান্ড-লাইন টুল ব্যবহার করে হাতে কতটা ফটো উন্নতি এবং আপস্কেলিং করা যায়। এটি আমার পরবর্তী টিউটোরিয়ালের বিষয় হবে। সাথে থাকুন।
চিয়ার্স।