কম্পিউটার

পাইথনে মিডিয়া ফাইলগুলির মাধ্যমে কীভাবে স্ক্র্যাপ করবেন?


পরিচয়

একটি বাস্তব বিশ্বের কর্পোরেট ব্যবসার সেটিংয়ে, বেশিরভাগ ডেটা পাঠ্য বা এক্সেল ফাইলগুলিতে সংরক্ষণ করা যাবে না। এসকিউএল-ভিত্তিক রিলেশনাল ডাটাবেস যেমন ওরাকল, এসকিউএল সার্ভার, পোস্টগ্রেএসকিউএল, এবং মাইএসকিউএল ব্যাপকভাবে ব্যবহৃত হয় এবং অনেক বিকল্প ডেটাবেস বেশ জনপ্রিয় হয়ে উঠেছে।

ডেটাবেসের পছন্দ সাধারণত একটি অ্যাপ্লিকেশনের কর্মক্ষমতা, ডেটা অখণ্ডতা এবং স্কেলেবিলিটি চাহিদার উপর নির্ভর করে৷

কিভাবে করতে হবে..

এই উদাহরণে আমরা দেখব কিভাবে একটি sqlite3 ডাটাবেস তৈরি করা যায়। sqllite ডিফল্টভাবে পাইথন ইনস্টলেশনের সাথে ইনস্টল করা হয় এবং এর জন্য আর কোন ইনস্টলেশনের প্রয়োজন হয় না। আপনি অনিশ্চিত হলে নিচে চেষ্টা করুন. আমরা পান্ডাও আমদানি করব৷

এসকিউএল থেকে ডেটাফ্রেমে ডেটা লোড করা মোটামুটি সহজ, এবং প্রক্রিয়াটিকে সহজ করার জন্য পান্ডাসের কিছু ফাংশন রয়েছে৷

pdprint (f"আউটপুট \n {sqlite3.version}") হিসাবে sqlite3import পান্ডা আমদানি করুন

আউটপুট

2.6.0

আউটপুট

# সংযোগ objectconn =sqlite3.connect("example.db")# গ্রাহক ডেটাকাস্টমার =pd.DataFrame({"customerID" :["a1", "b1", "c1", "d1"], "firstName " :["Person1", "Person2", "Person3", "Person4"], "state" :["VIC", "NSW", "QLD", "WA"]})প্রিন্ট(f"আউটপুট \n *** গ্রাহকদের তথ্য -\n {গ্রাহক}")

আউটপুট

*** গ্রাহকদের তথ্য -customerID firstName state0 a1 Person1 VIC1 b1 Person2 NSW2 c1 Person3 QLD3 d1 Person4 WA
# অর্ডার ডেটাঅর্ডার =pd.DataFrame({"customerID" :["a1", "a1", "a1", "d1", "c1", "c1"], "productName" :["রোড বাইক ", "মাউন্টেন বাইক", "হেলমেট", "গ্লোভস", "রোড বাইক", "চশমা"]})প্রিন্ট(f"আউটপুট \n *** অর্ডারের তথ্য -\n {orders}")

আউটপুট

**** অর্ডারের তথ্য -customerID productName0 a1 রোড বাইক1 a1 মাউন্টেন বাইক2 a1 হেলমেট3 d1 গ্লাভস4 c1 রোড বাইক5 c1 চশমা
# লিখুন dbcustomers.to_sql("customers", con=conn, if_exists="replace", index=False)orders.to_sql("orders", conn, if_exists="replace", index=False) 

আউটপুট

# ডেটা আনতে একটি sql ফ্রেম করুন। 

আউটপুট

# চালান sql.pd.read_sql_query(q, con=conn)

উদাহরণ

7.এটি সব একসাথে রাখা।

pdprint(f"Output \n {sqlite3.version}") হিসেবে
sqlite3import পান্ডা আমদানি করুন a1", "b1", "c1", "d1"], "firstName" :["Person1", "Person2", "Person3", "Person4"], "state" :["VIC", "NSW" , "QLD", "WA"]})প্রিন্ট(f"*** গ্রাহকদের তথ্য -\n {গ্রাহক}")# অর্ডার ডেটাঅর্ডার =pd. ডেটাফ্রেম({"customerID" :["a1", "a1", "a1", "d1", "c1", "c1"], "productName" :["রোড বাইক", "মাউন্টেন বাইক", "হেলমেট", "গ্লাভস", "রোড বাইক", "চশমা"]} )print(f"*** অর্ডারের তথ্য -\n {orders}")# dbcustomers.to_sql("customers", con=conn, if_exists="replace", index=False)orders.to_sql("orders) এ লিখুন ", conn, if_exists="replace", index=False)# ডেটা আনার জন্য একটি sql ফ্রেম করুন। customers.customerIDgroup by customers.firstName;"""# চালান sql.pd.read_sql_query(q, con=conn)

আউটপুট

2.6.0*** গ্রাহকদের তথ্য -customerID firstName state0 a1 Person1 VIC1 b1 Person2 NSW2 c1 Person3 QLD3 d1 Person4 WA*** অর্ডারের তথ্য -customerID productName0 a1 রোড বাইক1 a1 মাউন্টেন বাইক2 a1 হেলমেট3 d1 কাচের কাচ প্রথম নাম পণ্যের পরিমাণ____________________________________0 a1 Person1 31 c1 Person3 22 d1 Person4 1 

  1. পাইথন - কিভাবে একটি ফোল্ডারে সমস্ত এক্সেল ফাইল মার্জ করবেন

  2. কিভাবে Python এ PDF ফাইল ক্র্যাক করবেন?

  3. পাইথন ব্যবহার করে পাওয়ারপয়েন্ট ফাইল কিভাবে তৈরি করবেন

  4. পাইথনে ইনস্টল করা মডিউল কীভাবে মুছবেন?