বাংলায় ব্যাসিক ডাটা সায়েন্স শেখার কোর্স
  • ভূমিকা
  • ডাটা কি
  • ডাটা মাইনিং
  • প্রয়োজনীয় সেটআপ
  • গড়, মধ্যক, প্রচুরক
  • নরমাল ডিস্ট্রিবিউশন
  • ভ্যারিয়েন্স ও স্ট্যান্ডার্ড ডেভিয়েশন
    • এর উপকার
    • স্ট্যান্ডার্ডাইজেশন
  • বেশি ডাটা নিয়ে কাজ
    • পপুলেশন ও স্যাম্পল
  • সম্ভাব্যতা
  • পারসেন্টাইল ও মোমেন্ট
  • কো-ভ্যারিয়েন্স ও কো-রিলেশন
  • কন্ডিশনাল প্রোব্যাবিলিটি
  • Bayes থিওরেম
  • লিনিয়ার অ্যালজেবরা
  • মাল্টি-ভ্যারিয়েবল ক্যালকুলাস
  • মডেলিং
    • লিনিয়ার রিগ্রেসন
    • পলিনোমিয়াল রিগ্রেসন
  • ডাটা ভিজুয়ালাইজেশন
Powered by GitBook
On this page
  1. ভ্যারিয়েন্স ও স্ট্যান্ডার্ড ডেভিয়েশন

স্ট্যান্ডার্ডাইজেশন

Previousএর উপকারNextবেশি ডাটা নিয়ে কাজ

Last updated 6 years ago

একটি এলিমেন্ট আলোচ্য নর্মাল ডিস্ট্রিবিউশনের গড় মান থেকে কত একক স্ট্যান্ডার্ড ডেভিয়েশন দূরত্বে অবস্থান করে সেই ভ্যালুকে উক্ত এলিমেন্টের স্ট্যান্ডার্ড স্কোর, সিগমা বা z-score বলে। এভাবে একটি ডাটাকে z-score এ কনভার্ট করাকেই স্ট্যান্ডার্ডাইজেশন বলে।

সূত্র, z-score = (যে ভ্যালুর স্ট্যান্ডার্ডাইজেশন করতে হবে - গড়)/ স্ট্যান্ডার্ড ডেভিয়েশন

এটা করার ফলে বিশেষ কিছু সময়ে সুবিধা পাওয়া যায়। যেমন উদাহরণ সরূপ - একজন শিক্ষক ১১ জন ছাত্রের পরীক্ষা নিলেন ৬০ নম্বরের মধ্যে। পাশ মার্ক বলে দিলেন ৩০। কিন্তু পরীক্ষা এতোই কঠিন হল যে ১০ জন ছাত্রই ৩০ এর চেয়ে কম মার্ক পেল। এখন সবাইকে তো আর ফেইল করে দেয়া যায় না। তাই তিনি ঠিক করলেন মার্কস গুলোকে স্ট্যান্ডার্ডাইজ করবেন এবং যারা ১ একক স্ট্যান্ডার্ড ডেভিয়েশনের নিচে মার্ক পেয়েছে শুধু তাদেরকে ফেইল করে দিবেন। এতে করে তিনি শতকরা ৬৮% ভালো ছাত্র বেছে নিতে পারছেন।

mean বের করে ফেলি,

marks = np.array([20, 15, 26, 32, 18, 28, 35, 14, 26, 22, 17])
np.mean(marks)
23.0

স্ট্যান্ডার্ড ডেভিয়েশন

np.std(marks)
6.6332495807107996

প্রথম ছাত্রের

অতএব, সূত্র অনুযায়ী উপরের মার্কস গুলোর স্ট্যান্ডার্ড স্কোর যথাক্রমে, -0.45, -1.21(fail), 0.45, 1.36, -0.76, 0.76, 1.82, -1.36(fail), 0.45, -0.15, -0.91

অর্থাৎ শুধুমাত্র 15 এবং 14 মার্ক পাওয়া ছাত্র দুজনকে ফেইল করে দিতে পারেন তিনি।

$z-score = \frac{(20-23)}{6.6} = -0.45 $