বাংলায় ব্যাসিক ডাটা সায়েন্স শেখার কোর্স
  • ভূমিকা
  • ডাটা কি
  • ডাটা মাইনিং
  • প্রয়োজনীয় সেটআপ
  • গড়, মধ্যক, প্রচুরক
  • নরমাল ডিস্ট্রিবিউশন
  • ভ্যারিয়েন্স ও স্ট্যান্ডার্ড ডেভিয়েশন
    • এর উপকার
    • স্ট্যান্ডার্ডাইজেশন
  • বেশি ডাটা নিয়ে কাজ
    • পপুলেশন ও স্যাম্পল
  • সম্ভাব্যতা
  • পারসেন্টাইল ও মোমেন্ট
  • কো-ভ্যারিয়েন্স ও কো-রিলেশন
  • কন্ডিশনাল প্রোব্যাবিলিটি
  • Bayes থিওরেম
  • লিনিয়ার অ্যালজেবরা
  • মাল্টি-ভ্যারিয়েবল ক্যালকুলাস
  • মডেলিং
    • লিনিয়ার রিগ্রেসন
    • পলিনোমিয়াল রিগ্রেসন
  • ডাটা ভিজুয়ালাইজেশন
Powered by GitBook
On this page
  1. ভ্যারিয়েন্স ও স্ট্যান্ডার্ড ডেভিয়েশন

এর উপকার

Previousভ্যারিয়েন্স ও স্ট্যান্ডার্ড ডেভিয়েশনNextস্ট্যান্ডার্ডাইজেশন

Last updated 6 years ago

নরমালি ডিস্ট্রিবিউটেড ডাটার ক্ষেত্রে এর স্ট্যান্ডার্ড ডেভিয়েশন জানা হয়ে গেলে ওই ডাটা গুলো সম্পর্কে কিছু অনুসিদ্ধান্ত পাওয়া যায়। যেমন

  • ৬৮% ডাটা গড় ভ্যালু তথা মধ্য লাইন থেকে দুই পাশে ১ একক পরিমাণ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে

  • ৯৫% ডাটা গড় ভ্যালু তথা মধ্য লাইন থেকে দুই পাশে ২ একক পরিমাণ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে

  • ৯৯% ডাটা গড় ভ্যালু তথা মধ্য লাইন থেকে দুই পাশে ৩ একক পরিমাণ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকে

অর্থাৎ, আমরা যদি উপরের sizes অ্যারে থেকে শতকরা ৯৫% ডাটা নিয়ে কাজ করতে চাই অথবা শতকরা ৯৫% ডাটাকে গ্রহণযোগ্য ডাটা মনে করে থাকি তাহলে কোন কোন ডাটা আমরা নেব এবং কোন গুলো ফেলে দেব সেটা খুব সহজেই জানতে পারি। অনুসিদ্ধান্ত থেকে আমরা জানি গড় মান থেকে ডান এবং বাম পাশে ২ একক পরিমাণ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যেই এই পরিমাণ ডাটা থাকার কথা।

একে Probability Distribution ও বলা হয়ে থাকে

এখন গড় মান থেকে আমরা প্রত্যেকটি এলিমেন্ট এর দূরত্ব হিসাব করে দেখবো স্ট্যান্ডার্ড ডেভিয়েশন এককে। যেগুলো সামনে ও পেছনে ২ একক পরিমাণ স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকবে শুধু সেগুলোকেই নেব। উদাহরণ সরূপ,

গড় 11.19 স্ট্যান্ডার্ড ডেভিয়েশন 3.91 অ্যারের প্রথম এলিমেন্ট 9 যেহেতু 9 গড় মানের বাম দিকে অবস্থান করে তাই গড় থেকে স্ট্যান্ডার্ড ডেভিয়েশন বিয়োগ করে এর অবস্থান চেক করে দেখবো, গড় - ২ একক স্ট্যান্ডার্ড ডেভিয়েশন = 11.19 - (2 * 3.91) = 4.08 অর্থাৎ 9 এর অবস্থান ২ একক স্ট্যান্ডার্ড ডেভিয়েশন মধ্যেই আছে। এই এলিমেন্টকে আমরা গ্রহণ করবো

গড় 11.19 স্ট্যান্ডার্ড ডেভিয়েশন 3.91 অ্যারের আরেকটি এলিমেন্ট 16 যেহেতু 16 গড় মানের ডান দিকে অবস্থান করে তাই গড় থেকে স্ট্যান্ডার্ড ডেভিয়েশন যোগ করে এর অবস্থান চেক করে দেখবো, গড় + ২ একক স্ট্যান্ডার্ড ডেভিয়েশন = 11.19 + (2 * 3.91) = 19.72 অর্থাৎ 16 এর অবস্থান ডান দিকে ২ একক স্ট্যান্ডার্ড ডেভিয়েশন মধ্যেই আছে। এই এলিমেন্টকেও আমরা গ্রহণ করবো

গড় 11.19 স্ট্যান্ডার্ড ডেভিয়েশন 3.91 অ্যারের আরেকটি এলিমেন্ট 1 যেহেতু 16 গড় মানের বাম দিকে অবস্থান করে তাই গড় থেকে স্ট্যান্ডার্ড ডেভিয়েশন বিয়োগ করে এর অবস্থান চেক করে দেখবো, গড় - ২ একক স্ট্যান্ডার্ড ডেভিয়েশন = 11.19 - (2 * 3.91) = 4.08 অর্থাৎ 1 এর অবস্থান বাম দিকে ২ একক স্ট্যান্ডার্ড ডেভিয়েশনেরও বাইরে (বামে)। তাই এই এলিমেন্টকে আমরা গ্রহণ করবো না কারন এটা আমাদের পছন্দের শতকরা ৯৫ ভাগ স্বাভাবিক ডাটা-র মধ্যেও পরে না।

একই ভাবে 20 ও বাদ পরে যাবে কারন এটি বেল কার্ভের অতিরিক্ত ডান দিকে অবস্থান করছে।

sd