ডেটা স্মুথিং সংজ্ঞা এবং উদাহরণ।
ये कà¥?या है जानकार आपके à¤à¥€ पसीने छà¥?ट ज
সুচিপত্র:
এটি কী:
ডেটা মসৃণকরণ একটি স্ট্যাটিস্টিকাল টেকনিক যা একটি ডাটা সেট থেকে আউটলেয়ারগুলি অপসারণ করতে হয় যাতে একটি প্যাটার্ন আরো দৃশ্যমান।
কিভাবে এটি কাজ করে (উদাহরণ):
উদাহরণস্বরূপ, আসুন আমরা বলতে পারি যে গত 10 বছর ধরে একটি বিশ্ববিদ্যালয় তার অপরাধের তথ্য বিশ্লেষণ করছে। সহিংস অপরাধের সংখ্যা এইরকম কিছু দেখায়:
আপনি দেখতে পাচ্ছেন যে, বিশ্ববিদ্যালয়ের অভিজ্ঞতা প্রায় 15 বছরের কম অপরাধ করে। যাইহোক, ২006 এবং ২007 সালে এটি বিশ্ববিদ্যালয়ের পাবলিক সিকিউরিটি টিম কর্তৃক পরীক্ষামূলক রিপোর্টিংয়ের প্রয়োজনীয়তার কারণে 44 এর অভিজ্ঞতা অর্জন করে। প্রতিবেদনের পরীক্ষা হিংসাত্মক অপরাধের সংজ্ঞা পরিবর্তিত যে কোনও বছর এর যে কোনো ধরনের চুরি অন্তর্ভুক্ত করা, যা ক্যাম্পাসে "হিংস্র" অপরাধের সংখ্যা একটি বড় লাফ তৈরি করে। যদি আমরা এই বছরগুলি গড়তে অন্তর্ভুক্ত করি - যে, আমরা কিছু তথ্যকে মসৃণ করে ফেলি - বিশ্ববিদ্যালয়ের একটি গড় 19 টি সহিংস অপরাধের ঘটনা এক বছর। কিন্তু যদি আমরা সেই বছরগুলো ছেড়ে দিই, তবে আমরা দেখতে পারি যে, বছরে 13 টি সহিংস অপরাধের হার বেশি - একটি 32% পার্থক্য।
কেন এটি গুরুত্বপূর্ণ:
তথ্য মসৃণ করার অনেক উপায় আছে, গড় এবং অ্যালগরিদম ধারণাটি হচ্ছে যে তথ্যটি মসৃণকরণ নকশার আরও দৃশ্যমান করে এবং এইভাবে স্টক মূল্যের পরিবর্তন, গ্রাহক প্রবণতা বা ব্যবসা সংক্রান্ত তথ্য অন্য কোনও অংশে পূর্বাভাস দেয়। যাইহোক, তথ্য চটকানি বড় তথ্য উপেক্ষা বা গুরুত্বপূর্ণ ঘটনা কম দৃশ্যমান করতে পারেন; অন্য কথায়, "ডাটা প্রিন্ট বন্ধ করা" কিছু তথ্য নির্দিষ্ট করে দিতে পারে এবং অন্যান্য ডেটা অবহেলা করতে পারে।