مجموعه داده یا دیتاست (Dataset)، مجموعه ای از کلاس های مختلف عارضه ای است که دارای سیستم مختصات مشترکی هستند. از دیتاست ها برای یکپارچه سازی مکانی یا موضوعی کلاس های مختلف عارضه استفاده می شود.
یک شرکت ممکن است از تحلیل پبشبینیکننده برای پبشبینی فروش سهماهه بعدی براساس دادههای تاریخی استفاده کند. تحلیل تجویزی (Prescriptive Analysis) تحلیل تجویزی پیشرفتهترین نوع تحلیل داده است.
3. DataNumen SQL Recovery. DataNumen SQL Recovery ابزاری قدرتمند و کاربرپسند است که به طور خاص برای تعمیر و بازیابی خراب یا آسیب دیده طراحی شده است SQL Server فایل های پایگاه داده (MDF و NDF). این یک فرآیند ساده برای بازیابی داده های حیاتی و تعمیر ...
کلانداده یا بیگدیتا (Big Data) چیست؟. کلانداده به مجموعهای از دادههای بسیار بزرگ و پیچیده اطلاق میشود که با استفاده از تکنولوژیهای خاص مانند ابزارهای دادهکاوی و ابری مورد تحلیل قرار ...
چرخه عمر پردازش داده چگونه کار می کند؟ چرخه عمر پردازش داده شامل مجموعهای از مراحل است که دادههای خام به عنوان ورودی به سیستم ارائه شده و طی چند مرحله، خروجی تولید میشود.
پیادهسازی و اجرای پروژههای مختلف «یادگیری ماشین» (Machine Learning)، از جمله بهترین تمرینها برای ارتقاء مهارتهای خود در زمینه علم داده است. شروع فعالیت در حوزه علم داده نیازمند آشنایی با داده یا همان Data میباشد.
گفتگوی گروهی: نتیجه گیری. در انواع روشهای نمونهگیری و انتخاب نمونه در تحلیل دادهها، یکی از مراحل اصلی، جمعآوری دادهها است. در این مرحله، نمونهای از جامعه (مجموعهی کلی دادهها ...
داده ها می توانند به شکل متن، مشاهدات، شکل ها، تصاویر، اعداد، نمودارها یا نمادها باشند. برای مثال، دادهها ممکن است شامل قیمت، وزن، آدرس، سن، نام، دما، تاریخ یا مسافت باشد.
مجموعه داده صرفاً یک فایل یا ساختار دیگری است که مقادیر دادهها را در قالب خاصی در خود دارد. یک پایگاه داده ممکن است حاوی دادههای یک یا چند مجموعه داده باشد.
تاریخچه کلان داده. ریشههای کلان داده در دنیا، به طرز شگفتآوری عمیق است. اگرچه ظهور این اصطلاح به حدود سال 2005 برمیگردد، اما تلاش برای مدیریت و استفاده از مجموعهدادههای عظیم، سابقه طولانیتری دارد که به قرن ...
پایگاه داده چیست؟. کلمه « Database » در فارسی به معنی « پایگاه داده » است. برخی آن را در فارسی « دیتابیس » میگویند. در واقع دیتابیس مجموعهای منظم و سازمان یافته از دادههای ذخیره شده و ...
دادهای که توصیفگر و معرف یک مجموعه (بیش از یک) داده است را «فراداده» (Metadata) مینامند و مجموعهای از دادهها را اغلب «مجموعه داده» (Dataset) خطاب میکنند.
اصطلاحات مهم پایگاه داده. داده: حقایق و ارقام یک موضوع خاص اطلاعات: نتایجی که از ترکیب دادهها به دست میآیند. فیلد: کوچکترین جز یک پایگاه داده فیلد نام دارد. رکورد: به مجموعهای از فیلدهای مرتبط به یک موضوع رکورد گویند.
در نتیجه سرعت پردازش مجموعهدادههای حجیم بالاتر رفته و نسبت به دادههای نویزی نیز مقاومتر میشود. ... انتخاب شعاع پنجره یا همان r r r ، ممکن است کمی دشوار باشد و از همین جهت، به عنوان یکی از ...
در علوم رایانه ، یک مجموعه یک نوع داده انتزاعی است که می تواند مقادیر یکتایی را بدون هیچ ترتیب خاصی ذخیره کند. در واقع این نوع داده ، یک پیادهسازی برای مفهوم ریاضی مجموعههای متناهی به زبان ...
هوش مصنوعی. کارگاه. مجموعه دادهها (Dataset) به گروهی از اطلاعات یا نمونهها دادهها گفته میشود که به صورت ساختار یافته یا فاقد ساختار برای تحلیل، استفاده و مدلسازی در زمینههای مختلف ...
کیفیت داده ها، که باید قابل اعتماد، دقیق و سازگار باشد، برای موفقیت آموزش مدل ML بسیار مهم است. به منظور تضمین این برچسب گذاری دقیق و صحیح داده ها، باید تست های QA منظم اجرا شود. ارزیابی دقت این ...
هرچه سازمانها سریعتر قادر به تبدیل این دادههای خام به بینش مفید باشند، میتوانند عملکردشان را سریعتر بهبود دهند. به همین دلیل سرمایهگذاری بر روی تجزیه و تحلیل دادهها در زمانی که به آنها نیاز است، برای هر ...
دیتاست به مجموعهای از دادهها اشاره دارد که با هدف تحلیل، آموزش ماشینی، تحقیق و سایر فعالیتهای مشابه، جمعآوری و سازماندهی شده است.
همهچیز دربارهی علم داده. دیتا ساینس (Data Science) چیست؟. همهچیز دربارهی علم داده. با ورود جهان به عصر کلانداده، نیاز به ذخیرهسازی دادهها نیز افزایش یافت. تا سالها، چالش و دغدغهی اصلی ...
Kaggle (): یک سایت در حوزه «علم داده» (Data Science) و حاوی مجموعه دادههای متنوع و جالب توجهی است که توسط مشارکتکنندگان گوناگون فراهم شدهاند.میتوان انواع مجموعه دادهها را از این قسمت یافت.تنوع این مجموعه دادهها بسیار ...
روشهای دادهکاوی ۱۰۰٪ صحیح نیستند. بنابراین ممکن است در برخی شرایط عواقب بسیار بدی را در پی داشته باشند. کار با برخی سیستمها و روشهای دادهکاوی دشوار و نیازمند دانش قابل توجهی است.
تحلیل متنی یکی از روشهای تجزیه و تحلیل داده برای کشف الگویی در مجموعههای دادههای بزرگ است که با استفاده از پایگاه داده یا ابزارهای داده کاوی انجام میشود.
داده پوشانی یا پوششدهی داده (به انگلیسی: data masking) [۱] [۲] یا مبهمسازی داده (به انگلیسی: data obfuscation) [۳] فرایند پنهان کردن داده اصلی با محتوای اصلاح شده (کاراکترها یا دادههای دیگر) میباشد. دلیل ...
۱. نظرسنجیها و پرسشنامهها: محققان پرسشنامه ها یا نظرسنجیهای ساختار یافتهای را برای جمع آوری داده ها از افراد یا گروهها طراحی میکنند. این موارد را میتوان از طریق مصاحبه حضوری، تماس ...
3.افزایش دادهها (داده) یک مجموعه داده بزرگتر باعث کاهش بیشبرازش میشود. اگر نمیتوانیم دادههای بیشتری جمعآوری کنیم و محدود به دادههایی هستیم که در مجموعه داده فعلی خود داریم، میتوانیم افزایش دادهها را برای ...
14 نوع مختلف نمودار و جدول برای ارائه دادهها. برای درک بهتر هر نمودار و چگونگی استفاده از آنها، در اینجا یک نمای کلی از هر نوع نمودار برای بصری سازی داده ارائه میشود. 1. نمودار ستون (Column Chart) از ...
در بخش های بعد وارد کردن داده ها به طور وسیع تری پوشش داده می شود که خواننده جهت مطالعات دقیق تر و کاربردی باید به این بخش ها (مانند بخش مجموعه ها در نوار کناری دسته بندی) مراجعه نماید. خدمت آن ...
یادگیری ماشین از روشهای متنوع مانند رگرسیون و دستهبندی نظارت شده استفاده میکند. از سوی دیگر، «داده» در علم داده ممکن است شامل فرآیندهای ماشین یا مکانیکی بشود.
انتخاب و آمادهسازی دادههای آموزشی. دادههای آموزشی، مجموعهای از اطلاعات است که مدل یا برنامه یادگیری ماشین برای حل آن مسئله طراحی شده و برای یادگیری روش حل کردن از آن استفاده میکند.