شکل۲-۳: دو خط جداساز با حاشیههای مختلف…………………………………………………………….۲۳
شکل۲-۴: افزایش صحت مدل با استفاده از Bagging…………………………………………………..25
شکل۲-۵: شبهکد الگوریتم Bagging………………………………………………………………………..26
شکل۲-۶: شبهکد الگوریتم AdaBoost……………………………………………………………………..28
شکل۳-۱: شبهکد الگوریتم EasyEnsemble…………………………………………………………….36
شکل۳-۲: شبهکد الگوریتم ModifiedBagging………………………………………………………37
شکل۳-۳: (a) kتا از نزدیکترین همسایههای xi با فرض k=6
(b) تولید داده براساس فاصلهی اقلیدسی…………………………………………………………۳۸
شکل۳-۴: ماتریس هزینهی چندردهای………………………………………………………………………….۴۰
شکل۴-۱: توزیع دادهها براساس نوع بیماری تنفسی…………………………………………………………۵۲
شکل۴-۲: توزیع دادهها براساس سن…………………………………………………………………………….۵۲
شکل۴-۳: نمونهبرداری طبقهبندی شده…………………………………………………………………………۶۸
شکل۵-۱: مقایسهی الگوریتمهای پایه (حاصل اعمال مدل روی مجموعهی آزمون)………………۷۱
شکل۵-۲: مقایسهی کارایی الگوریتمها در تشخیص ردههای مختلف…………………………………۷۲
شکل۵-۳: مقایسهی الگوریتمهای پایه (حاصل اعمال مدل روی مجموعهی آموزش)…………….۷۳
شکل۵-۴: مقایسهی نتایج حاصل از روشهای یادگیری در دادههای نامتوازن روی مجموعهی آزمون…………………………………………………………………………………………………………………….۷۵
شکل۵-۵: مقایسهی حساسیت روشهای یادگیری در دادههای نامتوازن روی مجموعهی آزمون به تفکیک ردهها……………………………………………………………………………………………………….۷۶
شکل۵-۶: مقایسهی دقت روشهای یادگیری در دادههای نامتوازن روی مجموعهی آزمون به تفکیک ردهها…………………………………………………………………………………………………………۷۶
شکل۵-۷: مقایسهی معیارF روشهای یادگیری در دادههای نامتوازن روی مجموعهی آزمون به تفکیک ردهها………………………………………………………………………………………………………….۷۸
فهرست نشانهها و اختصارها (Abreviations)
World Health Organization (WHO)
Magnetic Resonance Imaging (MRI)
Customer Relationship Management (CRM)
Chi-squared Automatic Interaction Detector (CHAID)
Iterative Dichotomiser3 (ID3)
Traditional Chinese Medicine (TCM)
Synthetic Minority Oversampling Technique (SMOTE)
White Blood Cell (WBC)
Red Blood Cell (RBC)
Hemoglobin (Hb)
Mean Corpuscular Volume (MCV)
Mean Corpuscular Hemoglobin (MCH)
Mean Corpuscular Hemoglobin Concentration (MCHC)
C-Reactive Protein (CRP)
Erytherocyte Sedimentation Rate (ESR)
فصل۱: مقدمه
۱-۱٫ موضوع تحقیق
بیماری تنفسی[۱] که عموما در ارتباط با بیماری ریوی[۲] است، شامل گروهی از بیماریها هستند که از طریق درگیر کردن بخش یا قسمتهایی از دستگاه تنفس[۳] باعث اختلال در عملکرد ریه[۴]ها میگردند. ریهها مهمترین قسمت دستگاه تنفسی هستند که در عمل تبادل گازهای تنفسی جهت تامین اکسیژن بافتهای مختلف بدن و دفع دیاکسیدکربن نقش دارند. بیماریهای ریوی در هر سال بسیاری از افراد جامعه را مبتلا میکنند که باعث کاهش سطح عملکرد فرد در فعالیتهای روزمره میگردند. بیماریهای دستگاه تنفسی در انگلستان شایعترین عامل مراجعه به پزشکان عمومی است[۱]. میزان اختلال در عملکرد تنفس در یک بیماری ریوی به نوع بیماری و وسعت آسیب وارده بستگی دارد. بیماریهای ریوی میتوانند عفونت دستگاه تنفسی فوقانی[۵]، پنومونی[۶] و یا بیماری مزمن انسدادی ریه[۷] باشند.
بیماریهای مزمن تنفسی از ۱۰ مورد بیماریهای تهدید کننده حیات در جهان هستند[۸]. مطابق آمار سازمان بهداشت جهانی[۹]، صدها میلیون نفر از جمعیت جهان از بیماریهای مزمن تنفسی رنج میبرند. پیشبینی میشود تا سال ۲۰۳۰ میلادی به سومین عامل مرگومیر در جهان بعد از بیماریهای قلبیوعروقی و سرطانها تبدیل گردد[۱]. فاکتور اصلی ما در این روند، تشخیص سریع و صحیح این بیماری در همان ابتدای روزهای بستری است.
تکنیکهای دادهکاوی[۱۰] علاوه بر اینکه میتوانند در تشخیص سریع این بیماریها موثر باشند، میتوانند از طریق شناسایی عوامل موثر در بروز انواع بیماریهای تنفسی، به پیشگیری از این بیماریها کمک کنند و به این ترتیب باعث ارتقای سلامت جامعه شده و از تحمیل هزینههای سنگین ناشی از تشخیص نادرست، بر بیماران جلوگیری کنند.
۱-۲٫ اهمیت و ضرورت تحقیق
بیماریهای مزمن تنفسی از ۱۰ مورد بیماریهای تهدید کننده حیات در جهان هستند و پیشبینی میشود تا سال ۲۰۳۰ میلادی به سومین عامل مرگومیر در جهان بعد از بیماریهای قلبیوعروقی و سرطانها تبدیل گردد. گرچه، گسترش تکنولوژیهای پزشکی در دهه گذشته، موجب کاهش میزان مرگومیر ناشی از این بیماری شده است و بهدلیل تشخیص زودهنگام و درمان بهینه، میزان بهبودی افزایش یافته است. اما میزان بهبودی بیماران در این نوع بیماریها بستگی به نوع بیماری و وسعت آسیب وارده به دستگاه تنفسی دارد[۱۱]. تشخیص زودهنگام نیز به یک روش تشخیص صحیح و قابل اعتماد نیاز دارد که به پزشکان اجازه میدهد که عفونت دستگاه تنفسی فوقانی، پنومونی و بیماری مزمن انسدادی ریه را از هم شناسایی کنند. بنابراین یافتن یک متد تشخیص صحیح و موثر و همچنین عوامل خطر در بروز این بیماری، بسیار بااهمیت است.

دانلود متن کامل پایان نامه در سایت jemo.ir موجود است