پایان نامه ارشد رایگان درمورد داده کاوی، دسته بندی، خوشه بندی

کمی: منافع مالی هستند که کاملا قابل اندازه گیری بوده و به استفاده از یک فناوری به خصوص نسبت داده می‌شود. برای مثال استفاده از فناوری در ارائه الکترونیکی دعاوی پزشکی منجر به صرفه‌جویی در زمان و کاهش هزینه نیروی انسانی می‌شود.
2.منافع کیفی: داده‌های صحیح و دقیق، ارسال سریع داده‌ها، افزایش قابلیت دسترسی و ارتباط بین اجزاء مختلف داده‌ها مزایایی هستند که به سادگی قابل اندازه‌گیری نیستند.
3. منافع استراتژیک: در دراز مدت بر سازمانهای بهداشتی و درمانی مهم و اساسی هستند. جمع‌آوری و تحلیل داده ها مزیت ویژه‌ای برای سازمان محسوب می‌شوند که در طولانی‌مدت پایه و اساس برنامه‌ریزی استراتژیک و تحقیقات بهداشتی و پزشکی می باشند .[15]
مزایای كاربرد فن‌آوری اطلاعات در حوزه‌های سیستم بهداشتی و درمانی: كاربرد فن‌آوری اطلاعات در حوزه‌های سیستم بهداشتی و درمانی برای بیماران، پرسنل بهداشتی درمانی، و مدیران دارای مزایای زیر می‌باشد
بیماران: برای بیماران، فناوری ارتباطات و اطلاعات تأثیرات مستقیم و قابل رویتی در نحوه تعامل آنها با سیستم بهداشتی درمانی و تجربه آنها به عنوان مشتریان خدمات بهداشتی درمانی دارد. بر این اساس، سوابق مربوط به بیمار همیشه و بسرعت در دسترس کارکنان قرار خواهد گرفت و کیفیت سوابق تغییری نخواهد کرد، در عوض بیماران نیز با مشاهده سیستمهای فناوری ارتباطات و اطلاعات با کیفیت بالا، به کارکنان مطمئن‌تر می‌شوند .
پرسنل بهداشتی درمانی: پرسنل بهداشتی درمانی سیستم‌های جدید، سریع، و ایمن فناوری ارتباطات و اطلاعات را در اختیار خواهند داشت تا از کار روزمره آنان پشتیبانی کنند. بدین ترتیب آنان قادر خواهند بود پیشینه بیمار مورد نظر را بازبینی و طرحهای مراقبت از وی را برنامه‌ریزی، داروها را تجویز، آزمایشها را بررسی و نتایج آن را سریعاً و به راحتی مشاهده کنند.
مدیران بهداشتی درمانی: تأمین داده‌های صحیح و معتبر (مالی و بالینی)، تعیین نیروی کار بهتر، و اداره منابع راحتتر می‌شود. نظارت بالینی افزایش می‌یابد و سطح کیفیت مراقبت از بیماران ارتقاء می‌یابد. سلامت عمومی، طرح‌ریزی خدمات برای مردم، و نیز عملیات آماری و تحلیلی بر اساس داده‌های با کیفیت بهتر خواهد بود .[29][35][37]
داده کاوی
بکارگیری فناوری اطلاعات در انجام امور روزمره باعث شده است تا حجم زیادی از داده های مربوط به مبادلات تجاری ، داده های پزشکی ، داده های صنعتی و … ایجاد شوند. داده کاوی فرایندی است که توسط آن می توان از داده های موجود اطلاعات و دانش مفیدی را کشف کرد که بطور معمول در این داده های مخفی هستند و برای ما قابل درک نیستند. ﻫﺪف اﺻﻠﻲ داده ﻛﺎوي ﻛﺸﻒ اﻃﻼﻋﺎﺗﻲ اﺳﺖ ﻛﻪ ﺗﺎ ﻛﻨﻮن دﻳﺪه ﻧﺸﺪه و ﻣﺨﻔﻲ ﺑﻮدهاند .
داده کاوی یک علم میان رشته ای نسبتا جدید می باشد. که شامل رشته هایی همچون آمار ، یادگیری ماشین و علوم کامپیوتر می باشد. مهم ترین این رشته ها آمار می باشد و بدون آمار، اساساً داده کاوی وجود نخواهد داشت به طوری که اساس اکثر تکنیک هایی می باشد که داده کاوی بر روی آنها بنا شده است. آمار کلاسیک مفاهیمی همچون تحلیل رگرسیون، توزیع استاندارد، انحراف معیار، واریانس، تحلیل خوشه ای و فاصله های اطمینان را که برای مطالعه داده و روابط بین داده ها نیاز می باشد را در بر می گیرد.
برای داده کاوی تعاریف گوناگونی بیان شده است که در زیر به برخی از این تعاریف اشاره
شده است[38-39-40] :
داده کاوی یک فرآینده شناخت الگوهای معتبر، جدید، ذاتاً مفید و قابل فهم از داده ها
می باشد.
داده کاوی به فرآیند استخراج اطلاعات نهفته، قابل فهم، قابل پیگیری از پایگاه داده های بزرگ و استفاده از آن در تصمیم گیریهای تجاری مهم، اطلاق می شود.
داده کاوی، مجموعه ای از روش ها در فرآیند کشف دانش می باشد که برای تشخیص
الگوها و روابط نامعلوم در داده های مورد استفاده قرار می گیرد.
فرآیند کشف الگوهای مفید از داده ها را داده کاوی می گویند.
فرایند انتخاب، کاوش و مدل بندی داده های حجیم، جهت کشف روابط نهفته با هدف به دست آوردن نتایج واضح و مفید، برای مالک پایگاه داده ها را ، داده کاوی گویند.
مراحل داده کاوی
به طور کلی، داده کاوی به استخراج دانش از پایگاه های بزرگ داده ها اشاره دارد و یک رشته علمی جدید می باشد که امروزه کاربردهای متنوع و گسترده ای در رشته هایی مثل بازرگانی، پزشکی، مهندسی، علوم کامپیوتر، صنعت، کنترل کیفیت، ارتباطات، کشاورزی و … پیدا کرده است. در پژوهش های مربوط به داده کاوی، دو تعبیر مختلف از داده کاوی وجود دارد. برخی پژوهشگران [40]، داده کاوی را مترادف عبارت کشف دانش و معرفت از پایگاه داده می دانند و برخی دیگر از جمله Fayyad [38] به داده کاوی به عنوان یک مرحله ضروری از فرآیند بزرگتر کشف دانش از پایگاه داده ها که به اختصارKDD می گویند اشاره دارند. KDD شامل مراحل زیر است:
1- پاكسازی داده ها: حذف داده های ناپایدار و مزاحم.
2- يکپارچه سازی داده ها : ترکیب منابع متعدد، پراکنده و احیاناً ناهمگن داده ها.
3-انتخاب داده ها : بازیابی داده های مربوط به عمل کاوش از پایگاه دادها.
4- تبديل داده ها : تبدیل داده ها به اشکالی مناسب برای به کار بردن روش های مختلف.
5- داده كاوی : مرحله ضروری از فرآیند KDD است که در آن از روش های مختلف آماری و یادگیری ماشین برای استخراج الگوها استفاده می شود، که شامل مراحل زیر است:
الف- انتخاب استراتژی داده کاوی : رده بندی، خوشه بندی، پیش بینی، تعیین وابستگی.
ب- انتخاب روش داده کاوی : شبکه های عصبی، درخت تصمیم، ماشین های بردار پشتیبان، تقویت کننده تطبیقی، توابع پیش بینی کننده خطی و غیر خطی.
ج- داده کاوی و جستجو برای یافتن الگوی مناسب.
6- ارزيابی الگوها شناسایی الگوهای جذاب ارائه دانش، براساس معیارهای جذابیت.
7- ارائه دانش ارائه دانش استخراج شده با استفاده از تکنیک های نمایش اطلاعات.
شکل 3-1 مراحل داده کاوی: 1.پاکسازی دادهها 2.یکپارچه سازی دادهها 3.انتخاب دادهها 4. تبدیل دادهها 5.تبدیل دادهها[40]
در دیدگاه دیگر، داده کاوی به عنوان مجموعه ای از فرآیندها که از تعریف اهداف تا ارزیابی
نتایج را در بر می گیرد، معرفی شده است. مراحل مختلف داده کاوی عبارتند از:
الف- تعریف اهداف تحلیل
ب- انتخاب و سازماندهی داده ها
پ- تحلیل کاوشگرانه داده ها و انجام تبدیلات
ت- مشخص کردن روش های آماری مورداستفاده در مرحله تحلیل
ج- تحیلی داده ها بر اساس روش انتخابی
چ- ارزیابی و مقایسه روش های مورداستفاده و انتخاب مدل نهایی برای تحلیل
ح- تفسیر مدل حاصل و استفاده از آن در فرآیند تصمیم گیری.
پیش پردازش داده ها
کیفیت داده ها در استخراج نتایج مطلوب و اطلاعات حقیقی بسیار موثر هستند. پایگاه داده های بزرگ شامل داده های مزاحم، گمشده و ناایستا هستند. به همین جهت برای ارتقاء کیفیت داده ها، لازم است داده ها به صورت مراحل زیر پیش پردازش شوند:
پاکسازی داده ها
برای انجام یک داده کاوی مطلوب لازم است مقادیر گمشده جایگزین شوند، دادههای مزاحم شناسایی و به نحو مناسب با آنها برخورد و نا ایستایی ها اصلاح شوند.
الف- مقادير گمشده: داده هایی هستند که به هر دلیلی در هنگام تحلیل داده ها در اختیار تحلیلگر قرار ندارند. در مورد مقادیر گمشده در داده ها بایستی به گونه ای مناسب تصمیم گیری شود به عنوان مثال ممکن است رکورد مربوطه حذف یا به جای آن یک مقدار ثابت، میانگین مقادیر صفت مورد نظر، میانگین نمونههای مشابه یا محتمل ترین مقدار جایگزین گردد. این جایگذاری ممکن است با استفاده از رگرسیون یا سایر روش های مدلسازی انجام شود.
ب- داده های مزاحم: انحرافی تصادفی یا غیرتصادفی در یک متغیر اندازه گیری شده هستند، که به عنوان مثال می توانند نتیجه خطای اندازه گیری یا یک اثر پنهان باشند و باید علت وجود یک داده مزاحم به خوبی بررسی و در مورد آن تصمیم گیری شود. خوشه بندی و برازش یک تابع رگرسیونی به داده ها از جمله راه های هموارسازی داده ها هستند.
ج- داده های ناپايدار: این گونه داده ها شامل تغییراتی بی قاعده هستند که تحلیل آنها را دچار مشکل می سازد. برخی از انواع این داده ها را می توان با تبدیل مناسب اصلاح کرد.
یکپارچه سازی داده ها
با توجه به اینکه دادهها از منابع مختلف جمع آوری می شوند، ممکن است دارای ناسازگاری هایی مانند تفاوت در مقیاس باشند یا خصیصههای مختلف به گونه ای با یکدیگر مرتبط باشند که برخی از آنها بر حسب تعدادی دیگر قابل حصول باشند. در این گونه موارد لازم است داده ها به گونه ای یکپارچه شوند که حتی الامکان دارای کمترین تفاوت باشند و از ورود خصائص مشابه یا تکراری در تحلیل داده ها پرهیز شود. برخی از خصائص زائد را می توان از طریق تحلیل همبستگی کشف کرد. همبستگی بین دو متغیر به این معنی است که می توان اطلاعات یکی را از دیگری به دست آورد و بنابراین حضور هر دوی این خصیصه ها لزومی ندارد.
تبدیل دادهها
گاهی برای خلاصه سازی یا بکارگیری روش های تحلیل داده ها، لازم است به یکی از روش های زیر، داده ها به شکلی مناسب تبدیل شوند:
الف- هموارسازی : برای حذف افت و خیز شدید در داده ها از تکنیک های هموارسازی مانند خوشه بندی و رگرسیون استفاده می شود.
ب-انبوهش: نوعی خالصه سازی است که با عملیات جبری بر روی برخی مقادیر و به دست آوردن مقادیر کلی تر اجرا می شوند. به عنوان مثال مقادیر فروش روزانه می توانند به صورت مقادیر ماهانه یا سالانه انباشته شوند.
ج- تعمیم داده ها :با استفاده از سلسله مراتب مفاهیم، داده های ابتدایی یا سطح پایین مانند سن بوسیله مفاهیم سطح بالاتر مانند جوان، میانسال و کهنسال جایگزین می شوند.
د- نرمال سازی داده ها :داده ها به یک نحوی مقیاس بندی می شوند که در داخل یک محدوده مشخص و کوچک قرار گیرند.
تلخیص داده ها
برای کاهش دادهها از تکنیک هایی مانند کاهش بعد، فشرده سازی و مجزاسازی داده استفاده می شود .
وظایف داده کاوی
داده کاوی با همه عظمت و بزرگی خود که امروزه در تمامی موضوعات جهان ورود پیدا کرده است شامل شش عمل و وظیفه مهم است که میتوان بسیاری از مسائل محیط اطراف خود را در قالب یکی از این شش عمل و وظیفه زیر گنجاند [5] :
دسته بندی
تخمین
پیش بینی
گروه بندی شباهت
خوشه بندی
توصیف و نمایه سازی
دسته بندی، تخمین و پیش بینی همگی داده کاوی هدایت شده هستند که هدف آنها یافتن ارزش یک متغیر هدف خاص است. گروه بندی شباهت و خوشه بندی جزو داده کاوی غیرهدایت شده هستند که در آن هدف، یافتن ساختار پنهان درون داده ها بدون توجه به یک متغیر هدف خاص است. نمایه سازی، عملی توصیفی است که میتواند هم هدایت شده و هم غیرهدایت شده باشد.
دسته بندی
دسته بندی که یکی از معمولترین کارکردهای داده کاوی است، یکی از واجبات بشر است. ما برای و درجه بندی شناخت و برقراری رابطه درباره دنیا، به طور مداوم دسته بندی، طبقه بندی می کنیم. دسته بندی شامل بررسی ویژگیهای یک شیء جدید و تخصیص آن به یکی از مجموعه های از قبل تعیین شده میباشد. عمل دسته بندی با تعریف درستی از دسته ها و مجموعهای از ویژگیها که حاوی موارد از پیش دسته بندی شده هستند، مشخص می گردد. این عمل شامل ساختن مدلی است که بتوان از آن برای دسته بندی کردن داده های دسته بندی نشده، استفاده نمود. اشیایی که باید دسته بندی شوند، معمولاً به وسیله اطلاعاتی در جدول پایگاه داده یا یک فایل ارائه می شوند و عمل دسته بندی شامل افزودن ستون جدیدی با کد دسته بندی خاصی است. از جمله تکنیک تکنیکهای درخت تصمیم و نزدیکترین همسایهای دسته بندی می باشند. شبکه های عصبی و

تکه های دیگری از این پایان نامه را می توانید

در شماره بندی فوق بخوانید

متن کامل پایان نامه ها در سایت homatez.com موجود است

You may also like...

Add a Comment