پایان نامه ارشد رایگان درمورد دسته بندی، خوشه بندی، شبکه عصبی

تحلیل پیوند نیز در شرایط خاصی عمل دسته بندی را انجام می دهند.
تخمین
تخمین، با نتایج مجزایی که با ارقام پیوسته نشان داده شدهاند، سروکار دارد. در تخمین، دادههای ورودی در قالب متغیرهای ورودی مختلف به سیستم داده میشود و متغیرهای خروجی آن رقمی مثل درآمد یا تراز کارت اعتباری میباشد. در عمل تخمین اغلب برای انجام دسته بندی استفاده میشود. روش تخمین فواید زیادی دارد که مهمترین آنها، این است که در آن اطلاعات را می توان مطابق تخمین به دست آمده مرتب نمود. مدلهای رگرسیون و شبکه های عصبی از جمله تکنیکهای مناسب داده کاوی برای تخمین میباشند.
پیش بینی
پیشبینی مانند دسته بندی یا تخمین است با این تفاوت که اطلاعات، مطابق برخی از رفتارهای پیش بینی شده آینده یا ارقام تخمین زده آینده، دسته بندی میشوند. در عمل پیش بینی، تنها روش برای بررسی صحت دسته بندی، انتظار دیدن آینده است.هر یک از تکنیکهای استفاده شده در دسته بندی و تخمین را میتوان برای استفاده در پیش بینی تطبیق داد، جایی که متغیری باید پیش بینی شود از قبل معلوم است و دادههای پیشین برای آن وجود دارد. از دادههای پیشین برای تهیه یک مدل که بیانگر رفتار مشاهده شده کنونی است استفاده میشود؛ وقتی این مدل برای ورودیهای کنونی به کار رفت، نتیجه کار، پیش بینی رفتار آینده خواهد بود. بسیاری از تکنیک های داده کاوی در صورت وجود دادههای مناسب، برای استفاده در پیش بینی مناسب هستند. انتخاب تکنیک به ماهیت داده های ورودی و نوع متغیری که باید پیش بینی شود بستگی دارد.
گروه بندی شباهت یا قوانین وابستگی
گروه بندی شباهت یا قوانین وابستگی برای تعیین ویژگی های همزمانی هستند که در وقوع یک پدیده رخ می دهند. به عبارت دیگر عمل گروه بندی شباهت احتمال وقوع و یا عدم وقوع همزمان ویژگیها را تعیین می نماید. به عبارت ساده تر عمل گروه بندی شباهت تعیین می کند که چه چیزهایی با هم جورند؛ مثال معمول این موضوع تعیین کالاهایی است که با هم در یک سبد خرید قرار می گیرند، چیزی که آن را تحلیل سبد بازار نام دارد. فروشگاه های زنجیرهای خرده فروشی می توانند از گروه بندی شباهت برای تعیین چیدمان کالاها در قفسه های فروشگاه، در یک کاتالوگ و یا صفحه وب فروش اینترنتی استفاده کنند تا اقلامی که اغلب با هم خریده می شوند در کنار هم قرار گیرند. از گروه بندی شباهت می توان برای تعیین شرایط فروشهای متقابل و همزمان و همچنین برای طراحی بسته بندیهای جذاب و یا دسته بندی محصولات و خدمات استفاده کرد .
خوشه بندی
خوشه بندی به عمل تقسیم جمعیت ناهمگن به تعدادی زیرمجموعه ها یا خوشه های همگن گفته میشود. وجه تمایز خوشه بندی از دسته بندی این است که خوشه بندی به دستههای از پیش تعیین شده تکیه ندارد. در دسته بندی بر اساس یک مدل هر کدام از دادهها به دستههای از پیش تعیین شده اختصاص مییابد؛ این دسته ها یا از ابتدا در طبیعت وجود داشتهاند مثل جنسیت، رنگ پوست و … یا از طریق یافتههای پژوهشهای پیشین تعیین گردیدهاند. در خوشه بندی هیچ دسته از پیش تعیین شده وجود ندارد و دادهها صرفاً براساس تشابه گروهبندی میشوند و عناوین هر گروه نیز توسط کاربر تعیین میگردد. خوشه بندی معمولاً به عنوان پیش درآمدی برای به کارگیری سایر تحلیلهای داده کاوی یا مدلسازی به کار میروند.
نمایه سازی
گاهی اوقات هدف داده کاوی، تنها توصیف آن چیزی است که در یک پایگاه دادهای پیچیده در جریان است. نتایج نمایه سازی درک ما را از مردم، محصولات یا فرآیندهایی که دادهها را در
مرحله اول تولید کردهاند افزایش می دهد. توصیف خوب رفتار، اغلب توضیح خوبی هم به همراه دارد؛ یک توصیف خوب حداقل نشان میدهد چه زمانی میتوان انتظار یک توضیح مناسب را داشت. درختهای تصمیم ابزار مفیدی برای نمایه سازی میباشند؛ قوانین وابستگی و خوشه بندی را نیز می توان برای نمایه سازی ها استفاده نمود.
كاربرد هاي داده كاوي
داده كاوي به سرعت در حال محبوبيت است به خاطر كمك هاي اساسي آن، سازمان هاي زيادي در حال استفاده از داده كاوي براي كمك به مديريت تمام فازهاي ارتباط با مشتري شامل به دست آوردن مشتريان جديد، افزايش سود از طريق مشتريان موجود و حفظ كردن مشتريان خوب هستند. با تعيين مشخصات يك مشتري خوب يك شركت مي تواند با همان مشخصات اهداف آينده خويش را پيش بيني كند. با پرونده سازي براي مشتري كه يك محصول خاص را خرید مي نمايد اين شركت مي تواند توجه خود را به مشتريان مشابهي كه از اين محصول خريد نكرده اند معطوف دارد با پرونده سازي براي مشترياني كه اين سازمان را ترك كرده اند يك شركت مي تواند مشترياني را كه خطر رفتن آنها نيز وجود دارد را نگه دارد چرا كه نگهداري يك مشتري موجود بسيار كم هزينه تر از بدست آوردن يك مشتري جديد هزينه مي برد. داده كاوي ارزشهايي را از طريق بررسي يك طيف وسيعي از كارخانه ها پيشنهاد مي كند.شركتهاي ارتباطات از راه دور و كارت هاي اعتباري دو شاخه بزرگ در استفاده از داده كاوي براي تشخيص استفاده كلاه بردارانه از خدمات آنها مي باشند. شركتهاي بيمه و درآمد هم علاقمند به استفاده از اين تكنولوژي براي كاهش كلاهبرداري مي باشند. كاربردهاي دارويي نواحي مفيد ديگري هستند كه داده كاوي در آنها دست دارد داده كاوي مي تواند براي تشخيص تاثير اعمال جراحي، آزمايش هاي دارويي ودرمان استفاده گردد. شركتهايي كه در خريد و فروشهاي مالي فعاليت ميكنند از دادهكاوي براي تعيين شاخصه هاي بازار و صنعت براي تشخيص كارايي درآمد استفاده مي كنند. خرده فروشها از داده كاوي براي تصميم درمورد اينكه كدام محصول در فروشگاه ها در آمد زاست به منظور دسترسي به ارتقاي كيفيت كار خود استفاده بيشتري مي نمايند. شركتهاي دارويي درحال كاوش پايگاههاي داده بزرگي از تركيبات شيميايي و مواد ژنتيكي براي كشف مواد كه مي توانند گزينه خوبي براي ساخت به عنوان دارو باشند [41].
رویکردهاي مسائل داده کاوي در پزشکی
صنعت سلامت به طور مستمر در حال تولید میزان زیادي از دادهها می باشد و افرادي که با این نوع دادهها مواجه هستند، دریافته اند که بین جمع آوري تا تفسیر آنها شکاف وسیعی وجود دارد. حوزهي به نسبت جوان و در حال رشد داده کاوي در سلامت از جمله شیوه هایی است که میتواند این صنعت را از تحلیل عمیق این داده ها بهرمند سازد. و به توسعهي تحقیقات پزشکی و تصمیم گیريهاي علمی در زمینهي تشخیص و درمان منتج شود [42].
داده کاوي در پزشکی و بیولوژي بخش مهمی از انفورماتیک زیست – پزشکی است و یکی از کاربردي ترین علوم کامپیوتر در این علم بوده که در بیمارستانها، کلینیکها، آزمایشگاهها و مراکز تحقیقاتی به کار گرفته شده است [43].
الگوریتم ژنتیک تکنیک بهینهاي براي ارتقاي سایر الگوریتم هاي داده کاوي میباشد، به گونهاي که از بهترین مدل بر روي مجموعه هایي از داده ها استفاده میکند و میتواند براي یک بیماري خاص بهترین برنامهي درمانی را تعیین کند [44].
1-4- نمونه هایی از کاربردهاي داده کاوي در سلامت
داده کاوي در تشخیصهاي غیر تهاجمی: برخی از اقدامات تشخیصی و آزمایشگاهی براي بیماران، تهاجمی و هزینه بر و در عین حال رنج آور هستند، به عنوان مثال بافت برداري از گردن رحم به منظور تشخیص سرطان گردن رحم از جمله این موارد است. تنگاول و همکاران از طریق الگوریتمهاي خوشهبندي به تحلیل بیماران مبتلا به سرطان گردن رحم پرداختند و نتایج پیشگیري کننده تري را نسبت به عقاید پزشکی کنونی پیدا کردند. همچنین گوریونسکیو نشان داد که داده کاوي می تواند با ادغام CAD ( تشخیص با کمک کامپیوتر) و اندوسکوپی اولتراسونوگرافی در شناسایی غیر تهاجمی سرطان به عنوان یک شیوهي جدید به کار رود.
داده کاوي در کنترل عفونت بیمارستانی: در ایالات متحده سالانه 2میلیون نفر به عفونتهاي بیمارستانی مبتلا می شوند، لذا تمرکز زیادي براي شناسایی این بیماران صورت گرفته است. به عنوان مثال در ایالت آلباما نوعی سیستم نظارتی وجود دارد که از تکنیکهاي دادهکاوي استفاده میکند. این سیستم با استفاده از قوانین و روابط داده کاوي بر روي کشت خون بیمار و داده هاي بالینی به دست آمده از سیستم اطلاعات آزمایشگاه8 الگوهاي جدید و جالب توجهی را مشخص می سازد و ماهانه الگوهایی که توسط کارشناسان کنترل عفونت مورد بررسی قرار می گیرد را تهیه می کند. سازندگان این سیستم دریافته اند که ارتقاي کنترل عفونت با سیستم داده کاوي حساستر از سیستم کنترل عفونت سنتی عمل می کند [45-46].
مدلها و الگوريتمهای داده کاوی
شبکه هاي عصبی مصنوعی
شبکههاي عصبی مصنوعی9 که معمولاً به عنوان” شبکه هاي عصبی” نام برده می شوند یک الگوي ریاضی مبنی بر سیستم زیستی است. سیستمهاي عصبی یک الگوریتم براي بهینه سازي و یادگیري آزادانه بر اساس مفاهیم الهام گرفته از تحقیق در ماهیت مغز می باشند. مغز با استفاده از قابلیتی شناخته شده به عنوان نورون اجزاء ساختاري خود را سازماندهی می کند، در نتیجه محاسبات معینی را بسیار سریع تر از کامپیوتر دیجیتال انجام میدهد. در حالت کلی شبکه عصبی ماشینی است که طراحی شده تا روشی مشابه با کاري که مغز براي انجام وظایف خاص یا عملکرد قابل توجه بر اساس مطالعات دکتر سایمون هاسکین انجام می دهد را مدل سازي کند. این شبکه یک پردازنده توزیع شده موازي بزرگ است که از واحد هاي پردازش ساده ساخته شده است، و داراي یک تمایل طبیعی براي ذخیره سازي دانش تجربی و ایجاد دسترسی به آن براي استفاده می باشد [47].
ساختار شبکه عصبی
شکل 3-2 شبکه عصبی که شامل سه لایه ورودی،میانی و خروجی می باشد[47]
لایه ورودي: این لایه وروديهارا دریافت میکند و برحسب قدرت ارتباطش با لایه بعد سیگنال ورودي را به لایه بعد می فرستد.
لایه میانی(لایه پنهان): تعداد لایههاي میانی و تعداد نورون هاي آن دلخواه است. لایههاي میانی باید با دقت انتخاب شوند تا خروجی مناسب را به ما بدهند.
لایه خروجی: گروه دیگري از نورونها نیز از طریق خروجیهاي خود، جهان خارج را می سازند.
معماري شبکه عصبی
یک شبکه عصبی را میتوان به عنوان یک گراف وزن دار جهت دار درنظر گرفت که نورونها به عنوان گرهها و یالهاي جهتدار نشان دهنده ارتباط بین نورون ها هستند. معماري شبکه نورون در سه کلاس طبقه بندي میشود:
شبکه هاي پیش خور تک لایه : یک شبکه نورون لایه لایه شده است که در آن نورونها به شکلی از لایه سازماندهی شدهاند، در این معماري ما شاهد لایهاي ورودي از گرههاي منبع هستیم که به سمت لایه خروجی نورونها انتقال مییابند اما نه بصورت بلعکس. این شبکه به شدت پیش خور یا بدون دور است.
شبکه هاي پیش خور چند لایه : شبکه اي است که داراي یک یا چند لایه پنهان گرههاي محاسباتی مربوطه به نام نورونهاي پنهان می باشد. نقش نورونهاي پنهان به عنوان ارتباط بین ورودي خارجی و شبکه خروجی به شیوهاي مفید است. شبکه هاي برگشتی که حداقل یک حلقه پس خور دارند، این شبکه ممکن است از نورونهاي تک لایه تشکیل شده باشد از هر سیگنال خروجی نورون پس خوري به وروديهاي دیگر نورونها وجود دارد [47].
نحوه محاسبات در شبکه های عصبی به این شکل است که ورودیهای به نورون )x1 تا xi( دروزنهای w1 تا wi ضرب شده و مجموع نتایج حاصل از هر ورودی پس از اعمال در یک تابع،خروجی نورون را تشکیل میدهد:
(3-1)
۰ در بعضی موارد مقدار ثابتی در هر نورون به معادله فوق به نام وزن اریب اضافه می گردد:
(3-2)
شبکه های عصبی مصنوعی، مدلهای مختلفی دارند که با توجه به جهت ورود اطلاعات وشبکه های بازگشتی پردازش آنها به انواع مختلفی از جمله شبکه های عصبی پیش خور، شبکه های چندلایه پرسپترون و شبکههای توابع

تکه های دیگری از این پایان نامه را می توانید

در شماره بندی فوق بخوانید

متن کامل پایان نامه ها در سایت homatez.com موجود است

You may also like...

Add a Comment