برنامه نویسی عمومی فناوری

داده کاوی بر اساس شبکه های عصبی

امیرحسین عراقی
نوشته شده توسط امیرحسین عراقی

بررسی داده کاوی بر اساس شبکه های عصبی

چکیده

استفاده از شبکه های عصبی در داده کاوی گسترده تر شده است. اگر چه شبکه های عصبی ممکن است ساختار پیچیده، زمان آموزش طولانی، و بازنمایی uneasily قابل فهم از نتایج داشته باشد ، شبکه های عصبی به دلیل  توانایی پذیرش بالا برای داده های نویز دار و دقت بالا در داده کاوی ترجیح داده شده است. در این مقاله داده کاوی مبتنی بر شبکه های عصبی به طور مفصل مورد تحقیق قرار گرفته ، و تکنولوژی های کلیدی و راه هایی برای دستیابی به داده کاوی مبتنی بر شبکه های عصبی نیز مورد تحقیق قرار گرفته است

مقدمه

با توسعه مداوم تکنولوژی های پایگاه داده و برنامه های کاربردی گسترده ای از سیستم مدیریت پایگاه داده، حجم داده های ذخیره شده در پایگاه داده را به سرعت افزایش می دهد و در حجم بزرگی از داده ها اطلاعات بسیار مهم پنهان است. اگر اطلاعات را بتوان از پایگاه داده استخراج آنها خواهد شد بسیاری از سود بالقوه برای شرکت های ایجاد، و فن آوری اطلاعات استخراج شده از بانک اطلاعاتی عظیم است که به عنوان داده کاوی شناخته شده است .

ابزارهای داده کاوی می توانند روند و فعالیت های آینده پیش بینی برای حمایت از تصمیم گیری مردم است. به عنوان مثال، از طریق تجزیه و تحلیل کل سیستم پایگاه داده این شرکت از ابزار داده کاوی می تواند مشکلات مانند “کدام مشتری است به احتمال زیاد برای پاسخ دادن به ایمیل فعالیت های بازاریابی شرکت ما، به همین دلیل”، و دیگر مسائل مشابه پاسخ دهد . بعضی از ابزارهای داده کاوی نیز می تواند برخی از مشکلات سنتی که مصرف زمان زیادی برطرف کند ، دلیل این است که آنها به سرعت می تواند جستجو کل پایگاه داده و پیدا کردن برخی از کارشناسان اطلاعات مفید مورد توجه قرار نمیگیرد.

شبکه های عصبی شبکه های پردازش موازی که با شبیه سازی تصویر تفکر شهودی انسان، بر اساس تحقیق از شبکه های عصبی بیولوژیکی، با توجه به ویژگی های سلول های عصبی بیولوژیکی و شبکه های عصبی و با ساده کردن، خلاصه و تصفیه تولید شده است. ان از این ایده از نگاشت غیر خطی، از روش پردازش موازی و ساختار شبکه عصبی به خودی خود برای بیان دانش در ارتباط ورودی و خروجی استفاده می کند . در ابتدا، استفاده از شبکه های عصبی در داده کاوی خوشبین نیست، و دلیل اصلی این است که شبکه های عصبی دارای نقص از ساختار پیچیده، interpretability ضعیف و زمان آموزش طولانی است. اما مزایای آن از جمله توانایی تهیه بالا برای داده های نویز و میزان خطای پایین، به طور مداوم در حال پیشروی و بهینه سازی الگوریتم های آموزش شبکه های مختلف، به ویژه مداوم پیشرفت و بهبود شبکه الگوریتم های هرس گوناگون و قوانین استخراج الگوریتم، بهترین استفاده را استفاده از شبکه عصبی در داده کاوی به طور فزاینده ای توسط اکثریت قریب به اتفاق از کاربران مورد علاقه. در این مقاله داده کاوی مبتنی بر شبکه های عصبی به طور مفصل تحقیق شده.

روش شبکه عصبی درداده کاوی

هفت روش و تکنیک داده کاوی معمول وجود دارند . که روش های تجزیه و تحلیل آماری، مجموعه ناهموار، پوشش مثبت و رد موارد معکوس، فرمول یافت، روش فازی، و همچنین تکنولوژی تصویر سازی می باشد. در اینجا، ما به روش شبکه های عصبی تمرکز می کنیم.

روش شبکه های عصبی برای طبقه بندی، خوشه بندی، ویژگی های استخراج از معادن، پیش بینی و تشخیص الگو استفاده می شود. این تقلید میکند از ساختار سلول های عصبی حیوانات، براساس در مدل MP و Hebb قانون آموزش، پس در اصل آن است که یک ساختار ماتریس پخش شده است. از طریق آموزش داده کاوی، روش شبکه عصبی به تدریج محاسبه می (از جمله تکرار مکرر یا محاسبه تجمعی) وزن شبکه های عصبی متصل می شوند. مدل شبکه عصبی را می توان بطور گسترده به سه نوع زیر تقسیم می شوند:

(1) اشتراک به جلو شبکه:

این مورد درک مدل پس انتشار و شبکه تابع به عنوان نمایندگان، و به طور عمده در زمینه هایی از قبیل پیش بینی و تشخیص الگو استفاده می شود؛

(2) شبکه feedback:

آن را با توجه به مدل گسسته Hopfield و مدل مستمر به عنوان نمایندگان، و به طور عمده برای حافظه انجمنی و محاسبه بهینه سازی استفاده می شود؛

(3) شبکه های خود سازمان:

این مورد نظریه رزونانس تطبیقی ​​مدل (ART) و مدل Kohonen به عنوان نمایندگان، و به طور عمده برای تجزیه و تحلیل خوشه ای استفاده می شود.

در حال حاضر، شبکه های عصبی معمولا در داده کاوی مورد استفاده  است شبکه BP است. البته، شبکه عصبی مصنوعی در علم در حال توسعه است، و برخی از نظریه های واقعا شکل مانند مشکلات همگرایی، ثبات، حداقل محلی و تنظیم پارامترهای گرفته شده است. برای شبکه BP مشکلات مکرر آن مواجه می شوند این است که آموزش آهسته است، ممکن است در حداقل محلی قرار می گیرند و آن مشکل است برای تعیین پارامترهای آموزش. هدف این مشکلات برخی از افراد با استفاده از روش ترکیب شبکه های عصبی مصنوعی و الگوریتم های ژنتیکی ژن به تصویب رسید و نتایج بهتری به دست آورد.

شبکه های عصبی مصنوعی دارای ویژگی های توزیع شده ذخیره سازی اطلاعات، پردازش موازی، اطلاعات، استدلال و یادگیری خود سازمان، و قابلیت سریع اتصالات داده غیر خطی، پس از آن می توانید بسیاری از مشکلات که برای روش های دیگری برای مشکل را حل کند را حل کند.

 فرایند داده کاوی بر اساس شبکه های عصبی

فرآیند داده کاوی می تواند از سه مرحله اصلی تشکیل شود: آماده سازی داده ها، داده کاوی، بیان و تفسیر نتایج، روند داده کاوی تکرار از سه فاز است. جزئیات در شکل نشان داده شده است. 1. داده کاوی مبتنی بر شبکه های عصبی است که از  آماده سازی داده ها، قواعد استخراج و ارزیابی قوانین سه فاز تشکیل شده است ، همانطور که در شکل نشان داده شده است. 2.

  1. آماده سازی داده ها

آماده سازی داده ها که تعریف و پردازش داده کاوی به آن را متناسب با روش داده کاوی خاص. آماده سازی داده ها، اولین گام مهم در داده کاوی است و نقش مهمی را در کل فرایند داده کاوی ایفا می کند. این به طور عمده شامل چهار فرآیند زیر است.

1) تمیز کردن داده ها

پاکسازی داده برای پر کردن مقادیر خالی از داده ها، از بین بردن اطلاعات نویز و تصحیح داده های از تناقض در داده ها.

2) گزینه داده ها

گزینه داده برای انتخاب اطلاعات ترتیبی است و از ردیف در این استخراج استفاده   می کند .

3) پردازش داده ها

پیش پردازش اطلاعات برای افزایش روند داده ها پاک که انتخاب شده می باشد .

4) بیان داده ها

بیان داده است برای تبدیل داده ها پس از پیش پردازش به شکل که می تواند توسط الگوریتم های داده کاوی پذیرفته شده بر اساس شبکه های عصبی. داده کاوی مبتنی بر شبکه های عصبی، تنها می تواند اداره کند داده های عددی، پس از آن نیاز به تبدیل داده ها علامت را به داده های عددی. ساده ترین روش ایجاد یک جدول مکاتبات داده های یک به یک بین علامت و داده های عددی است. دیگر روش پیچیده تر است به اتخاذ تابع مخلوط مناسب برای تولید یک داده منحصر به فرد عددی با توجه به رشته داده. اگر چه بسیاری از انواع داده ها در پایگاه داده رابطه ای وجود دارد، اما همه آنها اساسا می توان به سادگی پایین آمده به ثبت داده ها، داده های عددی گسسته و داده های عددی سریال سه نوع داده منطقی. شکل. 3 به تبدیل از سه نوع داده ها.

نماد “Apple” در شکل می توان به مربوط به داده های عددی گسسته با استفاده از جدول نماد یا تابع مخلوط تبدیل شده است. سپس، داده های عددی گسسته را می توان به داده های پیوسته عددی کمی و همچنین می توانید به اطلاعات برنامه نویسی رمزنگاری کنیم.

  1. قوانین استخراج

روش های مختلفی برای استخراج قوانین، که در آن روشهای بیشتر مورد استفاده است روش LRE، روش جعبه سیاه، از روش استخراج قوانین فازی وجود دارد، از روش قواعد استخراج از شبکه بازگشتی، الگوریتم دودویی ورودی و خروجی قواعد استخراج (BIO-RE)، قوانین جزئی استخراج الگوریتم (جزئی-RE) و احکام استخراج الگوریتم (کامل-RE).

  1. ارزیابی قوانین

اگر چه هدف از ارزیابی قوانین بستگی دارد در هر برنامه خاص، اما، به طور کلی، قوانین را می توان مطابق با اهداف زیر ارزیابی شده است.

(1) یافتن توالی بهینه از قوانین استخراج، و آن را به دست آوردن بهترین نتایج در مجموعه داده ها داده شده.

(2) تست دقت از قوانین استخراج شده.

(3) تشخیص چگونه دانش زیادی در شبکه عصبی استخراج نشده.

(4) تشخیص تناقض بین قوانین استخراج شده و شبکه عصبی آموزش داده است.

 انواع داده کاوی بر اساس شبکه های عصبی

انواع داده کاوی مبتنی بر شبکه های عصبی صدها نوع هستند، اما تنها دو نوع بیشتر مورد استفاده است که داده کاوی مبتنی بر شبکه عصبی خود سازمان و در شبکه عصبی فازی وجود دارد.

1. داده کاوی بر اساس شبکه عصبی خود سازمان

فرآیند خود سازماندهی فرایند یادگیری بدون معلم است. از طریق مطالعه، از ویژگی های مهم و یا برخی از دانش ذاتی در یک گروه از داده ها، از جمله ویژگی های توزیع و یا خوشه بندی با توجه به ویژگی های خاص. محققان T. Kohonen از فنلاند معتقد است که ماژول های همسایه در شبکه های عصبی شبیه به سلول های عصبی مغز می باشد و پخش قوانین مختلف، از طریق تعامل آنها می توانند انطباقی توسعه یافته می شود آشکارساز ویژه برای تشخیص سیگنال های مختلف. از آنجا که سلول های عصبی مغز در بخش های فضای مغز مختلف بازی از قوانین مختلف، به طوری که آنها حساس به نوع ورودی های مختلف می باشد. T Kohonen؟ همچنین پیشنهاد یک نوع از یادگیری که باعث می شود سیگنال ورودی به فضای کم بعدی، نقشه برداری و نگهداری است که سیگنال های ورودی با همان ویژگی را می توان مربوط به منطقه منطقه ای در فضا است که به اصطلاح خود نقشه از ویژگی های سازمان (S0FM) .

2. داده کاوی بر اساس شبکه های عصبی فازی

اگر چه شبکه های عصبی دارای عملکرد قوی از یادگیری، طبقه بندی، ارتباط و حافظه است، اما در استفاده از شبکه های عصبی برای داده کاوی، بزرگترین مشکل این است که نتایج خروجی نمی تواند به طور مستقیم روشن باشد . پس از معرفی تابع پردازش فازی در شبکه عصبی، آن را نه تنها می تواند ظرفیت بیان خروجی خود را افزایش دهد بلکه سیستم با ثبات تر می شود.

شبکه های عصبی فازی اغلب در داده کاوی استفاده می شود مدل فازی ادراک، شبکه BP فازی، خوشه بندی فازی شبکه Kohonen، شبکه استنتاج فازی و مدل ART فازی. که در آن شبکه BP فازی از شبکه های سنتی BP توسعه یافته است. در شبکه های سنتی BP، در صورتی که نمونه متعلق به گروه K برای اولین بار، پس از آن به جز مقدار خروجی از اولین گره خروجی K 1 است، مقدار خروجی از سایر گره های خروجی همه 0 است، است که، ارزش خروجی های سنتی شبکه BP تنها می تواند 0 یا 1 است، مبهم نیست. با این حال، در شبکه های فازی BP، ارزش خروجی مورد انتظار از نمونه ها توسط عضویت انتظار می رود از نمونه های مربوط به انواع مختلف جایگزین شده است. پس از آموزش نمونه و عضویت انتظار آنها مربوط به انواع مختلف در یادگیری مرحله شبکه BP فازی توانایی برای منعکس کردن رابطه وابستگی بین ورودی و خروجی در مجموعه آموزش، و می تواند عضویت در تشخیص الگوی در داده کاوی می دهد. خوشه بندی فازی شبکه های Kohonen نه تنها در بیان خروجی فازی به دست آمده، اما همچنین معرفی اعضای نمونه به قوانین اصلاح ضریب وزن، باعث می شود که قوانین اصلاح ضریب وزن نیز متوجه فازی.

تکنیک های کلیدی و روش پیاده سازی

1. ترکیب موثر از شبکه های عصبی وفناوری داده کاوی

این تکنولوژی تقریبا با استفاده از اصلی ANN بسته نرم افزاری و یا از ابزار های توسعه موجود ANN تبدیل شده، جریان کار داده کاوی باید در عمق قابل درک، مدل داده ها و برنامه واسط باید با شکل استاندارد شرح داده شده، سپس دو تکنولوژی را می توان به طور موثر یکپارچه و وظایف با هم کامل داده کاوی. بنابراین، رویکرد ارگانیک ترکیب ANN و فن آوری های داده کاوی باید یافت می شود به منظور بهبود و بهینه سازی فن آوری های داده کاوی.

2. ترکیب موثر از پردازش دانش و محاسبات عصبی

ارزیابی اینکه آیا یک الگوریتم پیاده سازی داده کاوی خوب است شاخص ها و ویژگی های زیر می توان استفاده کرد: (1) آیا مدل سازی با کیفیت بالا در شرایط نویز و داده های نیمه پخته، (2) مدل باید توسط کاربران قابل درک است و می تواند مورد استفاده برای تصمیم گیری، (3) مدل می تواند دانش منطقه دریافت (قواعد را وارد کنید و استخراج) برای بهبود کیفیت مدل سازی. شبکه های عصبی موجود است با دقت بالا در کیفیت مدل سازی، اما در دو شاخص دوم کم است. شبکه های عصبی در واقع می تواند به عنوان یک جعبه سیاه برای کاربران دیده می شود، محدودیت های نرم افزار باعث می شود روند طبقه بندی و پیش بینی می تواند توسط کاربران درک نخواهد بود و به طور مستقیم مورد استفاده برای تصمیم گیری. برای داده کاوی، بستگی در مدل شبکه عصبی ارائه شده  نتایج به دلیل اینکه قبل از اینکه تصمیم گیری مهم کاربران نیاز به درک منطق و توجیهی برای تصمیم گیری کافی نیست دارد. بنابراین، در داده کاوی دانش ANN باید به منظور موافقت دانش و دانش آموزش ANN به سیستم در فرایند داده کاوی تاسیس شده است. است که می گویند، در داده کاوی ANN، لازم است برای استفاده از روش دانش جهت استخراج دانش از فرایند داده کاوی و درک مطابق با پردازش دانش و عصبی شبکه می باشد. علاوه بر این، در نظام تصمیم گیری موثر و مکانیسم توضیح هم باید در نظر گرفته شود به تاسیس برای بهبود اعتبار و عملی از ANN تکنولوژی داده کاوی.

رابط C. ورودی / خروجی

با توجه به اینکه روش با استفاده از ابزارهای شبکه های عصبی و یا شبکه های عصبی از نرم افزار بدست آوردن داده ها عقب مانده است، پس از آن یک رابط خوب با پایگاه داده رابطه ای، پایگاه داده چند بعدی و انبار داده ها باید به منظور پاسخگویی به نیازهای داده کاوی.

نتیجه گیری :

در حال حاضر، داده کاوی یک منطقه جدید و مهم پژوهش است، و شبکه های عصبی خود بسیار مناسب برای حل مشکلات از داده کاوی است، زیرا ویژگی های آن از نیرومندی خوب، سازگار خود سازماندهی، پردازش موازی، ذخیره سازی توزیع شده و درجه بالایی از خطا تحمل. ترکیبی از روش داده کاوی و مدل شبکه عصبی تا حد زیادی می تواند بهبود بهره وری از روشهای داده کاوی، و از آن شده است به طور گسترده ای استفاده می شود. آن را نیز بیشتر و بیشتر توجه دریافت خواهید کرد.

درباره نویسنده

امیرحسین عراقی

امیرحسین عراقی

درج دیدگاه