کاوش کارامد قوانین روابط فازی از جریان های فراگیر داده ها Efficient mining fuzzy association rules from ubiquitous data streams
- نوع فایل : کتاب
- زبان : فارسی
- ناشر : الزویر Elsevier
- چاپ و سال / کشور: 2015
توضیحات
چاپ شده در مجله مهندسی اسکندریه – Alexandria Engineering Journal
رشته های مرتبط مهندسی کامپیوتر و فناوری اطلاعات، رایانش ابری و شبکه های کامپیوتری
۱-مقدمه برنامه های جدید اخیر نظیر پایش ترافیک شبکه، تحلیل داده های شبکه حسگر، کاوش جریان کلیک جهانی، اندازه گیری مصرف برق و مکان یابی دینامیکی نوسانات بازار سهام، لزوم مطالعه انواع جدید داده ها را تاکید می کند. این موسوم به داده های جریان است که به صورت جریان نامحدود و پیوسته از اطلاعات بر خلاف جریان های داده های ذخیره شده آماری محدود است. داده کاوی جریان، فرایند استخراج ساختار های دانش از داده های پیوسته می باشد. انتشار سیستم های جریان داده، شبکه های بی سیم و ابزار های سیار موجب می شود تا لزوم استفاده از ابزار های تحلیل کارامد داده ها در مورد کسب اطلاعات از جریان های داده پیوسته در نظر گرفته شود. کاوش جریان داده های فراگیر، فرایند کشف الگو بر روی ابزار های فراگیر و سیار است. این خود نشان دهنده نسل بعدی از سیستم های داده کاوی است که از نیاز عای اطلاعاتی زمانی و مکانی کاربران موبایل پشتیبانی کرده و موجب تسهیل داده کاوی هر زمان هرجا می شود. منطق فازی، نوعی منطق مورد استفاده در هوش مصنوعی است. این اشاره به منطق چند مقداره دارد. به جای داشتن دو مقدار( حقیقی و کاذب)، طیف پیوسته ای از مقادیر حقیقی محتمل (۲) وجود دارند. در منطق فازی، هر فرض یک گزاره ای است که به عدد بین ۰ ( کاذب) و ۱( حقیقی) نسبت داده می شود نظیر گزاره ای که موسوم به فرض فازی است. منطق فازی، ابزاری قوی برای طبقه بندی مفهوم به شکل انتزاعی با معرفی ابهام است. بسیاری از برنامه های جریان داده وجود دارند که نیاز به کاوش قواعد ارتباطی دارند نظیر پایش ترافیک شبکه و تحلیل جریان کلیک وب. هدف این برنامه ها کشف روابط مهم میان ایتم ها است زیرا حضور برخی از ایتم ها نشان دهنده حضور برخی دیگر است. رویکرد قواعد روابط فازی می تواند نتایج داده کاوی را با تخصص انسانی و دانش قبلی به شکل قواعد ترکیب کند تا به دسته ای از طبقه بندی های جریان داده ها برسد. دیگر مزیت رویکرد منطق فازی این است که نتایج طبقه بندی را می دهد که شامل درجه ای از احتمال است. این مقاله، کارایی و اثر بخشی کاوش قواعد ارتباط فازی را از جریان داده های فراگیر اثبات می کند. این خود در بخش های بعدی بررسی می شود. برای این منظور، بخش باقی مانده مقاله به صورت زیر سازمان دهی شده است: کار مربوط به کاوش قواعد ارتباطی فازی و کاوش جریان داده های فراگیر مرور و در بخش ۲ خلاصه شده است. ک روش کاوش قواعد ارتباط فازی از داده های فراگیر در بخش ۳ پیشنهاد شده و پیچیدگی آن در بخش ۴ تحلیل شده است. به علاوه، نتایج آزمایشی در بخش ۵ بررسی شده است. مسائل مربوط به تحقیقات آینده در بخش ۶ ارایه می شود. ۲ -کار های مربوطه این مقاله مربوط به زمینه های تحقیقات بین رشته ای مختلف است. دو موضوع اصلی این کار ارایه می شود: روش های کاوش جریان داده های فراگیر برای تحلیل موثر داده های پیوسته و الگوریتم های کاوش قواعد ارتباط فازی. این دو زمینه نیز بررسی می شوند. ۲-۱ کاوش جریان داده های فراگیر روش بر اساس مجموعه داده های ذخیره شده آماری، در بسیاری از زمینه ها کاربرد زیادی ندارد. این موارد شامل تحلیل شبکه بی سیم، تشخیص نفوذ، تحلیل بازار بورسف تحلیل داده های شبکه حسگر می باشد و به طر کلی در شرایطی که در آن هر اطلاعات قابل دسترس بایستی برای تشخیص نفوذ استفاده شود. این شرایط مستلزم استفاده از الگوریتم های جدید می باشد که قادر به حل بسیاری از مشکلات مربوط به داده ها می باشند که در جدول ۱ نشان داده شده است.
رشته های مرتبط مهندسی کامپیوتر و فناوری اطلاعات، رایانش ابری و شبکه های کامپیوتری
۱-مقدمه برنامه های جدید اخیر نظیر پایش ترافیک شبکه، تحلیل داده های شبکه حسگر، کاوش جریان کلیک جهانی، اندازه گیری مصرف برق و مکان یابی دینامیکی نوسانات بازار سهام، لزوم مطالعه انواع جدید داده ها را تاکید می کند. این موسوم به داده های جریان است که به صورت جریان نامحدود و پیوسته از اطلاعات بر خلاف جریان های داده های ذخیره شده آماری محدود است. داده کاوی جریان، فرایند استخراج ساختار های دانش از داده های پیوسته می باشد. انتشار سیستم های جریان داده، شبکه های بی سیم و ابزار های سیار موجب می شود تا لزوم استفاده از ابزار های تحلیل کارامد داده ها در مورد کسب اطلاعات از جریان های داده پیوسته در نظر گرفته شود. کاوش جریان داده های فراگیر، فرایند کشف الگو بر روی ابزار های فراگیر و سیار است. این خود نشان دهنده نسل بعدی از سیستم های داده کاوی است که از نیاز عای اطلاعاتی زمانی و مکانی کاربران موبایل پشتیبانی کرده و موجب تسهیل داده کاوی هر زمان هرجا می شود. منطق فازی، نوعی منطق مورد استفاده در هوش مصنوعی است. این اشاره به منطق چند مقداره دارد. به جای داشتن دو مقدار( حقیقی و کاذب)، طیف پیوسته ای از مقادیر حقیقی محتمل (۲) وجود دارند. در منطق فازی، هر فرض یک گزاره ای است که به عدد بین ۰ ( کاذب) و ۱( حقیقی) نسبت داده می شود نظیر گزاره ای که موسوم به فرض فازی است. منطق فازی، ابزاری قوی برای طبقه بندی مفهوم به شکل انتزاعی با معرفی ابهام است. بسیاری از برنامه های جریان داده وجود دارند که نیاز به کاوش قواعد ارتباطی دارند نظیر پایش ترافیک شبکه و تحلیل جریان کلیک وب. هدف این برنامه ها کشف روابط مهم میان ایتم ها است زیرا حضور برخی از ایتم ها نشان دهنده حضور برخی دیگر است. رویکرد قواعد روابط فازی می تواند نتایج داده کاوی را با تخصص انسانی و دانش قبلی به شکل قواعد ترکیب کند تا به دسته ای از طبقه بندی های جریان داده ها برسد. دیگر مزیت رویکرد منطق فازی این است که نتایج طبقه بندی را می دهد که شامل درجه ای از احتمال است. این مقاله، کارایی و اثر بخشی کاوش قواعد ارتباط فازی را از جریان داده های فراگیر اثبات می کند. این خود در بخش های بعدی بررسی می شود. برای این منظور، بخش باقی مانده مقاله به صورت زیر سازمان دهی شده است: کار مربوط به کاوش قواعد ارتباطی فازی و کاوش جریان داده های فراگیر مرور و در بخش ۲ خلاصه شده است. ک روش کاوش قواعد ارتباط فازی از داده های فراگیر در بخش ۳ پیشنهاد شده و پیچیدگی آن در بخش ۴ تحلیل شده است. به علاوه، نتایج آزمایشی در بخش ۵ بررسی شده است. مسائل مربوط به تحقیقات آینده در بخش ۶ ارایه می شود. ۲ -کار های مربوطه این مقاله مربوط به زمینه های تحقیقات بین رشته ای مختلف است. دو موضوع اصلی این کار ارایه می شود: روش های کاوش جریان داده های فراگیر برای تحلیل موثر داده های پیوسته و الگوریتم های کاوش قواعد ارتباط فازی. این دو زمینه نیز بررسی می شوند. ۲-۱ کاوش جریان داده های فراگیر روش بر اساس مجموعه داده های ذخیره شده آماری، در بسیاری از زمینه ها کاربرد زیادی ندارد. این موارد شامل تحلیل شبکه بی سیم، تشخیص نفوذ، تحلیل بازار بورسف تحلیل داده های شبکه حسگر می باشد و به طر کلی در شرایطی که در آن هر اطلاعات قابل دسترس بایستی برای تشخیص نفوذ استفاده شود. این شرایط مستلزم استفاده از الگوریتم های جدید می باشد که قادر به حل بسیاری از مشکلات مربوط به داده ها می باشند که در جدول ۱ نشان داده شده است.
Description
۱٫ Introduction Recent emerging applications, such as network traffic monitoring, sensor network data analysis, web click stream mining, power consumption measurement, and dynamic tracing of stock market fluctuations, call for studying a new kind of data. This is called stream data, which can be continuous, potentially infinite flow of information, as opposed to finite, statically stored data sets. Stream Data Mining is the process of extracting knowledge structures from continuous, and rapid data records. The dissemination of data streams systems, wireless networks and mobile/handheld devices motivates the need for an efficient data analysis tool capable of gaining insights about these continuous data streams [1]. Ubiquitous data streams mining (UDM) is the process of pattern discovery on mobile, embedded and ubiquitous devices. It represents the next generation of data mining systems, that will support the intelligent and time-critical information needs of mobile users, and will facilitate ‘‘anytime, anywhere’’ data mining. Fuzzy logic is a type of logic used in artificial intelligence. It is referred to as a multi-valued logic.Instead of having two values (true and false), there are a continuum of possible truth values [2]. In fuzzy logic, every proposition is a statement that is assigned a number between 0 (false) and 1 (true), such a statement is called a fuzzy proposition. Fuzzy logic provides a powerful tool to categorize a concept in an abstract way by introducing vagueness. Many data streams applications exist, that require association rule mining, such as network traffic monitoring and web click streams analysis. These applications’ goal is to discover important associations among items as the presence of some items will imply the presence of others. Fuzzy association rule approach could combine data mining results with human expertise and background knowledge, in the form of rules, to attain labeled classes for classification of data streams. Another advantage of the fuzzy logic approach is that it gives classification results, which include a degree of probability. This paper demonstrates the effectiveness of Fuzzy Association Rules Mining from Ubiquitous Data Streams. This will be revealed in the coming sections. For this purpose, the remaining part of the paper is organized as follows: the work related to Fuzzy Association rules mining and ubiquitous data streams mining are reviewed and summarized in Section 2. An efficient fuzzy association rules mining technique from ubiquitous data streams is proposed in Section 3, and its complexity is analyzed in Section 4. Moreover,experimental results are discussed in Section 5. The paper is concluded and future research issues are presented, in Section 6. ۲٫ Related work This paper belongs to different inter-related research fields. The two main related topics of this work are presented: Ubiquitous Data Streams Mining Techniques that can effectively analyze continuously streaming data and Fuzzy association rules mining algorithms. These two fields will be surveyed. ۲٫۱٫ Ubiquitous data streams mining The approach, based on finite statically stored data sets, is not satisfactory in several applications. These include wireless network analysis, intrusion detection, stock market analysis, sensor network data analysis, and, in general, any setting in which every information available should be used to make an immediate decision. Such situations demand new algorithms, that are able to cope with evolutions of data as shown in Table 1 [3].