کاوش برخط الگوهای پویای زمانی در داده های جریانی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
- نویسنده عباس خسروانی
- استاد راهنما ستار هاشمی منصور ذوالقدری جهرمی رضا بوستانی اقبال منصوری
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها و ...، حجم جریان های داده به قدری زیاد است که ذخیره آن تقریبا غیر ممکن است. بعلاوه، حتی اگر ذخیره داده ها ممکن باشد، نرخ داده های ورودی بقدری زیاد است که انجام عملیات بیش از یک بار بر روی هر داده امکان پذیر نمی باشد. از طرفی در بسیاری از موارد توزیع داده ها متأثر از عوامل بیرونی، پیوسته با زمان تغییر میکند. در نتیجه طراحی الگوریتم های برخط و کارا به منظور کاوش در ساختار متغیر جریان های داده ضرورت می یابد. روش های غیر خطی بر پایه آنالیز مولفه های اصلی کرنلی (kpca) در داده کاوی به منظور استخراج ساختار های غیر خطی از داده ها بسیار مورد استفاده قرار گرفته شده و کارایی بالایی نسبت به روش های خطی از خود نشان داده اند. اما پیاده سازی این روش ها که بر پایه تجزیه مقدار تکین کرنلی (ksvd) دسته ای ماتریس داده ها است، مناسب کاربرد هایی که نیازمند پردازش برخط می باشند، نمی باشد. در این پایان نامه ما sksvd را که یک الگوریتم جدید به روز رسانی ksvd می باشد را به منظور یافتن کارای الگوهای غیر خطی از داده های جریانی ارائه کرده ایم. الگوریتم ارائه شده به کمک ایده توابع کرنل ، یک انتقال متعامد خطی را از داده های اخیر در فضایی با ابعاد بسیار بالاتر ( شاید بی نهایت) که به آن فضای ویژگی یا فضای کرنل می گویند، یاد می گیرد و هرگاه داده ی جدیدی تولید شود این الگوریتم آن را به صورت غیر خطی به آن فضا نگاشت کرده و بعد از استخراج الگوهای آن، انتقال متعامد را به صورت افزایشی و با کمترین میزان مصرف منابع به روز می کند. از آنجا که فضای اولیه و فضای ویژگی به صورت غیر خطی به هم وابسته هستند، الگوهای بدست آمده غیر خطی خواهند بود. الگوهای بدست آمده را سپس می توان به منظور کشف تغییر در مفهوم و توزیع داده ها و یا شناسایی ناهنجاری مورد استفاده قرار داد. نتایج حاصل از آزمایش هایی گوناگون بر روی داده های واقعی و ساختگی تاثیر گذاری و کارایی روش ما را نشان میدهد.
منابع مشابه
کاوش الگوهای تکرار شونده در جریانهای داده
یافتن دسته داده های تکراری در جریان پیوسته تراکنشها یکی از مسائل حیاتی در کاربردهایی نظیر تحلیل سبد خرید، مانیتورینگ شبکه و پیشبینی فروش انبار می باشد. پنجره لغزان یکی از مدلهایی است که به دلیل مدیریت تغییر محتوا، مصرف حافظه محدود و سرعت پردازش کم به شکل گسترده در یافتن دسته داده های تکراری در جریانهای داده استفاده شده است. یک الگوریتم مبتنی بر مدل پنجره ای لغزان به یک ساختمان داده کارا احتیاج...
15 صفحه اولکاوش الگوهای تکراری پرسود در پایگاه داده های بزرگ
دادهکاوی مجموعه اقلام پرسود در پایگاه داده تراکنشی، منجر به شناسایی مجموعه اقلام با بالاترین سودمندی میشود. گرچه در سال های اخیر الگوریتمهای بسیاری برای این نمونه کار پیشنهاد شده است، اما این الگوریتمها، اکثراً، کارائی خود را صرف تولید مجموعه اقلام کاندید برای تولید مجموعه اقلام پرسود مینمایند. چنانچه پایگاه داده دارای تعداد تراکنشهای بسیار زیاد و یا دارای مجموعه اقلام پرسود خیلی طولانی با...
طبقه بندی برخط داده های جریانی غیرایستان و نامتعادل با رویکرد وزن دهی
طبقه بندی داده های جریانی غیرایستان یکی از شاخه های مهم علم تشخیص الگو و یادگیری ماشین است که به طور روز افزون مورد توجه قرار گرفته است. دلیل این موضوع کاربردهای فراوان جدیدی از قبیل کارت های اعتباری، آب و هوا، شبکه های حس گر بی سیم، داده های وب و غیره است. در طبقه بندی داده های جریانی چالش اساسی تغییر مفهوم (غیرایستان بودن) است، که در آن تابع توزیع زیرین توصیف کننده داده ها به مرور زمان تغییر ...
کاوش الگوهای پویایی مشتریان در صنعت بانکداری
برای چندین دهه، سازمانها بیش از مشتریان بر نشان تجاری و محصولاتشان تمرکز میکردند؛ اما اکنون بنگاههای اقتصادی بر ایجاد و حفظ ارتباط مؤثر با مشتریان متمرکز شدهاند. در چنین شرایطی شناخت مشتریان و نیازهای آنان به امری حیاتی برای سازمانها تبدیل شده است. یکی از پرکاربردترین روشهای شناخت مشتریان، بخشبندی آنها به گروههای متجانس و شناخت ویژگیهای هر بخش است؛ اما شیوههای سنتی و ایستای بخشبندی م...
متن کاملکاوش k زیرگراف با بیشترین تکرار از گراف های جریانی
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد. از سوی دیگر، امروزه نیز استفاده ی همگانی از وب و اینترنت ما را با حجم زیادی از داده و اطلاعات مواجه می کند. با این رشد انفجاری در داده های ذخیره شده، نیاز به روشهایی است که اصطلاحا به کشف دانش ...
کاوش الگوهای تکراری در جریان های داده بر اساس مدل پنجره لغزنده
در مسئله کاوش الگوهای تکراری به دنبال مجموعه هایی هستیم که در تعداد قابل توجهی از تراکنش ها (رکوردها) دیده می شوند. کاوش الگوهای تکراری در جریان های داده کاربرد زیادی در صنعت، تجارت و علوم مختلف دارد. به دلیل سرعت زیاد، بی پایان بودن، حجم بالا و ماهیت تغییر کننده محتوای جریان های داده، یافتن الگوهای تکراری در این نوع داده ها مسئله ای چالش برانگیز است. مدل پنجره لغزنده یکی از مدل های محبوب و پرک...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023