نگین دانشپور
دانشگاه تربیت دبیر شهید رجایی - دانشکده مهندسی کامپیوتر
[ 1 ] - مدلی سهلایهای در طراحی سطح منطقی پایگاه داده تحلیلی
پایگاههای داده عملیاتی و سیستمهای پردازش تراکنشی برخط ساختارهای مناسبی برای نگهداری و جمعآوری اطلاعات هستند، اما چالش این ساختارها چگونگی استفاده و تفسیر این اطلاعات است. یک پایگاه داده تحلیلی، منبع دادهای است که دادهها را از سیستمها و منابع اطلاعاتی دیگر مانند پایگاه دادههای عملیاتی، سیستم کاربران و ... جمعآوری میکند و پس از همگن و یکپارچهسازی، بهصورت چندبعدی دستهبندی و ذخیره میکن...
[ 2 ] - انتخاب دید جهت ذخیرهسازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی
پایگاه داده تحلیلی حجم زیادی از دادهها که در سیستمهای تصمیمگیرنده و گزارشگیر مورد استفاده قرار میگیرد را ذخیره میکند. در این سیستمها سرعت پاسخگویی به پرسوجوها به علت حجم زیاد دادههای ذخیرهشده، پایین است. از آنجایی که این سیستمها عموماً مورد استفاده مدیران ارشد در سازمانهای مختلف هستند، درنتیجه افزایش سرعت در این سیستمها حائز اهمیت است. یکی از روشهای افزایش سرعت، ذخیره دیدها جهت پ...
[ 3 ] - بهبود عبارت نگهداری دید در پایگاه داده تحلیلی
در پایگاه داده تحلیلی برای پاسخگویی سریع به پرس و جوهای تحلیلی کاربران، پاسخ تعدادی از پرس و جوها را ذخیره می نمایند. پاسخ پرس و جوهایی که در پایگاه داده تحلیلی ذخیره می شوند، منجر به تولید دیدهای ذخیره شده می گردد. مساله بروز رسانی و نگهداری از دیدها در پایگاه داده تحلیلی زمانی مطرح می گردد که داده ها در منابع داده پایه بوسیله تراکنش های مختلف مورد تغییر قرار گیرند. برای نگهداری از دیدها در پا...
[ 4 ] - مدل بهبودیافته دولایه ای در طراحی سطح منطقی پایگاه داده تحلیلی
پایگاه داده تحلیلی، مخزن داده ای متمرکز، جمع آوری شده از منابع اطلاعاتی مختلف و ناهمگن در یک محدوده وسیع زمانی و برای پشتیبانی از سیستم های تصمیم یار می باشد. پایگاه داده تحلیلی منبع داده ای است که در فرایند تصمیم گیری از طریق پردازش تحلیلی بر خط استفاده می شود. فرایند توسعه یک پایگاه داده تحلیلی با تحلیل پایگاه داده عملیاتی، شناسایی نیازهای تحلیلی و نهایتا طراحی در سه سطح مفهومی، منطقی و فیزیک...
[ 5 ] - اعمال مدلهای رگرسیون بر زیرمجموعههای با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی
حضور مقادیر جاافتاده در دادههای دنیای واقعی مشکلی بسیار رایج و غیرقابلاجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده بهطور دقیق پُر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد میشود. در تمامی روشهای پیشنهادی، مدلهای رگرسیون بر زیرمجموعههایی با همبستگی بالا اعمال میشوند. در انتخاب زیرمجموعههای مطلوب سعی میشود تا همبستگی بین...
[ 6 ] - تصحیح خودکار دادهها مبتنی بر وابستگی تابعی و سیستم یادگیری مرکب
صحت دادهها یکی از مهمترین ابعاد کیفیت دادهها بهشمارمیرود. با توجه به حجم بالای منابع دادهای نیاز به روشهایی خودکار وجود دارد. در این مقاله راهکاری خودکار برای تصحیح دادههایی با انواع دادهای متفاوت ارائه شده است. در این راهکار در ابتدا رکوردهایی که احتمالاً حاوی ویژگی خطا است با استفاده از وابستگی تابعی شناساییمیگردد، بدینصورت که رکوردی که به ازای یک وابستگی تابعی با بیش از از رکور...
[ 7 ] - انتخاب اعضای ترکیب در خوشهبندی ترکیبی با استفاده از رأیگیری
Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemb...
[ 8 ] - A New Method for Duplicate Detection Using Hierarchical Clustering of Records
Accuracy and validity of data are prerequisites of appropriate operations of any software system. Always there is possibility of occurring errors in data due to human and system faults. One of these errors is existence of duplicate records in data sources. Duplicate records refer to the same real world entity. There must be one of them in a data source, but for some reasons like aggregation of ...
[ 9 ] - Missing data imputation in multivariable time series data
Multivariate time series data are found in a variety of fields such as bioinformatics, biology, genetics, astronomy, geography and finance. Many time series datasets contain missing data. Multivariate time series missing data imputation is a challenging topic and needs to be carefully considered before learning or predicting time series. Frequent researches have been done on the use of diffe...
نویسندگان همکار