Significance of Machine Learning for Detection of Malicious Websites on an Unbalanced Dataset
نویسندگان
چکیده
It is hard to trust any data entry on online websites as some may be malicious, and gather for illegal or unintended use. For example, bank login credit card information can misused financial theft. To make users aware of the digital safety websites, we have tried identify learn pattern a dataset consisting features malicious benign websites. We treated problem differentiation between classification applied several machine learning techniques, random forest, decision tree, logistic regression, support vector machines this data. Several evaluation metrics such accuracy, precision, recall, F1 score, false positive rate, were used evaluate performance each technique. Since was imbalanced, models developed bias during training toward specific class Multiple balancing undersampling, oversampling, SMOTE, removing bias. Our experiments showed that after data, forest algorithm using oversampling technique best results in all website feature dataset.
منابع مشابه
development and implementation of an optimized control strategy for induction machine in an electric vehicle
in the area of automotive engineering there is a tendency to more electrification of power train. in this work control of an induction machine for the application of electric vehicle is investigated. through the changing operating point of the machine, adapting the rotor magnetization current seems to be useful to increase the machines efficiency. in the literature there are many approaches wh...
15 صفحه اولthe effect of explicit teaching of metacognitive vocabulary learning strategies on recall and retention of idioms
چکیده ندارد.
15 صفحه اولCross-Layer Detection of Malicious Websites Cross-Layer Detection of Malicious Websites∗
Malicious websites have become a major attack tool of the adversary. There are two main approaches to detect malicious websites: static and dynamic. The static approach is centered on the static analysis of website contents and can scale up to a large number of websites in cyberspace. However, this approach has limited success in dealing with sophisticated attacks that include obfuscation. The ...
متن کاملan investigation into the impact of m-game-enhanced blended module of teaching and learning on iranian students english literacy skills and subskills learning
پژوهش حاضر با پیوند رسانه های قدیمی و جدید یاد دهی و یادگیری _طرح داستان و بازی های همراه ــ در یک پو دمان ترکیبی، در صدد قیاس شیوه ی یاد دهی و یادگیری مبتنی بر بازی مهارت های فرعی و اصلی واژگان، خواندن و نوشتار سواد انگلیسی با شیوه های مرسوم آن بود. به این منظور با کاربرد یک طرح سه گانه همراه با الگوی نظام آموزشی (تومی، 2010)، بازی های از پیش ساخته شده و بومی قابل عرضه از طریق ارتباطات سیّار (ب...
an application of fuzzy logic for car insurance underwriting
در ایران بیمه خودرو سهم بزرگی در صنعت بیمه دارد. تعیین حق بیمه مناسب و عادلانه نیازمند طبقه بندی خریداران بیمه نامه براساس خطرات احتمالی آنها است. عوامل ریسکی فراوانی می تواند بر این قیمت گذاری تاثیر بگذارد. طبقه بندی و تعیین میزان تاثیر گذاری هر عامل ریسکی بر قیمت گذاری بیمه خودرو پیچیدگی خاصی دارد. در این پایان نامه سعی در ارائه راهی جدید برای طبقه بندی عوامل ریسکی با استفاده از اصول و روش ها...
ذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Digital
سال: 2022
ISSN: ['2673-6470']
DOI: https://doi.org/10.3390/digital2040027