Significance of Machine Learning for Detection of Malicious Websites on an Unbalanced Dataset

نویسندگان

چکیده

It is hard to trust any data entry on online websites as some may be malicious, and gather for illegal or unintended use. For example, bank login credit card information can misused financial theft. To make users aware of the digital safety websites, we have tried identify learn pattern a dataset consisting features malicious benign websites. We treated problem differentiation between classification applied several machine learning techniques, random forest, decision tree, logistic regression, support vector machines this data. Several evaluation metrics such accuracy, precision, recall, F1 score, false positive rate, were used evaluate performance each technique. Since was imbalanced, models developed bias during training toward specific class Multiple balancing undersampling, oversampling, SMOTE, removing bias. Our experiments showed that after data, forest algorithm using oversampling technique best results in all website feature dataset.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

development and implementation of an optimized control strategy for induction machine in an electric vehicle

in the area of automotive engineering there is a tendency to more electrification of power train. in this work control of an induction machine for the application of electric vehicle is investigated. through the changing operating point of the machine, adapting the rotor magnetization current seems to be useful to increase the machines efficiency. in the literature there are many approaches wh...

15 صفحه اول

Cross-Layer Detection of Malicious Websites Cross-Layer Detection of Malicious Websites∗

Malicious websites have become a major attack tool of the adversary. There are two main approaches to detect malicious websites: static and dynamic. The static approach is centered on the static analysis of website contents and can scale up to a large number of websites in cyberspace. However, this approach has limited success in dealing with sophisticated attacks that include obfuscation. The ...

متن کامل

an investigation into the impact of m-game-enhanced blended module of teaching and learning on iranian students english literacy skills and subskills learning

پژوهش حاضر با پیوند رسانه های قدیمی و جدید یاد دهی و یادگیری _طرح داستان و بازی های همراه ــ در یک پو دمان ترکیبی، در صدد قیاس شیوه ی یاد دهی و یادگیری مبتنی بر بازی مهارت های فرعی و اصلی واژگان، خواندن و نوشتار سواد انگلیسی با شیوه های مرسوم آن بود. به این منظور با کاربرد یک طرح سه گانه همراه با الگوی نظام آموزشی (تومی، 2010)، بازی های از پیش ساخته شده و بومی قابل عرضه از طریق ارتباطات سیّار (ب...

an application of fuzzy logic for car insurance underwriting

در ایران بیمه خودرو سهم بزرگی در صنعت بیمه دارد. تعیین حق بیمه مناسب و عادلانه نیازمند طبقه بندی خریداران بیمه نامه براساس خطرات احتمالی آنها است. عوامل ریسکی فراوانی می تواند بر این قیمت گذاری تاثیر بگذارد. طبقه بندی و تعیین میزان تاثیر گذاری هر عامل ریسکی بر قیمت گذاری بیمه خودرو پیچیدگی خاصی دارد. در این پایان نامه سعی در ارائه راهی جدید برای طبقه بندی عوامل ریسکی با استفاده از اصول و روش ها...

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Digital

سال: 2022

ISSN: ['2673-6470']

DOI: https://doi.org/10.3390/digital2040027