Perbandingan Akurasi Deteksi Emosi Pada Suara Menggunakan Multilayer Perceptron, Random Forest, Decision Tree dan K-NN

نویسندگان

چکیده

Penelitian ini bertujuan untuk membandingkan akurasi pengenalan emosi melalui suara dengan menggunakan beberapa jenis classifier. Emosi dasar yang akan dikenali ada 4, yaitu senang, sedih, neutral dan marah. Metodologi penelitian dimulai memperoleh dataset dari database RAVDESS, terdiri 24 aktor jumlah sebanyak 60 per aktor. Namun, hanya 28 dipilih setiap aktor, sehingga total 672 digunakan dalam ini. Untuk mengekstraksi fitur suara, tiga teknik mel frequency cepstral coefficient (MFCC), Chroma, Skala Mel. Kemudian, empat classifier pembuatan model Multilayer Perceptron Classifier (MLPC), Decision Tree, Random Forest, K-NN. Dataset dibagi menjadi data train test 3 uji coba masing-masing classifier, yait 85% – 25% test, 80% 75% test. Hasil menunjukkan bahwa Forest memiliki tertinggi sebesar 79% pembagian - 20% Sedangkan, Tree terendah 57% Dalam ini, ekstraksi MFCC, Mel, terbukti efektif menghasilkan suara. Selain itu, hasil juga lebih unggul mengenali jika dibandingkan lain.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Penambahan emosi menggunakan metode manipulasi prosodi untuk sistem text to speech bahasa Indonesia

Abstrak—Text To Speech (TTS) merupakan suatu sistem yang dapat mengonversi teks dalam format suatu bahasa menjadi ucapan sesuai dengan pembacaan teks dalam bahasa yang digunakan. Fokus penelitian yaitu suatu konsep pengucapan natural, dengan usaha “memanusiakan” pelafalan sintesa suara sistem Text To Speech yang dihasilkan. Kebutuhan utama yang digunakan untuk sistem Text To Speech dalam peneli...

متن کامل

Analisis dan Sintesis Sinyal Suara

Audio signal information with high quality would help the television audience to increase the perception of the information displayed. Transmission channel capacity will become limited, while the need of channel communication is increased. The research aim is coding the audio signal on the low bit rate for saving the channel communication usage for digital television broadcasting. The research ...

متن کامل

Klasifikasi Data Cardiotocography Dengan Integrasi Metode Neural Network Dan Particle Swarm Optimization

Backpropagation (BP) adalah sebuah metode yang digunakan dalam training Neural Network (NN) untuk menentukan parameter bobot yang sesuai. Proses penentuan parameter bobot dengan menggunakan metode backpropagation sangat dipengaruhi oleh pemilihan nilai learning rate (LR)-nya. Penggunaan nilai learning rate yang kurang optimal berdampak pada waktu komputasi yang lama atau akurasi klasifikasi yan...

متن کامل

Decision Tree Rule Reduction Using Linear Classifiers in Multilayer Perceptron

It has been shown that a neural network is better than a direct application of induction trees in modeling complex relations of input attributes in sample data. We propose that concise rules be extracted to support data with input variable relations over continuous-valued attributes. Those relations as a set of linear classifiers can be obtained from neural network modeling based on back-propag...

متن کامل

Desain dan Implementasi Face Recognition dan Live Streaming pada Sistem Digital Assistant untuk Staf Medik Fungsional menggunakan Google Glass

Abstrak— Dalam era globalisasi saat ini, rumah sakit dituntut untuk meningkatkan kinerja dan daya saing sebagai badan usaha dengan tidak mengurangi misi sosial yang dibawanya. Hal ini berarti bahwa rumah sakit harus menerapkan kebijakankebijakan strategis agar mampu secara cepat dan tepat dalam pengambilan keputusan sehingga dapat menjadi organisasi yang responsif, inovatif, efektif, dan efisie...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Insyst

سال: 2023

ISSN: ['2722-1962', '2621-9220']

DOI: https://doi.org/10.52985/insyst.v5i1.264