Towards Supporting Exploratory Search over the Arabic Web Content: The Case of ArabXplore

نویسندگان

  • Abed Ahmed MSc, Department of Computer Science, Faculty of Information Technology, The Islamic University of Gaza, Gaza Strip, Palestine.
  • Al-Agha Iyad Associate Prof., Department of Computer Science, Faculty of Information Technology, The Islamic University of Gaza, Palestine.
چکیده مقاله:

Due to the huge amount of data published on the Web, the Web search process has become more difficult, and it is sometimes hard to get the expected results, especially when the users are less certain about their information needs. Several efforts have been proposed to support exploratory search on the web by using query expansion, faceted search, or supplementary information extracted from external knowledge resources. However, these solutions are not well explored for the general web search in an open-domain setting. In addition, they mostly focus on supporting search in content expressed in English and Latin based languages. In this research, we propose a fully automated approach that aims to support exploratory search over the Arabic web content. It exploits the Arabic version of Wikipedia to extract complementary information that supports visual representation and deeper exploration of the search engine's results. Key Wikipedia entities are extracted from the text snippets produced by the search engine in response to the user's query. Entities are then filtered and ranked by using a novel ranking algorithm that extends the conventional PageRank algorithm. Finally, a graph is built and presented to the user to visually represent highly ranked topics and their relationships. The proposed approach was realized by developing ArabXplore, a system that integrates with the web browser to support the web search process by executing our approach in query time. It was assessed over a dataset of 100 Arabic search queries covering different domains, and results were assessed and rated by human subjects. The underlying ranking algorithm was also compared with the conventional PageRank.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

the washback effect of discretepoint vs. integrative tests on the retention of content in knowledge tests

در این پایان نامه تاثیر دو نوع تست جزیی نگر و کلی نگر بر به یادسپاری محتوا ارزیابی شده که نتایج نشان دهندهکارایی تستهای کلی نگر بیشتر از سایر آزمونها است

15 صفحه اول

the effect of traffic density on the accident externality from driving the case study of tehran

در این پژوهش به بررسی اثر افزایش ترافیک بر روی تعداد تصادفات پرداخته شده است. به این منظور 30 تقاطع در شهر تهران بطور تصادفی انتخاب گردید و تعداد تصادفات ماهیانه در این تقاطعات در طول سالهای 89-90 از سازمان کنترل ترافیک شهر تهران استخراج گردید و با استفاده از مدل داده های تابلویی و نرم افزار eviews مدل خطی و درجه دوم تخمین زده شد و در نهایت این نتیجه حاصل شد که تقاطعات پر ترافیک تر تعداد تصادفا...

15 صفحه اول

pricing unemployment insurance : the case of iran

employees always concern about losing their job , or in other word , losing their income resources. for this purpose, every government requires strong system for covering these concerns. the unemployment insurance (ui) program’s can be used for achieving this goal. in this thesis, we price ui based on the insurance history of employee and the duration of being unemployed. we use the weibull dis...

surveying the relevance of proportions to the content of quran verses

چکیده : قرآن چشمه سار زلال هدایتی است که از سوی خداوند حکیم نازل شده تا بشر را به سر منزل کمال برساند. و در این راستا از شیوه های گوناگون بیانی خطابی و بلاغی استفاده کرده تا با فطرت زیبا طلب انسان درآمیزد و اورا مقهور خویش ساخته، به سوی کمالات سوق دهد.ازجمله جنبه های بارز اعجاز بیانی قرآن وجود فواصل در پایان آیات است که کار برد سجع و قافیه در کلام بشر شبیه آن است. برخی ازعلمای سلف تفاوت هایی ب...

15 صفحه اول

the effect of consciousness raising (c-r) on the reduction of translational errors: a case study

در دوره های آموزش ترجمه استادان بیشتر سعی دارند دانشجویان را با انواع متون آشنا سازند، درحالی که کمتر به خطاهای مکرر آنان در متن ترجمه شده می پردازند. اهمیت تحقیق حاضر مبنی بر ارتکاب مکرر خطاهای ترجمانی حتی بعد از گذراندن دوره های تخصصی ترجمه از سوی دانشجویان است. هدف از آن تاکید بر خطاهای رایج میان دانشجویان مترجمی و کاهش این خطاها با افزایش آگاهی و هوشیاری دانشجویان از بروز آنها است.از آنجا ک...

15 صفحه اول

the norms of localization in translating persian multimodal texts: the case of videogame demos

abstract هنجارهای بومی سازی در ترجمه متون چندوجهی فارسی:مورد دموهای بازیهای کامپیوتری چکیده اهداف عمده مطالعه حاضر به سه دسته تقسیم میشوند: 1) بررسی مشکلات احتمالی ترجمه دموهای (فیلمهای) بازیهای کامپیوتری،2) تعیین هنجارهای بومی سازی در ترجمه دموهای (فیلمهای) بازیهای کامپیوتری و 3) تعیین ایدئولوژیهایی که این هنجارها در جامعه نشان میدهند. به این منظور، ابتدا، مجموعه ای ازدموهای (فیلمهای) ب...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 12  شماره 4

صفحات  160- 179

تاریخ انتشار 2020-12-01

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023