نام پژوهشگر: آسیه فروردین
آسیه فروردین نادر جهانگیری
هدف این پژوهش، بررسی عناصر زبان شناختی موثر بر بهبود خلاصه سازی خودکار متون خبری فارسی در صفحات وب با تاکید بر نشانه های گفتمانی با رویکرد میان رشته ای است. چارچوب نظری این تحقیق، مبتنی بر آرای مایکل هالیدی زبان شناس نقش گرا درباره انسجام متنی است. همچنین تلفیقی از نظریات زبان شناسان در خصوص نشانه های گفتمانی در چارچوب تئوریک مدنظر قرار گرفته و در روش شناسی از مدل ادمونسون در خلاصه سازی استخراجی استفاده شده است. اهم نتایج حاصل از بررسی 180 رویداد خبری و 1295 «پاراگراف» موجود به عنوان واحد تحلیل، بر روی وب سایت خبرگزاری ایسنا در قالب موضوعات اجتماعی، اقتصادی، سیاسی، فرهنگی و ورزشی طی شش ماهه نخست سال 1390 به شرح زیر است: - کل نشانه های گفتمانی موجود در متون خبری 6283 نشانه بوده است که 463 مورد، نشانه گفتمانی بدون تکرار در قالب 14 نوع نشانه در اخبار مورد بررسی شناسایی شده اند . - از میان نشانه های گفتمانی مورد بررسی، نشانه های ساختاری، فعلی، افزایشی و علتی مجموعا بیش از 75 درصد نشانه ها و عبارات پیوند دهنده جملات و پاراگراف های متون خبری را به خود اختصاص داده اند. - رویدادهای تک خبری در مقایسه با رویدادهای چند خبری در خلاصه سازی استخراجی کاربرد بیشتری دارند. - در 50 درصد اخبار مورد بررسی، پاراگراف دوم خبر به عنوان مهم ترین پاراگراف برای خلاصه سازی استخراجی به شمار می رود و در 18 درصد اخبار، پاراگراف آخر برای خلاصه سازی مناسب تر است. ضمن آنکه در 32 درصد اخبار امکان وزن دهی به پاراگراف ها و در نتیجه تعیین پاراگراف مهم برای خلاصه سازی میسر نیست. - از مجموع نتایج به دست آمده دو مفهوم «نانو خبر» و «زبان شناسی خبر» پیشنهاد شده که برای نخستین بار در حوزه خلاصه سازی مورد استفاده قرار گرفته است. نتیجه آنکه بین نشانه های گفتمانی موجود در متون خبری و نقش آنها در بهبود خلاصه سازی صفحات وب رابطه معنادار وجود دارد. کلمات کلیدی: خلاصه سازی خودکار، خلاصه سازی استخراجی، نشانه های گفتمانی، میان رشته ای، انسجام متنی، زبان شناسی رایانه ای، زبان شناسی خبر