Einleitung: Perspektiven und Positionen des Text Mining
نویسندگان
چکیده
Beiträge zum Thema Text Mining beginnen vielfach mit dem Hinweis auf die enorme Zunahme online verfügbarer Dokumente, ob nun im Internet oder in Intranets (Losiewicz et al. 2000; Merkl 2000; Feldman 2001; Mehler 2001; Joachims & Leopold 2002). Der hiermit einhergehenden „Informationsflut“ wird das Ungenügen des Information Retrieval (IR) bzw. seiner gängigen Verfahren der Informationsaufbereitung und Informationserschließung gegenübergestellt. Es wird bemängelt, dass sich das IR weitgehend darin erschöpft, Teilmengen von Textkollektionen auf Suchanfragen hin aufzufinden und in der Regel bloß listenförmig anzuordnen. Das auf diese Weise dargestellte Spannungsverhältnis von Informationsexplosion und Defiziten bestehender IR-Verfahren bildet den Hintergrund für die Entwicklung von Verfahren zur automatischen Verarbeitung textueller Einheiten, die sich stärker an den Anforderungen von Informationssuchenden orientieren. Anders ausgedrückt: Mit der Einführung der Neuen Medien wächst die Bedeutung digitalisierter Dokumente als Primärmedium für die Verarbeitung, Verbreitung und Verwaltung von Information in öffentlichen und betrieblichen Organisationen. Dabei steht wegen der Menge zu verarbeitender Einheiten die Alternative einer intellektuellen Dokumenterschließung nicht zur Verfügung. Andererseits wachsen die Anforderung an eine automatische Textanalyse, der das klassische IR nicht gerecht wird. Der Mehrzahl der hiervon betroffenen textuellen Einheiten fehlt die explizite Strukturiertheit formaler Datenstrukturen. Vielmehr weisen sie je nach Textbzw. Dokumenttyp ganz unterschiedliche Strukturierungsgrade auf. Dabei korreliert die Flexibilität der Organisationsziele negativ mit dem Grad an explizierter Strukturiertheit und positiv mit der Anzahl jener Texte und Texttypen (E-Mails, Memos, Expertisen, technische Dokumentationen etc.), die im Zuge ihrer Realisierung produziert bzw. rezipiert werden. Vor diesem Hintergrund entsteht ein Bedarf an Texttechnologien, die ihren Benutzern nicht nur „intelligente“ Schnittstellen zur Textrezeption anbieten, sondern zugleich auf inhaltsorientierte Text-
منابع مشابه
Nutzen und Benutzen von Text Mining für die Medienanalyse
Die Annahme der Dissertation haben empfohlen: We have seen that computer programming is an art, because it applies accumulated knowledge to the world, because it requires skill and ingenuity, and especially because it produces objects of beauty. Abbildungsverzeichnis v Tabellenverzeichnis viii 1 einleitung 1 1.1 Sinn einer wissenschaftlichen Arbeit zu Beginn des 21. Jahrhunderts 1 1.2 Verortung...
متن کاملPositionssensitive Dekomposition von Potenzgesetzen am Beispiel von Wikipedia-basierten Kollaborationsnetzwerken
Potenzgesetzliche Verteilungen spielen bei der Modellierung von Strukturen im WWW eine bedeutende Rolle. Im Kontext der Small-World-Debatte von Watts & Strogatz sowie von Barabási & Albert dominieren Modelle, die das Konzept der kleinen Welt zusammen mit Überlegungen zur Pareto-Verteilung von Degree-Werten zu einer Art von universalistischem Prinzip erhoben. Die bisherige Erklärung für das Zust...
متن کاملMedienproduktion im Projekt medin: Multimediales Fernstudium Medizinische Informatik
Im Rahmen des Projektes medin wurden für den kompletten Nebenfachstudiengang Medizinische Informatik 23 Kurseinheiten multimedial aufbereitet, um sie in der Fernlehre einsetzen zu können. Im folgenden Beitrag stellen wir die Rahmenbedingungen des Projekts vor, beschreiben Arbeitsprozesse, die im Laufe des Projektes entstanden sind, geben Produktionsbeispiele und zeigen Einsatzmöglichkeiten der ...
متن کاملAutolysis Within Organizations: A Case Study
Zusammenfassung: Der Beitrag zeigt, wie die von Niklas Luhmann entwickelte Systemtheorie für eine empirische Analyse von Lärm und lärmerzeugenden Mechanismen geöffnet werden kann. Die dem Artikel zugrunde liegende analytische Strategie ist die Beobachtung der Operationen, die ein soziales System konstituieren. Eine entsprechende Analyse macht auf das Fehlen von Anschlusskommunikation und auf di...
متن کاملModellierungswerkzeuge für den Schulunterricht - Erfahrungen und Perspektiven
Dieser Artikel behandelt Modellierung als wesentlichen Bestandteil eines zeitgemäßen Unterricht insbesondere in strukturund naturwissenschaftlichen Fächern. Wir präsentieren das Rahmensystem Cool Modes, in das eine Vielzahl von Modellierungsumgebungen integriert sind, die miteinander kombiniert werden können. Dieses Rahmensystem fügt sich in gewachsene Unterrichtsformen ein und erweitert die Mö...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- LDV Forum
دوره 20 شماره
صفحات -
تاریخ انتشار 2005