Technologische Entwicklungen & Trends frühzeitig erkennen
In technologie- und forschungstreibenden Unternehmen ist die Technologiefrüherkennung Teil des strategischen Innovations- und Technologie-Managements. Ziel ist es, aussichtsreiche Technologieansätze oder -trends zu ermitteln und deren Entwicklungspotential zu beurteilen. Technologische Entwicklungen und Trends müssen identifiziert, technologische Möglichkeiten rechtzeitig erkannt und deren Auswirkungen und Bedeutung für das Unternehmen bewertet werden. Auch die Identifikation bereits angewandter technischer Lösungen in anderen Anwendungen und Branchen vor dem Hintergrund der Übertragung dieser auf das eigene Produktspektrum und Anwendungsfeld, stellen Unternehmen vor enorme Herausforderungen in Form zeitlicher und personeller Ressourcen.
Ausgangspunkt für die Technologiefrüherkennung ist der generelle Informationsbedarf:
+ Wie wird die Menge an zur Verfügung stehenden Informationen über neue Technologien (z.B. aus Fach-Datenbanken,
Patenten, wissenschaftlichen Veröffentlichungen) effizient und schnell bewältigt?
+ Wie kann mein Unternehmen frühzeitig die relevanten technologischen Möglichkeiten identifizieren?
+ Welche neuen Technologien zeichnen sich als Substitutionsgefahr ab oder ermöglichen neue Funktionalitäten für die eigenen Produkte?
+ Wie ist deren Leistungsfähigkeit in Bezug auf das eigene Anwendungsgebiet einzuschätzen? Wie ist der Reifegrad zu beurteilen?
Semantische Informations- und Analysewerkzeuge
Die manuelle Analyse gefundener Dokumente ist sehr zeitintensiv. Somit macht es Sinn, für diese Suchprozesse spezialisierte, software-basierte Recherche- und Monitoring-Werkzeuge zu verwenden, die eine schnelle und zielgerichtete Extraktion relevanter Informationen aus digitalen Texten ermöglichen. Hierzu erfolgt eine semantische Anreicherung der Texte (Semantic Content Enrichment) um Metadaten. Diese können sein:
Personen, Orte, Firmen, spezifische Projekt- und Firmen-Terme und andere Annotationen.
Die durch software-basierte Extraktion gewonnenen Informationen haben den entscheidenden Vorteil, dass bei dieser Art von Analyse schnell große Mengen an Daten flexibel untersucht werden können. Nach der Identifikation und Extraktion müssen diese Informationen in einem zweiten Schritt noch durch Fachexperten beurteilt werden.
- Angebundene Datenquellen:
- Suchmaschinen (Google, Bing),
- Publikations-/Fachdatenbanken (WTI),
- Journale (JournalTOCs, ScienceDirect),
- Patentdatenbanken (EPO — European Patent Office,
USPTO — United States Patent and Trademark Office),
- RSS-/News-Feeds,
- im File-System abgelegte Dateien. - Einrichtung von Projekträumen:
Themenfelder, in denen inhaltlich zusammengefasst Suchen in verschiedenen Datenquellen durchgeführt werden können (z.B. Technologien, Forschungsthemen, Marktanalysen (bezogen auf ein Themenfeld), Konkurrenzanalysen, eigenes Unternehmen). - Verarbeitung von PDF-, Text- und HTML-Dateien
- Suche nach relevanten Dokumenten über key words / Zeitraum.
- Berechnung der absoluten und relativen (Term frequency) Anzahl von Firmen– und Projekt-Termen zur Beurteilung der Relevanz eines Dokumentes
- (Manuelle) Klassifizierung / Kategorisierung der relevanten Dokumente (interessante Dokumente, Literaturrecherche)
- Einrichtung von ad-hoc- und zeitgesteuerten Suchen (Monitoring).
- Automatische Erkennung von Dokumenten, die bereits im Projektraum annotiert sind (z.B. durch ähnliche Suchanfragen)
- keine doppelte Annotierung. - Suche in den Dokumenten über firmen– und projektspezifische Begriffslisten: allgemeine Firmen-Terme, themen-spezifische Projekt-Terme.
- Systemseitige Verwendung von Gazetteer-Listen und Regeln zur Annotierung/Text-Identifikation
- GATE Standard-Annotationen: Personen, Organisationen, Datum, Zahlen, Währungen und andere Named Entities (atomare Elemente im Text / Satz).
- Extraktion / Annotation von Begriffen und auch Sätzen mit relevanten Informationen.
- Analyse / Auswertung von Einzeldokumenten und auch Dokumenten-Corpora
- Interaktive Übernahme von relevanten Textpassagen in Wissens-Datenbanken.
REMARK - Ein Software-Tool zur Recherche, Analyse und Auswertung von digitalen Texten
Eines der Projektergebnisse des Verbund-Forschungsprojektes syncTech (s.u.) ist das Recherche–
und Monitoringtool REMARK.
Ziel bei der Entwicklung der Anwendung war die Realisierung eines interaktiven Werkzeuges zur Ausführung von Annotationsprozessen,
sowie zur Analyse und Beurteilung von Ergebnissen der Informationsextraktion.
Für die grundlegenden Aufgaben der Informationsextraktion wird in REMARK das Software-System GATE (siehe unten) eingesetzt, eine freie Open Source Software-Plattform zur Extraktion von Informationen aus Texten.
Die Hauptaufgabe der Informationsextraktion ist die Identifikation und Annotierung von Begriffen in Texten (Named-Entity-Recognition). Hierzu wird eine semantische Anreicherung (Semantic Content Enrichment) der Texte um Metadaten wie Personen, Orte, Firmen, spezifische Projekt- und FirmenTerme u.a. ausgeführt.
Diese basiert zum einen auf Begriffs– bzw. Gazetteer-Listen. Zum anderen gibt es regelbasierte Formalismen, die Annotationen aufgrund von Wortarten und –stellungen und bereits in Sätzen vorhandenen Annotationen erzeugen.
Dies erfordert eine zuvor durchgeführte linguistische Analyse des Textes (Tokenizer, SentenceSplitter, Part-of-Speech-Tagger).
1. Suchanfrage an einen Dokumenten-Corpus
Ergebnisse einer (Annotationen-)Suchanfrage an einen Dokumenten-Corpus: Ausgabe aller Sätze, die genau zwei Projektterme enthalten
2. Suchanfrage an einen Dokumenten-Corpus
Ergebnisse einer (Annotationen-)Suchanfrage an einen Dokumenten-Corpus (JournalTOCs): Ausgabe aller Sätze, die genau drei Projektterme enthalten (siehe Spalte “match”). Filter auf die Begriffe in den Spalten match: “solar”, after: “IEEE”
Ein entsprechender Suchprozess nach neuen Informationen geht in der Regel immer vom eigenen Anwendungsfeld aus. Sinnvoll ist aber auch im Sinne einer Cross-Industry-Innovation Technologien aufzufinden, die in anderen Anwendungsfeldern bereits eingesetzt werden.
Um relevante Dokumente in online Medien zu finden, die wichtige Inhalte enthalten könnten, beeinflussen zwei Punkte wesentlich die Qualität und Relevanz der zu analysierenden Dokumente:
- Die verfügbaren Datenquellen: Fachdatenbanken, Fachzeitschriften und –Journale, Patentdatenbanken, offene Suchmaschinen (indizierte Dokumente und Websites im Internet), RSS-Feeds, Presseportale.
- Die Bestimmung der „key words“, mit der eine Suche in der gewählten Datenquelle gestartet wird.
Weiterhin gibt es für die Suchprozesse zwei generelle Zielstellungen:
- Die Identifikation relevanter Dokumente:
sind prinzipiell relevante Informationen in Bezug auf meine Suchstrategie in einem Dokument enthalten? - Das Auffinden relevanter Textstellen in den gefundenen Dokumenten:
welches sind im Dokument die interessantesten, relevantesten Textpassagen in Bezug auf das Themenfeld der Suche (Begriffe, Sätze, Absätze)?
Das Projekt syncTech - Synchronisierte Technologieadaption als Treiber der strategischen Produktinnovation.
Das Verbundprojekt syncTech ist Teil des Programms „Forschung für die Produktion von morgen“ zum Schwerpunkt
„Innovative Produkte effizient entwickeln“ und ist dem Themenfeld „Strategische Entwicklung von Produkt-innovationen“
des Förderschwerpunktes zugeordnet.
Im Rahmen dieses Projektes sollen produzierende Unternehmen dabei unterstützt werden, neue Methoden und Werkzeuge zu
entwickeln und einzuführen, die eine strategische Entwicklung von Produkt-Innovationen bzw. die Entwicklung innovativer
Produkte und Produktionssysteme effizient ermöglichen.
Technologische Trends sollen frühzeitig erkannt werden, um die Entwicklungspotentiale für Innovationen rechtzeitig
erschließen zu können.
Projekt-Koordination
Fraunhofer-Institut für Arbeitswirtschaft und Organisation (IAO)
Nobelstraße 12
70569 Stuttgart
Herr Markus Korell
Laufzeit
01.03.2012 bis 28.02.2015
Förderkennzeichen: 02PJ1003
http://www.synctech-innovation.de
GATE (General Architecture for Text Engineering) ist ein text-technologisches System und Software Framework
zur Informationsextraktion und linguistischen Verarbeitung von Text.
Es wird seit mehr als 15 Jahren an der University of Sheffield (GB) als frei erhältliche Open Source Software entwickelt.
Seine Architektur ermöglicht die Entwicklung und den Einsatz aufgabenorientierter Plugins ebenso wie die interaktive
Nutzung über ein Graphical User Interface (GUI) und auch das Einbinden in bestehende Software über ein Application
Programming Interface (API).
Siehe auch: https://gate.ac.uk