Who cares about Data, Content is King! – Inhaltsbasierte Mehrwertdienste im Digital Publishing

Wenn wir als eBook-Produzenten von Daten sprechen, dann geht es uns meistens um zwei Dinge. Den alltäglichen Kleinkrieg mit den ONIX-codierten Metadaten oder aber um unser Lieblingsbuzzword, das immer noch sehr vage daherkommende „Big Data“.

Was diese beiden sehr unterschiedlichen Datenformate vereint  und für uns interessant macht, sind jedoch nicht die Daten selbst, sondern die auf ihnen aufsetzenden Funktionen, die dem Nutzer einen Mehrwert generieren. Bei den Metadaten ist dieser Mehrwert hauptsächlich die einfache Zugänglichkeit und Kategorisierung in den eBook-Shops (neudeutsch Accessability), das große Projekt der Big Data Fans sind momentan automatisierte Leseempfehlungen (Recommendation Engines).

Doch vergessen wir dabei nicht etwas Wesentliches. Ist nicht auch der Inhalt selbst eine Datenressource, aus der wir durch intelligente Nutzung Mehrwert generieren können? Lohnt es sich nicht , statt die Bücher mit Enhancements mit neuem Mehrwert anzureichern erst einmal die vorhanden Möglichkeiten vollends auszuschöpfen?

 

Examplarisch sind hier drei bereits existierende contentbasierte Mehrwertdienste hervorzuheben. An diesen drei wird auch deutlich welche unterschiedlichen Ansätze (bzgl. der Datengrundlage) man bei der Entwicklung von Mehrwertdiensten verfolgen kann.

1. Titelbasierter Ansatz: Amazon Xray (http://selfpublisherbibel.de/amazon-news-was-x-ray-fuer-leser-und-autoren-bedeutet/)

xray-paperwhite

Mit X-Ray kann man die Struktur eines Buches durchsuchen – seine wesentlichen Gedanken und Themen, Hauptfiguren oder Schauplätze werden dargestellt, ihre Position im Buch als Graphik visualisiert. Darüber hinaus kann man genauere Informationen von Wikipedia und Shelfari (Eine Online-Enzyklopädie speziell für Buchinhalte) abrufen.

 

2. Korpusbasierter Ansatz: Google ngram (https://books.google.com/ngrams)

google ngram

Mit Google ngrams betrachtet der Nutzer nicht einen singulären Titel sondern die Vorkommen bestimmter Wörter in einem ganzen Korpus an Titeln. An den beiden Achsen des Diagramms lässt sich die Häufigkeit eines Wortvorkommens über die Zeit und in Verhältnis zum Vorkommen anderer Wörter (im Idealfall in allen veröffentlichten Büchern) betrachten. Man wirft hier also keinen titelspezifischen Blick auf den Text sondern das Tool ermöglicht einen ideengeschichtliche Betrachtung.

 

3. Korpus- und Titelbasierter Ansatz: Book Genome Project (http://www.booklamp.org)

booklamp

Das Book Genome Projekt (in Anlehnung an das Human Genome Projekt zur Entschlüsselung der menschlichen DNA) verfolgt einen Ansatz, der beide Betrachtungsweisen kombiniert um die inhaltlichen Kernthemen eines Titels – frei von jeder marketinggesteuerten Ausdeutung – auszumachen und anhand dieser Ähnlichkeitsaussagen zwischen Titeln zu treffen (die dann für Recommendation und Accessability-Funktionen genutzt werden können).

 

So lassen sich durch Drehen an den Variablen Skopus, Verknüpfung der Daten, Kontext und graphischer Aufbereitung unterschiedlichste Dienste auf die reinen Textdaten aufsetzen.

Für die Zukunft vorstellen könnte man sich weitere Features wie z.B:

Flexibles Abstract: Ähnlich wie die Funktion Look-Up auf vielen Readern mit denen man Begriffe in Wikipedia, Wörterbuch oder Google nachschlagen kann, könnte man sich mit dieser Funktion markierte Textabschnitte oder Kapitel zusammenfassen lassen.

Improved Discoverability via Analysis: Anstatt Content-Elemente via als Metadaten vom Verlag mitgelieferter Keywords oder  über User generated Tags zu erschließen könnte man die entsprechenden Analysealgorithmen wie z.B. Xray oder Book Genome Projekt in Shop Systeme integrieren und so den herkömmlichen Klappentext über Kategorien oder Tagclouds ergänzen, um für die analytisch vorgehenden User eine zusätzliche Stöbern-Funktion zu schaffen die über Verkaufsdaten oder sozial generierte Recommendations hinausgeht.

Semantic Search: Eine weitere Möglichkeit wäre es den Content über Semantic Search erschließbar zu machen um Suchen wie: In welchem Buch kämpfen Vampire gegen Einhörner und die Einhörner gewinnen?

Stilistische Analyse: Oder zuletzt wäre eine stilistische Analyse möglich, die über Wortarten, Worthäufigkeiten oder Satzlänge Aussagen über Spannungsverläufe, emotionale Qualitäten des Inhalts (z.B. Horrorfaktor) oder auch Schreibstile (z.B. langatmige Beschreibungen vs. Dialogisches Erzählen) sichtbar und verschiedene Titel vergleichbar macht.

Soweit der Status Quo. Viel Spaß beim Erfinden weiterer Möglichkeiten für contenbasierte Mehrwertdienste!

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s