Das Dokument behandelt die Grundlagen der Textklassifikation und Strukturierung von Texten, einschließlich der Unterscheidung zwischen strukturierten, semi-strukturierten und unstrukturierten Texten. Es hebt das Text Encoding Initiative (TEI) hervor, das Standards für die Kodierung und den Austausch von Textdokumenten in den Geisteswissenschaften entwickelt hat. Darüber hinaus wird das VD18-Projekt vorgestellt, das die Digitalisierung und Erschließung deutscher Drucke des 18. Jahrhunderts zum Ziel hat.