Kapitel 1–2 · Einführung
Gestatten, Data – Big Data
Was Big Data wirklich bedeutet – Google Trends, echte Use Cases und die fundamentalen Konzepte verteilter Systeme: CAP-Theorem, Konsistenzmodelle, Fehlertoleranz. Der Startschuss.
Google TrendsCAP-TheoremDistributed SystemsPython
Kapitel 3–6 · Daten
Daten, Formate & Management
Von Rohdaten zu strukturiertem Wissen: CSV, JSON, Parquet und Avro im direkten Vergleich. Big-Data-Management-Konzepte und Vorgehensmodelle für echte Projekte.
ParquetAvroPyArrowPandas
Kapitel 7–10 · Architektur
Warehouse, Lake, Lakehouse & Mesh
DuckDB, Delta Lake, Data Mesh Manager – alle vier Architektur-Paradigmen praxisnah erklärt. Mit klaren Entscheidungshilfen für Architekten.
DuckDBDelta LakeData MeshSternschema
Kapitel 11 · NoSQL
NoSQL – Sieben Welten
Redis, MongoDB, Neo4j, Cassandra, InfluxDB, Milvus, ArangoDB, OpenSearch – jede für ihren Zweck. Mit Entscheidungshilfen, die den Unterschied machen.
RedisMongoDBNeo4jCassandraMilvus
Kapitel 12–13 · Stream & Batch
Kafka, Spark & Flink
Apache Kafka für Streams, Spark und Flink für verteilte Berechnungen, Hadoop und Ignite für Batch. Vollständig mit Java- und Python-Code – kein Schönwetter-Tutorial.
Apache KafkaApache SparkApache FlinkHadoop
Kapitel 14 · Algorithmen
Skalierbare Algorithmen
Morris-Counter, HyperLogLog, Bloom-Filter, t-digest – Algorithmen in konstantem Speicher für Milliarden Datenpunkte. Das sind die Tricks, die große Systeme erst möglich machen.
HyperLogLogBloom Filtert-digestJava
Kapitel 15–16 · Analyse
Visualisierung & Architekturwissen
Matplotlib, Seaborn, ggplot2 für aussagekräftige Visualisierungen. Echtzeit-Monitoring. Und das konzeptuelle Fundament für skalierbare Big-Data-Systemarchitekturen.
Matplotlibggplot2SeabornR
Kapitel 17 · DevOps
Test & Betrieb mit Kubernetes
Testing-Strategien, Monitoring und Kubernetes mit minikube. Weil ein System, das man nicht betreiben kann, kein gutes System ist.
KubernetesDockerminikubeMonitoring
Kapitel 18 · Künstliche Intelligenz
LLMs, RAG, Agenten & MCP
Training, RAG, autonome Agenten, Model Context Protocol. Das letzte Kapitel ist das mutigste – und zeigt, was passiert, wenn Big Data auf moderne KI trifft.
LLMsRAGAI AgentsMCPFine-Tuning