Daten und Infrastruktur: Was du brauchst
Welche Daten und Infrastruktur braucht dein KMU fuer KI? Weniger als du denkst — aber anders als du denkst.
Premium-Kursinhalt
Diese Lektion gehört zu einem Premium-Kurs. Upgrade auf Pro, um alle Premium-Kurse und Inhalte freizuschalten.
- Zugang zu allen Premium-Kursen
- 1000+ KI-Skill-Vorlagen inklusive
- Jede Woche neue Inhalte
🔄 Kurzer Rueckblick: In Lektion 4 hast du dein erstes KI-Pilotprojekt geplant — mit Scope, KPIs, Budget und den haeufigsten Fallstricken. Jetzt schauen wir uns an, was du an Daten und Infrastruktur wirklich brauchst.
„Wir haben nicht genug Daten fuer KI" — das hoere ich von 8 von 10 KMU. In den meisten Faellen stimmt es nicht. Du hast wahrscheinlich mehr brauchbare Daten als du denkst — und brauchst weniger als du glaubst.
Die drei KI-Daten-Szenarien fuer KMU
| Szenario | Eigene Daten noetig? | Beispiel | Aufwand |
|---|---|---|---|
| Vortrainierte Modelle nutzen | Nein — Out-of-the-box | Chatbot, Texterstellung, Uebersetzung | Niedrig |
| Vortrainierte Modelle anpassen | Wenige hundert Beispiele | Bildklassifikation, Dokumenten-Kategorisierung | Mittel |
| Eigenes Modell trainieren | Tausende bis Zehntausende | Nachfrageprognose, Predictive Maintenance | Hoch |
Gute Nachricht: 60-70% der typischen KMU-Anwendungsfaelle fallen in Szenario 1 oder 2.
Datenqualitaet ist wichtiger als Datenmenge
| Qualitaetsdimension | Frage | Pruefung |
|---|---|---|
| Vollstaendigkeit | Fehlen wichtige Felder? | Stichprobe: >95% der Felder gefuellt? |
| Konsistenz | Gleiche Sache, verschiedene Bezeichnungen? | „GmbH" vs „GMBH" vs „G.m.b.H." |
| Aktualitaet | Wie alt sind die Daten? | Letzte Aktualisierung? |
| Format | Maschinenlesbar? | CSV/JSON/API vs PDF-Scans |
| Duplikate | Mehrfacheintraege? | Datenbereinigung noetig? |
✅ Quick Check: Was ist schlimmer fuer ein KI-System: Zu wenige Daten oder schlechte Daten? (Tipp: Schlechte Daten — weil KI aus ihnen die falschen Muster lernt. Zu wenige Daten fuehren zu schwacher Performance, schlechte Daten fuehren zu falschen Entscheidungen.)
Cloud vs. On-Premise: Die Entscheidungsmatrix
| Kriterium | Cloud | On-Premise |
|---|---|---|
| Kosten (Start) | Niedrig (pay-per-use) | Hoch (Hardware + Software) |
| Kosten (laufend) | Skaliert mit Nutzung | Fixkosten + Wartung |
| Skalierbarkeit | Sofort | Begrenzt durch Hardware |
| Datenschutz | Daten verlassen das Unternehmen | Daten bleiben intern |
| DSGVO | AVV + EU-Verarbeitung sicherstellen | Einfacher zu kontrollieren |
| Time-to-Market | Sofort verfuegbar | Wochen bis Monate Aufbau |
| Wartung | Anbieter uebernimmt | Eigenes Team noetig |
Empfehlung fuer die meisten KMU: Cloud-First — mit klaren DSGVO-Massnahmen (AVV, EU-Datenverarbeitung, verschluesselte Uebertragung). On-Premise nur bei regulatorischen Anforderungen oder besonders sensiblen Daten.
Daten-Checkliste fuer den KI-Piloten
Vor dem Pilot-Start pruefen:
- Welche Daten braucht der Anwendungsfall konkret?
- Wo liegen diese Daten (welches System)?
- In welchem Format sind sie (strukturiert/unstrukturiert)?
- Wie ist die Datenqualitaet (Stichprobe pruefen)?
- Gibt es eine API oder einen Export-Weg?
- Wer ist Dateneigentuemer / wer gibt Zugriff frei?
- Sind personenbezogene Daten dabei (DSGVO-Pruefung)?
- Reicht die Datenmenge fuer den Anwendungsfall?
Key Takeaways
- Drei Szenarien: Vortrainiert nutzen (keine Daten), anpassen (wenig Daten), selbst trainieren (viele Daten)
- 60-70% der KMU-Anwendungsfaelle brauchen keine eigenen Trainingsdaten
- Datenqualitaet > Datenmenge — schlechte Daten sind schlimmer als wenige Daten
- Cloud-First fuer die meisten KMU — mit klaren DSGVO-Massnahmen
- Pragmatisch verbinden: Nur die Daten fuer den Piloten verknuepfen, nicht alles auf einmal
Up Next
In der naechsten Lektion geht es um die wichtigste Ressource: Menschen. Wer macht KI in deinem KMU — intern, extern oder hybrid?
Wissenscheck
Erst das Quiz oben abschließen
Lektion abgeschlossen!