Copilot, OpenAI, Google Gemini, Claude & KI aus China

Die vergangenen Wochen waren geprägt von einer ganzen Reihe spannender Entwicklungen rund um Microsoft Copilot, OpenAI, Google Gemini, Claude und neue KI-Modelle aus China. Besonders hervorheben möchte ich diesmal den Model Context Protocol (MCP) – ein Standard, der KI-Systeme in eine völlig neue Liga hebt. Dazu gleich mehr:

Microsoft Copilot: Von Excel-Formeln bis Outlook-Sidebar

Microsoft hat Copilot in den vergangenen Wochen mit einer Vielzahl an Funktionen ausgestattet, die direkt in den Arbeitsalltag hineinspielen:

  • Excel mit Copilot-Formel: Mit der neuen =COPILOT(...) Funktion können Daten gefiltert, kategorisiert oder priorisiert werden, ohne die Ursprungstabellen zu verändern. Beispiele sind das Auffinden von Duplikaten, Filtern von Gehältern unter 2.000 Euro oder die automatische Kategorisierung von Bewertungen. Copilot wird damit zu einer Art „Formel auf Steroiden“ – besonders stark bei Texten und Kategorien. Bei rein mathematischen Berechnungen sollte man vorsichtig sein, da LLMs hier fehleranfällig sind.

  • Outlook-Sidebar: Eine neue Copilot-Chat-Sidebar integriert E-Mails, Termine und Websuche. Man kann sich z. B. eine E-Mail live zusammenfassen lassen oder direkt aus dem Chat heraus eine Besprechung planen und mit einem Klick „Continue in Outlook“ starten.

  • Word Audio-Zusammenfassungen: Copilot kann nun auf Knopfdruck Audio-Überblicke zu Dokumenten erzeugen. Wer unterwegs oder nebenbei Inhalte konsumieren will, profitiert von diesem Feature enorm.

  • PowerPoint aus Excel: Tabellen können direkt in Präsentationen verwandelt werden – inklusive automatisch generierter Diagramme, die vorher nicht in der Excel-Datei enthalten waren.

  • Copilot Search: Eine neue Suchoberfläche kombiniert klassische Dateisuche mit Dialog-Funktion. Ergebnisse können direkt in Konversationen eingebunden und erläutert werden – ähnlich wie bei modernen Suchmaschinen mit KI-Unterstützung.

  • SharePoint Integration: Neue Web Parts wie der Agent Link oder ein FAQ-Modul machen es möglich, Agenten direkt auf Projektseiten einzubinden oder automatisch Fragen und Antworten aus Dokumenten zu generieren.

  • Consumer-Features im Rollout:
    • Memory: Personalisierte Einstellungen bleiben über Sessions hinweg gespeichert (z. B. Schreibstil).
    • Pages: Dauerhafte Arbeitsflächen (bis 18 Monate).
    • Podcasts: Aus Notizen oder Texten wird automatisch eine Podcast-Episode mit KI-Host erstellt.
    • Actions: Copilot führt reale Aktionen im Web aus (z. B. Hotelbuchungen).
    • Vision: On-Screen Assistance für Windows, Edge, iOS und Android (aktuell USA, UK folgt).

Damit wird Copilot endgültig von einem Assistenten für Einzelaufgaben zu einer Plattform, die sowohl im Business- als auch im Consumer-Bereich feste Strukturen schafft.

MCP – der Gamechanger

Ein besonderer Schwerpunkt dieser Ausgabe liegt auf dem Model Context Protocol (MCP).

MCP ist ein Standard, mit dem KI-Systeme direkt mit externen Tools, Datenbanken oder APIs interagieren können. Bisher war es meist so, dass Chatbots wie ChatGPT nur innerhalb ihrer eigenen Umgebung arbeiten konnten. Mit MCP ändert sich das grundlegend:

  • Tool-Anbindung: Eigene Systeme, Datenquellen oder Workflows können über MCP-Server angebunden werden.
  • Schreibaktionen: Neu ist, dass ChatGPT und andere MCP-fähige Modelle nicht nur lesen, sondern auch schreiben dürfen – natürlich nur nach expliziter Nutzerfreigabe.
  • Sicherheits-Gates: Jeder Zugriff wird geprüft, um Missbrauch (z. B. durch Prompt Injection) zu verhindern.

Das bedeutet in der Praxis: KI-Systeme werden zu echten Handlungsagenten. Sie greifen nicht nur auf Informationen zu, sondern können ganze Geschäftsprozesse automatisieren – vom Bearbeiten von Dateien bis zum Auslösen von Bestellungen.

Ich habe auf LinkedIn bereits mehrere Beiträge zu MCP veröffentlicht und dort gezeigt, wie dieser Ansatz die Brücke zwischen LLMs und Unternehmenssystemen schlagen kann. Jetzt wird das Ganze Realität: ChatGPT unterstützt MCP offiziell im Entwicklermodus, und auch andere Anbieter (z. B. Google Gemini) gehen in ähnliche Richtungen.

Für Unternehmen eröffnet das riesige Möglichkeiten: interne Datenanbindungen, Workflow-Automatisierung, sichere Einbettung in vorhandene IT-Strukturen. MCP ist aus meiner Sicht der größte Sprung seit Einführung von ChatGPT selbst.

OpenAI: Von Jobs bis Halluzinationen

OpenAI hat gleich mehrere Schlagzeilen produziert:

  • Jobplattform und Zertifizierungen: OpenAI will bis 2030 zehn Millionen Zertifizierungen vergeben und startet eine KI-Jobplattform in Kooperation mit Unternehmen wie Walmart, John Deere und Accenture. Der Schulterschluss mit der US-Politik zeigt, dass KI-Kompetenz offiziell als Wirtschaftsfaktor behandelt wird.
  • Halluzinations-Studie: Ein neues Paper erklärt, warum Sprachmodelle halluzinieren: Sie sind im Training darauf getrimmt, auch dann zu raten, wenn sie etwas nicht wissen (ähnlich wie in Multiple-Choice-Tests). Die Lösung: Bewertungsmetriken müssen angepasst werden, damit Modelle lernen, Unsicherheit zu kennzeichnen statt blind zu raten. Das könnte mittelfristig die Zuverlässigkeit von KI-Antworten erheblich verbessern.
  • Oracle-Deal: OpenAI schließt einen gigantischen Cloud-Vertrag (300 Mrd. US-Dollar) mit Oracle. Damit zieht Larry Ellison sogar an Elon Musk als reichster Mensch vorbei.
  • Hintergrund: OpenAI benötigt enorme Rechenleistung für GPT-5 und Nachfolgemodelle.
  • Worldcoin: Parallel wirbt Sam Altman neues Kapital ein (270 Mio. USD). Ziel: Bots bekämpfen und echte Nutzeridentitäten absichern – was in Zeiten von Fake-Accounts auf X, Reddit und YouTube dringender denn je erscheint.

Google, Gemini & NotebookLM

Google bleibt mit Gemini 2.5 Flash und Pro stark präsent:

  • Select & Ask: Nutzer können in Canvas direkt Elemente auswählen und bearbeiten – etwa in Präsentationen oder Mini-Apps.
  • Drive-OCR: Dokumente wie PDFs können strukturiert durchsucht und extrahiert werden.
  • Audio-Upload: Neu können Audiodateien direkt in Gemini hochgeladen und transkribiert werden.
  • NotebookLM: Flashcards und Quizfunktionen sind nun für alle verfügbar. Inhalte wie Vorlesungen oder Interviews lassen sich so in Lernkarten verwandeln.

Google baut damit das Angebot für produktives Arbeiten massiv aus – ein Bereich, in dem man bisher stark von Microsoft dominiert wurde.

Claude & Replit: Neue Werkzeuge für die Praxis

  • Claude 4 Sonnet: Kann nun direkt Dateien wie PowerPoint, Excel, Docs oder PDFs erstellen und bearbeiten. Bisher ist diese Funktion den Max- und Enterprise-Plänen vorbehalten, dürfte aber bald breiter ausgerollt werden. Für Unternehmen bedeutet das: KI erstellt nicht nur Text, sondern komplette Arbeitsdokumente.
  • Replit Agent 3: Ein neuer Meilenstein bei autonomen Agenten. Der Agent arbeitet selbstständig an Code-Projekten, führt Tests durch, findet Fehler und behebt sie – und kann sogar eigene Unter-Agenten erstellen, um Aufgaben zu verteilen. Das beschleunigt Softwareentwicklung erheblich.

Video- und Bild-KI: Konkurrenz für Google & Adobe

  • ByteDance Cdream 4.0: Das neue Bildmodell schlägt laut Benchmarks Googles „Nano Banana“ (Gemini 2.5 Flash Image).
  • Adobe integriert Nano Banana direkt in Photoshop – ein Signal, dass selbst große Player externe Modelle nutzen, wenn die eigenen (Firefly) nicht mithalten können.
  • Google Veo 3: Erzeugt Videos nun direkt in 1080p und spart 50 % Kosten. Besonders spannend für Creator, die Reels oder Shorts produzieren.
  • Kling AI Avatar: Erstellt realistische KI-Avatare.
  • Krea AI: Bietet erste Echtzeit-Video-Editing-Funktionen, wenn auch noch im Beta-Stadium.

Robotik: IPOs, Experimente und Ethik

  • Unitree: Plant für Q4 2025 einen IPO mit 7 Mrd. USD Bewertung. Gleichzeitig werden humanoide Roboter für nur 5.900 USD angekündigt – ein möglicher Gamechanger für den Markt.
  • China: Neue Modelle wie der „K2 Bumblebee“ von Kepler Robotics zeigen realistischeren Gang; Xquare Robot stellt ein Open-Source-Framework vor; Kaiwa Technology präsentiert das ethisch brisante Konzept eines Schwangerschaftsroboters.
  • Tesla: Elon Musk verspricht erneut schnelle Fortschritte mit Optimus – Experten bleiben skeptisch.
  • NASA: Testet „künstliche Astronauten“ für Marsmissionen.
  • Robian R1 (Ant Group): Roboter-Koch in ersten Demos.

Stimmen & Debatten

  • Geoffrey Hinton (KI-Pionier) warnt erneut vor massiven Jobverlusten – diesmal besonders in intellektuellen Routinetätigkeiten wie Kanzlei-Assistenz oder Callcentern.
  • Proteste: Erste Hungerstreiks vor den Büros von Google DeepMind und Anthropic. Auch wenn der symbolische Wert zweifelhaft ist, zeigt es die wachsende gesellschaftliche Spannung.
  • Google vs. Nvidia: Googles TPUs gelten als mögliche Alternative zu Nvidias dominanter CUDA-Architektur. Die Nachfrage soll um 96 % gestiegen sein.

Fazit

Die aktuelle KI-Welle zeigt zwei Trends: Einerseits werden die Tools alltagstauglicher und direkter in unsere Arbeitsumgebungen integriert (Copilot, Gemini, Claude). Andererseits entstehen tiefgreifende technische Standards wie MCP, die den Einsatz von KI in Unternehmen grundlegend verändern werden.

Gerade MCP verdient besondere Beachtung: Es öffnet die Tür zu einer Welt, in der KIs nicht mehr isolierte Assistenten sind, sondern aktive Agenten, die direkt mit Unternehmenssystemen arbeiten. Ich habe auf LinkedIn dazu bereits einige Beiträge geteilt – und die Entwicklungen der letzten Wochen bestätigen: MCP wird zu einem Standard, den wir alle im Auge behalten sollten.

Für Unternehmen heißt das: Jetzt ist die Zeit, sich vorzubereiten. Wer MCP, Copilot oder Gemini früh integriert, kann Prozesse beschleunigen, Kosten senken und sich Wettbewerbsvorteile sichern.