Mittwoch, 20. Mai 2026
Die vergangene Woche markierte einen Wendepunkt in der KI-Entwicklung: OpenAI setzte mit GPT-5.5 Instant neue Maßstäbe für Personalisierung, während ChatGPT erstmals Werbeanzeigen einführte. Gleichzeitig kündigte die EU wichtige Vereinfachungen beim AI Act an, und Microsoft expandierte seine Copilot-Funktionen deutlich. Diese Entwicklungen zeigen die rasante Kommerzialisierung und Regulierung der KI-Technologie gleichermaßen.
OpenAI hat am 5. Mai GPT-5.5 Instant als neues Standard-Modell für ChatGPT eingeführt. Das Modell bietet 52,5% weniger Halluzinationen in kritischen Bereichen wie Medizin und Recht sowie verbesserte Personalisierung durch Zugriff auf Chat-Verlauf, Dateien und Gmail.
GPT-5.5 Instant ersetzt GPT-5.3 Instant als Standard-Modell für alle ChatGPT-Nutzer und ist über die API als 'chat-latest' verfügbar. Die wichtigste Verbesserung liegt in der deutlich erhöhten Faktentreue - besonders in sensiblen Bereichen wie Medizin, Recht und Finanzen produziert das Modell über die Hälfte weniger falsche Aussagen. Zusätzlich führt OpenAI neue 'Memory Sources' ein, die Nutzern zeigen, auf welche vergangenen Gespräche oder Dateien das Modell zugreift. Die erweiterte Personalisierung ist zunächst für Plus- und Pro-Nutzer verfügbar und soll in den kommenden Wochen auf alle Pläne ausgeweitet werden. GPT-5.3 Instant bleibt für bezahlte Nutzer noch drei Monate verfügbar, bevor es eingestellt wird.
Am 7. Mai kündigte OpenAI drei neue Sprach-KI-Modelle an: GPT-Realtime-2 für intelligente Sprachinteraktion, GPT-Realtime-Translate für Echtzeitübersetzung in 70+ Sprachen und GPT-Realtime-Whisper für Streaming-Transkription.
Die neuen Realtime-Voice-Modelle markieren OpenAIs Vorstoß in professionelle Sprachanwendungen. GPT-Realtime-2 kombiniert GPT-5-Level-Intelligenz mit natürlicher Sprachverarbeitung und kann komplexe Anfragen bearbeiten sowie Gespräche eigenständig weiterführen. GPT-Realtime-Translate übersetzt Sprache von über 70 Eingabesprachen in 13 Ausgabesprachen in Echtzeit, während GPT-Realtime-Whisper Live-Transkription während des Sprechens ermöglicht. Die Preisgestaltung erfolgt minutenbasiert, wobei GPT-Realtime-Translate mit 0,034 US-Dollar pro Minute besonders für Kundensupport und Bildungsanwendungen interessant ist. Alle drei Modelle sind sofort über die Realtime API verfügbar.
Claude Opus 4.7 ist seit dem 16. April verfügbar und bringt deutliche Verbesserungen bei Software-Engineering-Aufgaben. Das Modell bietet erstmals High-Resolution-Bildverarbeitung bis 3,75 MP und neue Cybersecurity-Schutzmaßnahmen.
Claude Opus 4.7 stellt Anthropics neuestes und leistungsfähigstes allgemein verfügbares Modell dar. Besonders bei komplexen, langfristigen Coding-Aufgaben zeigt es erhebliche Fortschritte - in Anthropics 93-Task-Coding-Benchmark erreichte es 13% bessere Ergebnisse als Opus 4.6. Das Modell unterstützt erstmals Bilder mit einer Auflösung von bis zu 2.576 x 3.750 Pixeln und bietet verbesserte Vision-Fähigkeiten. Ein neuer Tokenizer führt zu 1-35% höheren Token-Kosten bei gleichem Text. Opus 4.7 includes automatisierte Cybersecurity-Schutzmaßnahmen, die riskante Anfragen blockieren. Für legitime Sicherheitsforschung gibt es ein neues Cyber Verification Program. Das Modell ist bei gleichem Preis wie Opus 4.6 verfügbar: 5 US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token.
Meta hat die ersten Modelle der Llama 4 Familie vorgestellt: Llama 4 Scout und Llama 4 Maverick nutzen erstmals eine Mixture-of-Experts-Architektur und bieten native Multimodalität mit bis zu 10 Millionen Token Kontext.
Die Llama 4 Serie markiert einen wichtigen Evolutionsschritt für Metas Open-Source-KI-Strategie. Llama 4 Scout mit 17 Milliarden aktiven Parametern und 16 Experten passt auf eine einzelne NVIDIA H100 GPU und bietet einen branchenführenden Kontext von 10 Millionen Token. Llama 4 Maverick mit 128 Experten übertrifft GPT-4o und Gemini 2.0 Flash in mehreren Benchmarks bei deutlich weniger aktiven Parametern. Beide Modelle wurden durch Destillation vom noch in der Entwicklung befindlichen Llama 4 Behemoth trainiert, einem 288-Milliarden-Parameter-Modell, das GPT-4.5 und Claude Sonnet 3.7 in STEM-Benchmarks übertrifft. Die Modelle sind bereits auf Hugging Face verfügbar und in Meta AI auf WhatsApp, Messenger und Instagram integriert.
OpenAI hat am 7. Mai angekündigt, Werbeanzeigen in ChatGPT für kostenlose und Go-Tier-Nutzer in den USA zu testen. Die Ads erscheinen am Ende von Antworten und sind klar als gesponserte Inhalte markiert.
OpenAI führt einen selbstbedienbaren Ads Manager ein und erweitert das ursprüngliche CPM-Modell um Cost-per-Click-Abrechnung. Die Werbeanzeigen werden kontextuell basierend auf Gesprächsthemen, vergangenen Chats und Nutzerinteraktionen ausgewählt. Werbetreibende erhalten nur aggregierte Leistungsdaten, keine Zugriff auf Chat-Inhalte oder persönliche Daten. Plus-, Pro-, Business- und Enterprise-Abonnements bleiben werbefrei. OpenAI betont, dass Anzeigen die ChatGPT-Antworten nicht beeinflussen und auf physisch getrennten Systemen laufen. Über 30 Kunden von Omnicom Media nehmen bereits am Pilotprogramm teil. Click-Through-Raten liegen laut Similarweb bei durchschnittlich 0,68%, bei Top-Brands bis zu 1,57%.
Google hat Gemini 3.1 für den Home-Assistenten eingeführt, der nun komplexe, mehrstufige Sprachbefehle verarbeiten kann. Das Update ist Teil des Mai-2026-Pakets für die Home-App und verbessert die KI-gestützte Hausautomatisierung erheblich.
Mit Gemini 3.1 kann der Google Home-Assistent dank fortschrittlicher Reasoning-Fähigkeiten komplexe Anfragen verstehen und mehrere Aufgaben in einem Befehl abarbeiten. Nutzer können beispielsweise Listen erstellen und gleichzeitig bestehende Einträge aktualisieren, ohne mehrere separate Befehle geben zu müssen. Die Verbesserung erstreckt sich auch auf die Steuerung von Smart-Home-Geräten, das Setzen von Alarmen, Erinnerungen und die Kalenderverwaltung. Das Update ist Teil einer umfassenderen Modernisierung der Google Home-App, die auch schnellere Kamera-Erfahrungen und neue web-basierte Steuerungen umfasst. Early-Access-Nutzer können die Gemini 3.1-Funktionen bereits testen.
Microsoft hat am 5. Mai Copilot Cowork für mobile Geräte angekündigt. Die Erweiterung ermöglicht es Nutzern, komplexe Aufgaben zu delegieren und unterwegs auszuführen, mit neuen Plugin-Integrationen von Partnern wie LSEG und Miro.
Copilot Cowork Mobile stellt einen wichtigen Schritt in Microsofts Vision der 'Frontier Firms' dar - Organisationen, die durch KI-Agenten unterstützt werden. Die mobile App ermöglicht es Nutzern, Aufgaben während der Fahrt, zwischen Meetings oder abseits des Schreibtisches zu delegieren und fertige Ergebnisse vorzufinden. Ein wachsendes Plugin-Ökosystem bringt Organisationsdaten und -tools in diese Erfahrungen ein, einschließlich nativer Plugins für Microsoft-Services wie Dynamics 365 und Fabric sowie Partner-Integrationen von LSEG, Miro, Monday.com und anderen. Microsoft positioniert dies als Übergang von isolierten KI-Aufgaben zu koordinierten, mehrstufigen Arbeitsabläufen. Das Update ist Teil einer breiteren Strategie zur Schaffung von Arbeitsplätzen, die gleichzeitig menschengeführt, agentengesteuert und ergebnisorientiert sind.
Googles Forschungsteam stellte auf der ICLR 2026 TurboQuant vor, einen Algorithmus zur drastischen Reduzierung des Memory-Overheads durch KV-Cache - einem der größten Flaschenhälse beim Betrieb großer KI-Modelle.
TurboQuant kombiniert PolarQuant-Vektorrotation mit der Quantized Johnson-Lindenstrauss-Kompressionsmethode in einem zweistufigen Prozess, um Modelle mit massiven Kontextfenstern deutlich effizienter zu betreiben. Der Durchbruch könnte den Übergang von reiner Parameter-Skalierung zu effizienz-fokussierter KI-Entwicklung beschleunigen und hat Auswirkungen sowohl auf On-Device-KI als auch auf Rechenzentrumskosten. Die Forschung zeigt, dass durch intelligente Kompression und Optimierung ähnliche Leistung mit deutlich geringerem Ressourcenverbrauch erreicht werden kann. Dies ist besonders relevant, da die Industrie zunehmend an die Grenzen der verfügbaren Rechenleistung stößt.
Aktuelle Forschungspapiere auf arXiv zeigen einen klaren Trend von reinen Sprachmodellen hin zu agentic AI-Systemen mit Weltmodell-Integration. Experten sehen 2026 als Durchbruchsjahr für zuverlässige Weltmodelle und kontinuierliches Lernen.
Die KI-Forschungslandschaft erlebt einen fundamentalen Wandel von der reinen Skalierung hin zu algorithmischer Effizienz und hybriden Architekturen. DeepMind-CEO Demis Hassabis und andere führende Forscher sehen die nächsten großen KI-Fortschritte in gezielten algorithmischen Durchbrüchen in Bereichen wie kontinuierliches Lernen, Speicherarchitekturen, Weltmodellen und hybride Systeme. 2026 gilt als Durchbruchsjahr für zuverlässige Weltmodelle und Prototypen für kontinuierliches Lernen, mit interaktiven Genie-ähnlichen Systemen in der Robotik. Die Forschung zeigt eine klare Bewegung von statischen Transformern zu dynamischen, speichererweiterten und selbstmodifizierenden Systemen, die sowohl effizienter als auch kapazitärer sind.
Der Stanford AI Index 2026 offenbart, dass KI-Tools für US-Verbraucher bereits einen geschätzten Wert von 172 Milliarden US-Dollar jährlich erreicht haben, wobei sich der Wert pro Nutzer zwischen 2025 und 2026 verdreifacht hat.
Der Bericht zeigt eine beispiellose KI-Adoption weltweit, mit überraschend hohen Raten in Singapur (61%) und den Vereinigten Arabischen Emiraten (54%), während die USA mit 28,3% auf Rang 24 liegen. Vier von fünf US-High-School- und College-Studenten nutzen inzwischen KI für schulbezogene Aufgaben, aber nur die Hälfte der Mittel- und Oberschulen haben KI-Richtlinien. KI hat klinische Anwendungen erreicht, mit Tools zur automatischen Generierung klinischer Notizen aus Patientenbesuchen, die 2025 weit verbreitet wurden. KI treibt auch wissenschaftliche Forschung voran und bewegt sich über ein reines Hilfsmittel hinaus hin zur tatsächlichen Entdeckung in der Wissenschaft. Ein bemerkenswerter Meilenstein: Erstmals führte KI eine komplette Wettervorhersage-Pipeline Ende-zu-Ende aus.
Am 7. Mai erreichten EU-Rat und Parlament eine vorläufige Einigung über den AI-Omnibus zur Vereinfachung des AI Act. Die Vereinbarung verschiebt Fristen für KI-Sandboxes und reduziert Anforderungen für kleinere Unternehmen.
Die EU-Gesetzgeber haben sich auf wichtige Änderungen am AI Act geeinigt, um die Umsetzung zu erleichtern und Innovation zu fördern. Die Frist für die Einrichtung von KI-Regulierungs-Sandboxes auf nationaler Ebene wird auf den 2. August 2027 verschoben. Die Übergangsfrist für Anbieter zur Implementierung von Transparenzlösungen für künstlich generierte Inhalte wird von sechs auf drei Monate reduziert, mit einer neuen Frist zum 2. Dezember 2026. Bestimmte regulatorische Ausnahmen, die bisher nur für kleine und mittlere Unternehmen galten, werden auch auf kleine Mid-Cap-Unternehmen ausgeweitet. Die Vereinbarung muss noch von Rat und Parlament offiziell angenommen werden, bevor sie in Kraft tritt. Die Änderungen zielen darauf ab, die Wettbewerbsfähigkeit zu stimulieren, während gleichzeitig die Sicherheitsstandards aufrechterhalten werden.
Mit der vollständigen Anwendbarkeit des AI Act am 2. August 2026 intensivieren sich die Vorbereitungen. Unternehmen müssen bis dahin Konformitätsbewertungen abschließen und Hochrisiko-Systeme registrieren.
Der EU AI Act tritt am 2. August 2026 vollständig in Kraft, was Unternehmen vor erhebliche Compliance-Herausforderungen stellt. Bis zu diesem Datum müssen alle Anbieter von Hochrisiko-KI-Systemen Konformitätsbewertungen abschließen, technische Dokumentation fertigstellen, CE-Kennzeichnung anbringen und ihre Systeme in der EU-Datenbank registrieren. Die Verordnung führt ein risikobasiertes System ein, das KI-Systeme nach ihrem Schadenspotential klassifiziert. Verbotene KI-Praktiken sind bereits seit Februar 2025 untersagt, während Governance-Regeln und Verpflichtungen für General Purpose AI-Modelle seit August 2025 gelten. Verstöße können mit Geldstrafen von bis zu 35 Millionen Euro oder 7% des weltweiten Jahresumsatzes geahndet werden. Nationale Behörden bereiten sich auf die Durchsetzung vor, und AI-Regulierungs-Sandboxes sollen ab 2027 verfügbar sein.
Der API-Markt erlebt eine beispiellose Preisschlacht, angeführt von DeepSeek V4 mit Preisen ab 0,07 US-Dollar pro Million Input-Token. Google und OpenAI reagieren mit eigenen Preisanpassungen und verbesserter Caching-Unterstützung.
Der KI-API-Markt von Mai 2026 zeigt eine dramatische Preisdifferenzierung zwischen Premium- und Budget-Modellen. DeepSeek V4 Flash führt mit nur 0,28 US-Dollar pro Million Output-Token - über 100-mal günstiger als GPT-5 mit 30 US-Dollar pro Million. Google reagierte am 1. April mit einer signifikanten Änderung der kostenlosen Tier-Politik: Pro-Modelle wie Gemini 3.1 Pro sind jetzt kostenpflichtig, während Flash-Modelle kostenlos mit reduzierten Quotas bleiben. Gemini 3.1 Pro bietet mit 2 Millionen Token das größte Kontextfenster unter Tier-1-Anbietern und 90% Rabatt auf gecachte Inhalte. OpenAIs neue Realtime-Modelle führen minutenbasierte Preisgestaltung ein. xAI kündigt für den 15. Mai die Einstellung mehrerer älterer Grok-Modelle an und führt ab dem 20. April Speichergebühren ein.
Microsoft führt zum 1. Mai Microsoft 365 E7 ein, eine neue Suite, die E5, Entra Suite, Copilot und Agent 365 kombiniert. Dragon Copilot erhält reduzierte Preise und vereinfachte Verbrauchsmodelle für medizinische Anwendungen.
Microsoft 365 E7, auch als 'Frontier Suite' bezeichnet, wird ab 1. Mai 2026 in Cloud Solution Provider-Kanälen für monatliche, jährliche und dreijährige Laufzeiten verfügbar. Die Suite kombiniert Microsoft 365 E5 für sichere Produktivität, Microsoft Entra Suite für Identitäts- und Zugriffskontrolle, Microsoft 365 Copilot für KI im Arbeitsfluss und Microsoft Agent 365 als Kontrollzentrum für Agent-Governance und -Skalierung. Dragon Copilot erhält ab 1. Mai reduzierte Listenpreise in allen verfügbaren Regionen, einschließlich USA, Kanada, Irland, Großbritannien und mehreren europäischen Ländern. Das Dragon Copilot Physician Practice-Angebot wird eingestellt, da Kunden nun über die Standard-Pro-User-Lizenz zum neuen Preispunkt Zugang zu allen Enterprise-Funktionen haben. Zusätzlich werden vereinfachte Verbrauchsgebühren für Ambient Encounters und generative KI-Funktionen eingeführt.
xAI wird am 15. Mai mehrere ältere Grok-Modelle einschließlich grok-4-1-fast und grok-4-fast einstellen. Gleichzeitig führt das Unternehmen ab 20. April Speichergebühren für Dateien und Sammlungen ein.
xAI konsolidiert sein Modellangebot durch die Einstellung älterer Versionen am 15. Mai um 12:00 PT. Betroffen sind grok-4-1-fast, grok-4-fast, grok-4, grok-code-fast-1 und grok-imagine-image-pro. Das Unternehmen empfiehlt Nutzern, auf Grok 4.3 zu migrieren, das als intelligentestes und schnellstes Modell positioniert wird. Parallel führt xAI neue Speichergebühren ein: Dateien und Sammlungen auf der xAI-Plattform werden ab 20. April basierend auf dem genutzten Speicherplatz berechnet. Datenübertragungen beim Herunterladen werden pauschal basierend auf der übertragenen Datenmenge berechnet. Die Batch-API bietet weiterhin 50% Rabatt auf Standard-Preise für Text- und Sprachmodelle, während Bild- und Videogenerierung zu Standardpreisen abgerechnet wird.
Die kommende Woche dürfte weitere Entwicklungen in der KI-Kommerzialisierung bringen, da mehr Unternehmen OpenAIs Werbemodell verfolgen könnten. Die EU-AI-Act-Vereinfachungen werden wahrscheinlich zu verstärkten Lobbying-Aktivitäten führen, während sich Unternehmen auf die August-Deadline vorbereiten. Im technischen Bereich erwarten Experten weitere Fortschritte bei Agentic AI und Weltmodellen, die 2026 als Durchbruchsjahr positionieren könnten.
Erhalte den KI Wochenreport kostenlos direkt in dein Postfach — jeden Montag.