Mittwoch, 22. April 2026
Die 17. Kalenderwoche 2026 markiert einen Wendepunkt in der KI-Landschaft: Mit GLM-5.1 übertrifft erstmals ein Open-Source-Modell alle geschlossenen Systeme auf wichtigen Coding-Benchmarks, während Google seine kostenlose Gemini-Tier einschränkt und Microsoft seine Preise erhöht. Gleichzeitig beschleunigt die EU-KI-Verordnung auf ihre vollständige Anwendbarkeit im August zu, während die Trump-Administration ihren Kurs der bundesstaatlichen KI-Konsolidierung fortsetzt.
Z.ai veröffentlichte am 7. April GLM-5.1 unter MIT-Lizenz und erreichte 58,4% auf SWE-Bench Pro – mehr als GPT-5.4 (57,7%) und Claude Opus 4.6 (57,3%).
Das 754-Milliarden-Parameter-Modell mit Mixture-of-Experts-Architektur markiert einen historischen Wendepunkt: Erstmals übertrifft ein vollständig offenes KI-Modell die besten geschlossenen Systeme auf einem wichtigen Software-Engineering-Benchmark. GLM-5.1 wurde komplett auf Huawei Ascend-Chips ohne amerikanische Hardware trainiert und kann autonome Coding-Sessions bis zu acht Stunden durchführen. Die MIT-Lizenz erlaubt kommerzielle Nutzung ohne Einschränkungen. Z.ai, das im Januar 2026 als erstes KI-Unternehmen an die Börse ging, demonstriert damit die zunehmende Wettbewerbsfähigkeit chinesischer KI-Entwicklung.
Anthropic bestätigte die Existenz von Claude Mythos, ihrem leistungsstärksten Modell, beschränkt den Zugang jedoch auf 50 Organisationen wegen Cybersicherheitsrisiken.
Claude Mythos erreichte 83,1% auf dem CyberGym-Benchmark und identifizierte Tausende von Zero-Day-Vulnerabilitäten in wichtigen Betriebssystemen und Browsern. Das Modell ist so mächtig beim Finden von Sicherheitslücken, dass Anthropic es für zu gefährlich für die Öffentlichkeit hält. Nur 50 ausgewählte Organisationen im Project Glasswing erhalten Zugang, um ihre eigene Infrastruktur defensiv zu scannen. Diese Entscheidung zeigt die wachsenden Spannungen zwischen KI-Fortschritt und Sicherheitsbedenken und etabliert eine neue Kategorie von 'restricted-access defensive AI'.
Meta stellte am 8. April Muse Spark vor, ihr erstes proprietäres KI-Modell seit Jahren, und bricht damit die bisherige Open-Source-Strategie.
Nach drei Jahren des Aufbaus von Open-Source-Glaubwürdigkeit durch die Llama-Serie markiert Muse Spark einen strategischen Wendepunkt für Meta. Das Modell, ursprünglich unter dem Codenamen 'Avocado' entwickelt, stammt aus Meta Superintelligence Labs unter der Leitung von Alexandr Wang, der für 14,3 Milliarden Dollar von Scale AI geholt wurde. Der Strategiewechsel reflektiert den enormen Wettbewerbsdruck durch OpenAI, Anthropic und Google. Meta investiert zwischen 115-135 Milliarden Dollar in KI-Infrastruktur für 2026 – fast das Doppelte des Vorjahres.
Nvidia verstärkt seine Partnerschaft mit Marvell Technology durch eine 2-Milliarden-Dollar-Investition für Memory Processing Units und verbesserte KI-Infrastruktur.
Die Investition zielt auf die Entwicklung von Memory Processing Units ab, die neben TPUs arbeiten, sowie auf neue TPUs für KI-Modell-Inferenz. Marvell war bereits ein wichtiger Akteur im Datacenter-Stack, aber diese Vereinbarung positioniert das Unternehmen tiefer im Kern der KI-Infrastruktur. Der Deal unterstreicht, dass KI-Infrastruktur-Ausgaben über reine GPU-Investitionen hinausgehen. Die Gewinner in diesem Zyklus werden Unternehmen sein, die Bandbreiten- und Latenzprobleme innerhalb riesiger Cluster lösen, da Modelltraining und -inferenz davon abhängen, wie effizient Tausende von Chips miteinander kommunizieren können.
Google Research stellte TurboQuant vor, einen Algorithmus der KV-Cache um bis zu 6x komprimiert und 8x schnellere Attention-Berechnungen ermöglicht – ohne Genauigkeitsverlust.
TurboQuant adressiert den größten Memory-Bottleneck bei LLM-Inferenz: den Key-Value-Cache, der bei langen Kontexten mehr Speicher als die Modellgewichte selbst benötigt. Der Algorithmus komprimiert KV-Cache-Werte auf nur 3,5 Bits pro Wert bei nahezu null Genauigkeitsverlust. Bei 128K-Token-Kontexten sinkt der Speicherbedarf von 40GB auf 6,7GB. Die Technologie verwendet eine zweistufige Kompression mit PolarQuant-Rotation und Quantized Johnson-Lindenstrauss-Transform. Das Paper wird bei ICLR 2026 im April präsentiert, eine offizielle Implementierung wird für Q2 2026 erwartet.
Das von Andrej Karpathy popularisierte 'Vibe Coding' wird zum Standardverfahren, bei dem Entwickler gewünschte Anwendungsvibes beschreiben und KI-Agenten Implementation, Testing und Deployment übernehmen.
Vibe Coding repräsentiert einen Paradigmenwechsel von traditioneller Programmierung zu natürlichsprachlicher Anwendungsbeschreibung. Entwickler beschreiben das gewünschte Verhalten oder 'Vibe' einer Anwendung, während KI-Agenten die gesamte technische Umsetzung übernehmen. Dieser Trend wird durch Fortschritte in agentic workflows und die Entdeckung interner Emotion-Vektoren in KI-Modellen ermöglicht, die eine nuanciertere Interpretation von Nutzerwünschen erlauben. Die Entwicklung demokratisiert Software-Erstellung, erhöht aber auch die Verantwortung von Senior-Entwicklern als High-Level-Architekten und Validatoren.
Die EU KI-Verordnung tritt am 2. August 2026 vollständig in Kraft, mit neuen Transparenzregeln und der Verpflichtung für jeden Mitgliedsstaat, mindestens eine KI-Regulatory Sandbox zu etablieren.
Der 2. August 2026 markiert einen Meilenstein für die EU KI-Verordnung: Die meisten verbleibenden Bestimmungen werden anwendbar, einschließlich Transparenzregeln für KI-generierte Inhalte und Kennzeichnungspflichten für Deepfakes. Jeder EU-Mitgliedsstaat muss bis zu diesem Datum mindestens eine KI-Regulatory Sandbox betreiben. Die Regeln für Hochrisiko-KI-Systeme als Sicherheitskomponenten regulierter Produkte folgen am 2. August 2027. Unternehmen sollten ihre KI-Systeme inventarisieren und gegen die Risikostufen der EU KI-Verordnung klassifizieren, während sie gleichzeitig Compliance-by-Design in ihre Entwicklungsprozesse einbauen.
Senatorin Marsha Blackburn stellte den Trump America AI Act vor, der Trumps Dezember-2025-Executive Order zur bundesstaatlichen KI-Konsolidierung kodifizieren soll.
Der am 18. März 2026 vorgestellte Gesetzentwurf zielt darauf ab, den Flickenteppich staatlicher KI-Gesetze zu konsolidieren und amerikanische KI-Unternehmen vor als übermäßig betrachteten Regulierungen zu schützen. Eine neue Litigation Task Force soll staatliche Regelungen anfechten, die als innovationshemmend betrachtet werden. Die Regierung prüft auch, ob Bundesförderungen an die Einhaltung des bundesstaatlichen KI-Rahmenwerks geknüpft werden können. Gleichzeitig steigen die Spannungen mit EU-Partnern über deren KI-Regulierung amerikanischer Tech-Unternehmen, wobei die Trump-Administration droht, US-Unternehmen mit ihren Verhandlungsmächten zu verteidigen.
Google entfernte am 1. April alle Pro-Modelle (Gemini 3.1 Pro, 3 Pro, 2.5 Pro) aus der kostenlosen API-Tier und beschränkt Free-Nutzer auf Flash-Modelle mit reduzierten Kontingenten.
Die Änderung erfolgte ohne formelle Ankündigung und wurde nur durch API-Fehlermeldungen und aktualisierte Preisdokumentation bekannt. Gemini 3.1 Pro kostet nun 2,00/12,00 Dollar pro Million Tokens (bis 200K Kontext) und 4,00/18,00 Dollar darüber – gleichauf mit GPT-5.4. Flash und Flash-Lite bleiben kostenlos verfügbar, aber mit stark reduzierten täglichen Kontingenten. Für Nutzer, die kostenlosen Pro-Tier-Zugang benötigen, bleibt nur noch Claudes 5-Dollar-Testguthaben als Alternative. Die Änderung spiegelt Googles Strategie wider, Premium-Modelle zu monetarisieren, während Prototyping-Optionen erhalten bleiben.
Microsoft kündigte eine 20%ige Preisreduktion für Windows 365 Business an, die am 1. Mai 2026 für neue Kunden und bei Verlängerungen für Bestandskunden wirksam wird.
Die Preissenkung wird von einer neuen On-Demand-Start-Erfahrung begleitet: Cloud-PCs bleiben nach Disconnect oder Abmeldung eine Stunde eingeschaltet, gehen dann aber in einen Hibernation-Modus über. Reconnects nach mehr als einer Stunde können etwas länger dauern, während Performance und Funktionalität unverändert bleiben. Diese Änderung macht Cloud-PCs für kleine und mittlere Unternehmen zugänglicher, da diese oft mit höheren Kosten für Kauf und Wartung traditioneller Computer konfrontiert sind. Die Preisreduktion ist Teil von Microsofts breiterer Strategie, Cloud-basierte Desktops als Alternative zu fördern.
Die kommende Woche wird zeigen, ob GLM-5.1s Durchbruch andere Open-Source-Entwickler zu ähnlichen Leistungssprüngen motiviert und wie die Industrie auf Anthropics restriktive Mythos-Strategie reagiert. Googles TurboQuant-Implementierung könnte die Speicher-Ökonomie der KI-Inferenz grundlegend verändern, während die bevorstehende EU-KI-Verordnung Unternehmen zu finalen Compliance-Vorbereitungen drängt. In den USA werden die Spannungen zwischen bundesstaatlicher Konsolidierung und staatlicher KI-Regulierung wahrscheinlich zunehmen.
Erhalte den KI Wochenreport kostenlos direkt in dein Postfach — jeden Montag.