📊 100 KI-Artikel ‱ 37 Feeds durchsucht ‱ 598 Artikel geprĂŒft
đŸ·ïž Filter:

KI-gestĂŒtzte Übersicht aktueller Entwicklungen in der KĂŒnstlichen Intelligenz

aus den folgenden Quellen: AI Business, AI News, Ars Technica AI, Google AI Blog, MIT Technology Review, MarktechPost, OpenAI Blog, TechCrunch AI, arXiv AI Papers

News & Industrie

TechCrunch AI

ClickUp kĂŒrzt 22 % Personal, Box kritisiert AI‑Psychose bei Arbeitsplatzverlust.

Unternehmen ersetzen ArbeitsplĂ€tze durch AI‑Agenten, was zu massiven Entlassungen und nachhaltigen ArbeitsweltverĂ€nderungen fĂŒhrt.

Weiterlesen
TechCrunch AI

Groq startet $650M-Finanzierungsrunde, fokussiert sich auf KI-Inferenz.

Groq investiert 650 Millionen USD in AI-Inferenz, fokussiert auf effiziente Chips, NVIDIA betont Nachfrage.

Weiterlesen
TechCrunch AI

Ende der Bewerbung fĂŒr Sprecher beim TechCrunch Disrupt 2026.

TechCrunch Disrupt 2026 ruft KI-Unternehmen zum Einreichen von Sessions auf, fokussiert Innovation.

Weiterlesen
TechCrunch AI

Letzte 24 Stunden: TechCrunch Disrupt 2026 Ticket um 410 $ sparen.

TechCrunch Disrupt 2026: Early‑Bird-Angebote enden um 23:59 PT, ermöglichen bis zu 410 $ Ersparnis fĂŒr 10.000+ Tech-FĂŒhrungskrĂ€fte.

Weiterlesen
TechCrunch AI

Box-GrĂŒnder Aaron Levie kritisiert CEO's KI-Optimismus bei ClickUp.

Levie warnt vor KI‑Psychose durch 22 % ClickUp‑Entlassungen und kritisiert mangelndes RollenverstĂ€ndnis.

Weiterlesen
TechCrunch AI

XCENA sammelt 135 Millionen USD: Speicher, nicht Rechenleistung, limitiert KI.

XCENA entwickelt speicherbasierte KI-Lösungen, erhielt 135 Mio. USD von Samsung & Softbank, bewertet 570 Mio. USD, nutzt 3‑D‑Stacked HBM‑Module.

Weiterlesen
Ars Technica AI

Startup liefert kostenlose Hausreinigung im Austausch fĂŒr Robotentraining‑Daten.

Ein Startup startet ein Human-in-Loop-Programm, um durch Kameradaten die Navigation von Haushaltsrobotern zu verbessern.

Weiterlesen
AI Business

Waymo prÀsentiert neues Robotaxi nach vier Jahren Entwicklung.

Waymo prĂ€sentiert Modell 2, ein autonomes Taxi mit verbesserter Sensorik und KI-Perzeption.

Weiterlesen
OpenAI Blog

Boston Children’s Hospital nutzt OpenAI, diagnostiziert ĂŒber 40 seltene Krankheiten.

OpenAI-Technologie verbessert Patientenversorgung im Boston Children's Hospital durch GPT‑4, DALL‑E‑3, reduziert BĂŒrokratie.

Weiterlesen
MIT Technology Review

Neues Lithium-Extraktionsverfahren senkt Kosten und Emissionen.

Ein neuer Lithium‑Extraktionsprozess senkt Kosten, Emissionen und stĂ€rkt Versorgungssicherheit fĂŒr Elektroautohersteller.

Weiterlesen
MIT Technology Review

Bundibugyo-Virus: tödlicher Ebola-Ausbruch in Ituri, DRC.

Vier Gesundheitsarbeiter starben bei Bundibugyo-Ebola-Ausbruch, WHO startet Maßnahmen inklusive Kontaktverfolgung, Impfungen und KI-Dashboards.

Weiterlesen
MIT Technology Review

Papst Leo XIV fordert im Enzyklika 'Magnifica Humanitas' Handeln gegen KI.

Pope Leo XIV fordert ethisches KI-Handeln, Mut, SolidaritĂ€t fĂŒr verantwortungsbewusste VerĂ€nderung, inklusive OpenAI, Microsoft, Google.

Weiterlesen

Modelle & Releases

AI News

Anthropic prĂ€sentiert Claude Opus 4.8: Verbesserte Codierung, Agentenarbeit und Wissensaufgaben.

Anthropic prĂ€sentiert Claude Opus 4.8: bessere Coding-, Agenten- und Wissensleistung, sicherer, API, Wettbewerbsvorteil.

Weiterlesen
MarktechPost

NVIDIA prĂ€sentiert X-Token, ĂŒbertrifft GOLD um 3,82 Punkte bei Llama-3.2-1B.

NVIDIA prĂ€sentiert X-Token, ein Cross‑Tokenizer, der LLM-Leistung steigert und Genauigkeit erhöht.

Weiterlesen
MarktechPost

StepFun stellt Step 3.7 Flash vor: 198B MoE Vision‑Language Modell fĂŒr Coding Agents.

StepFun prĂ€sentiert Step 3.7 Flash, ein 198‑Billionen‑Parameter MoE Vision‑Language‑Modell mit Bildverarbeitung, Advisor-Modus und Coding‑Agenten‑Fokus.

Weiterlesen
Google AI Blog

Google demonstriert Gemini Omni und Gemini 3.5: Neun Videos zeigen Funktionsumfang.

Google prÀsentiert Gemini Omni und 3.5, multimodale KI, die Dialoge, Bild, Text und Code lösen.

Weiterlesen

Tools & Produkte

TechCrunch AI

Cognition Wu: Devin AI‑Coder ersetzt nicht Menschen.

Cognition prĂ€sentiert Devin, KI‑Coding-Agent, der Code generiert, refaktoriert, ergĂ€nzt, nicht ersetzt, nutzt Open‑Source.

Weiterlesen
TechCrunch AI

Kiwibit prĂ€sentiert KI-gesteuerten Vogeltröster fĂŒr dein Hinterhof.

Kiwibits bietet einen KI‑gestĂŒtzten VogelfĂŒtterer, der Arten erkennt und Daten zur PopulationsĂŒberwachung sendet.

Weiterlesen
AI Business

Robinhood plant KI-Agenten fĂŒr Handel und Ausgaben.

Robinhood entwickelt GPT‑4-Agenten, um Handel und Zahlungen automatisiert zu erleichtern, trotz Regulierungsherausforderungen.

Weiterlesen
MarktechPost

UC Berkeley prĂ€sentiert mKernel: Multi‑GPU, Multi‑Node NVLink‑RDMA‑CUDA‑Fusion.

mKernel bĂŒndelt NVLink, RDMA und Dense Compute, senkt Latenz, erhöht Bandbreite, steigert KI‑Effizienz.

Weiterlesen
MarktechPost

Hexo Labs stellt SIA vor: Selbstverbessernder Agent fĂŒr gpt-oss-120b.

Hexo Labs stellt MIT-lizenzierten SIA-Tool vor, das mit Feedback-Mechanismen Modelle optimiert.

Weiterlesen

Tutorials & Praxis

TechCrunch AI

Glossar: Die wichtigsten KI-Begriffe erklÀrt.

TechCrunch definiert 30 KI-Begriffe, erklÀrt Modelle, fokussiert Unternehmen, erleichtert Kommunikation und RisikoabschÀtzung.

Weiterlesen
MarktechPost

Python-Tutorial: AgentTrove liefert 1,7 M Agent-Traces im Open‑Source‑Format.

MarkTechPost demonstriert Streaming, Normalisierung, Analyse und Export von 1,7 Millionen AgentTrails fĂŒr effizientes SFT und Speicherersparnis.

Weiterlesen
MarktechPost

Ansible-Lab in Google Colab: Playbooks, Inventories und benutzerdefinierte Module.

Ansible-Lab in Google Colab zeigt Installation, Konfiguration, Inventories, Variablen, Custom‑Modules, praktisch fĂŒr Administratoren.

Weiterlesen
OpenAI Blog

Braintrust beschleunigt Codeentwicklung mit Codex und GPT‑5,5.

Braintrust-Engineers beschleunigen Entwicklung um 30‑40 % dank Codex und GPT‑5.5.

Weiterlesen
Google AI Blog

Google AI Studio prĂ€sentiert I/O 2026 Quiz.

Google prĂ€sentiert interaktives Quiz mit AI Studio, generiert Code-Beispiele und fĂŒhrt Entwickler spielerisch durch Features.

Weiterlesen

Business & Automation

AI News

OpenAI prĂ€sentiert Governance-Framework fĂŒr sichere KI-EinfĂŒhrung.

OpenAI veröffentlicht Governance‑Framework fĂŒr KI‑Sicherheit, Compliance, Skalierung und Datenethik in Unternehmen.

Weiterlesen
AI Business

Anthropic prĂ€sentiert Opus 4.8: KI fĂŒr komplexe Unternehmensworkflows.

Anthropic prĂ€sentiert Opus 4.8: verbesserte Leistung, Sicherheit und Kundenfokus fĂŒr maßgeschneiderte KI-Deployments.

Weiterlesen

Wissenschaft & Forschung

TechCrunch AI

GitHub Copilot: Entwickler verweigern Arbeit ohne KI, Risiken im Anmarsch.

KI‑gestĂŒtzte Codegenerierung beschleunigt, doch QualitĂ€tsprobleme und Sicherheitsrisiken fordern strengere Tests.

Weiterlesen
Google AI Blog

Waterloo-Studenten entwickeln KI-Prototypen im Futures Lab.

Waterloo-Studenten entwickeln KI-Prototypen fĂŒr inklusives Lernen und Arbeitsoptimierung mit Google AI und Unternehmen.

Weiterlesen
arXiv AI Papers

Behavior‑induzierte Mirror‑Prox‑TD‑Methode STHTD‑MP beschleunigt Off‑Policy-Vorhersagen.

STHTD‑MP verbessert Saddle‑Point-Geometrie, erhöht Konvergenz, erzielt bessere Benchmarks, erkennt Baird‑Kontra-Beispiel.

Weiterlesen
arXiv AI Papers

BA‑TDC und BA‑TDRC verbessern StabilitĂ€t beim Off‑Policy‑TD‑Lernen.

BA‑TDC und BA‑TDRC verbessern off‑policy Lernen und ĂŒbertreffen bestehende Methoden.

Weiterlesen
arXiv AI Papers

Cognitive Categorical Transformer (306 M‑Parameter) verbessert GPT‑2‑Small um 12 %.

Der 306‑Mio‑Parameter‑CCT verbessert die WikiText‑103‑PerplexitĂ€t um 12 % dank GPT‑2 Small Backbone und Module.

Weiterlesen
arXiv AI Papers

URIEL: Drohnen‑gestĂŒtzte, nachhaltige Logistik fĂŒr tropische WĂ€lder.

KI‑gestĂŒtzte Forstwirtschaft in Tropen nutzt Heli‑Logging, Robotik, Drohnen, ohne NebenschĂ€den, hohe RentabilitĂ€t, erfordert Kooperation.

Weiterlesen
arXiv AI Papers

LLM-Review-Tests zeigen unzureichende Übereinstimmung bei ACL Rolling Review.

LLM-gestĂŒtzte Peer-Reviews verbessern bis zu 35 % der Manuskripte, zeigen variabel akzeptable Übereinstimmung.

Weiterlesen
arXiv AI Papers

Neues Verfahren zur orthogonalen Konzeptlöschung steigert Diffusionsmodelle.

Orthogonal Concept Erasure verbessert Diffusionsmodelle, löscht Konzepte prÀzise, erhÀlt QualitÀt.

Weiterlesen
arXiv AI Papers

LLM-Agenten lösen die Ontologie-HĂŒrde bei natĂŒrlichen PhĂ€notypen.

LLM‑Agenten erreichen menschliche Konsistenz bei PhĂ€notyp‑Annotationen und ĂŒbertreffen Semantic CharaParser.

Weiterlesen
arXiv AI Papers

VFEAgent automatisiert Finite‑Elemente‑Analyse mittels multimodaler Agenten.

VFEAgent automatisiert FEA aus Bildern, nutzt Vision‑Language‑Modell und verifizierungs‑first Synthesizer, erzielt hohe Erfolgsquote.

Weiterlesen
arXiv AI Papers

BEAMS Initiative: Open-Source KI-Benchmark fĂŒr ethische Simulation.

BEAMS definiert KI‑Modelle, entwickelt Benchmarks, prĂŒft Tools, zeigt StĂ€rken in Diskussionen, SchwĂ€chen in KausalitĂ€t.

Weiterlesen
arXiv AI Papers

Microsoft Bing Copilot: Langfristige Analyse von LLM-Unterhaltungen.

12.000 Bing-Copilot-Nutzer zeigen stabile Gewohnheiten; WildChat weniger reprÀsentativ, NutzerheterogenitÀt hoch.

Weiterlesen
arXiv AI Papers

Interpretive Audit Pipeline deckt divergierende Klassifikationen von vier LLMs bei USDA-Kommentaren auf.

Die Pipeline prĂŒft divergierende LLM‑Kategorien und fokussiert menschliche Revision auf mehrdeutige Eingaben.

Weiterlesen
arXiv AI Papers

OpenAI ChatGPT, Google Gemini LLMs reagieren auf Ton.

Eine Studie untersucht, wie Tonvarianten die Leistung von vier kosteneffizienten LLMs unterschiedlich beeinflussen.

Weiterlesen
arXiv AI Papers

DOT-Framework zeigt KI im Hochschullehre als Chance.

DOT‑Framework betont menschliche Aufsicht als entscheidend, 72 Hochschullehrende sehen KI als Hilfe, Hindernisse bremsen Umsetzung.

Weiterlesen
arXiv AI Papers

D-BOS: Differenzierbare bederungsbasierte Gegnerformung in Multiagenten.

D‑BOS verbessert Mehrspieler‑Koordination durch belief‑Space‑Differenzierung und ĂŒbertrifft PPO sowie BBM.

Weiterlesen
arXiv AI Papers

Agentic AI nutzt Nested Learning und semantisches Caching, um Halluzinationen zu reduzieren.

HOPE‑inspirierte Multi‑Agent‑Architektur senkt LLM‑Halluzinationen um bis zu 35 % und reduziert CO₂.

Weiterlesen
arXiv AI Papers

COLAGUARD: Effiziente, robuste Sicherheitsbarriere fĂŒr LLMs.

COLAGUARD verbessert Moderation, steigert F1 um 8,24 Punkte, senkt Laufzeit 12,9‑fach und Tokenkosten 22,4‑fach.

Weiterlesen
arXiv AI Papers

Reinforcement Learning Dispatching: Sim‑to‑Real‑LĂŒcke durch AusfĂŒhrungsschemata schließen.

ArXiv-Studie prÀsentiert ein policy-neutrales Framework, das Fehler strukturiert erfasst und ZuverlÀssigkeit erhöht.

Weiterlesen
arXiv AI Papers

Redpanda prĂ€sentiert ADP mit Out-of-Band-Metadaten fĂŒr Agentensicherheit.

Redpanda nutzt out‑of‑band‑MetadatenkanĂ€le, bietet sichere Architektur fĂŒr autonome KI‑Agenten und verhindert Halluzinationen.

Weiterlesen
arXiv AI Papers

Rechenmodelle unter Angriff: Ketten‑Denken bleibt korrekt, Antwort verfĂ€lscht.

Chain‑of‑Thought‑Modelle liefern korrekte Überlegungen, doch falsche Endantworten bei 50 % Flipp‑Rate, daher robuste Faithfulness‑Messungen nötig.

Weiterlesen
arXiv AI Papers

OpenAI GPT-5.5 kombiniert mit menschlicher Analyse beleuchtet AI-Trials in klinischen Studien.

Zunehmende KI-Studien, vor allem in China und USA, wuchsen in ML, DL, Chatbots und GPTs.

Weiterlesen
arXiv AI Papers

LLM-Aggregator nutzt komplette Trace‑Synthese, steigert Genauigkeit bei Agenten.

LLM‑Aggregatoren liefern besser als Mehrheitsentscheidungen; Self‑Consistent Mixture of Agents variiert BegrĂŒndungen, ĂŒbertrifft heterogene Pools.

Weiterlesen
arXiv AI Papers

PRO-CUA: Prozessoptimierung fĂŒr Computer-Use-Agents.

PRO‑CUA trennt Live‑Interaktion von Policy‑Optimierung, nutzt Feedback, senkt Bias, steigert Effizienz fĂŒr Workflows.

Weiterlesen
arXiv AI Papers

Masked Diffusion Modelle: Vertrauen verursacht Rechenfehler.

MDMs verschlechtern confidence‑basiertes Decoding bei komplexen Aufgaben, wĂ€hrend Zufallsmasken Fehler reduzieren.

Weiterlesen
arXiv AI Papers

Agentische KI: Technische Schulden, Stochastic Tax, Governance fĂŒr Adaptive Systeme.

Der Beitrag fĂŒhrt die Begriffe „Agentic Technical Debt“ und „Stochastic Tax“ ein.

Weiterlesen
arXiv AI Papers

Neuro-Symbolic KG‑Konstruktion mit ontologiebasierter Korrektur.

Neuro-symbolische Ontologie-Klassifikationsgraphen reduzieren den Tokenverbrauch, erhöhen Konsistenz und verbessern SPARQL-Abfragen.

Weiterlesen
arXiv AI Papers

AI-DeFi-Agenten erzielen 3 Mrd USD, ElizaOS und Virtuals Protocol im Fokus.

DeFi‑AI-Investmentagenten erreichen 3 Mrd USD, sind aber spekulativ, unzuverlĂ€ssig, und große Verluste.

Weiterlesen
arXiv AI Papers

ReasonOps: UnĂŒberwachtes Tool zur Analyse von Chain-of-Thought-Traces bei LLMs.

ReasonOps klassifiziert 44 662 Chain‑of‑Thought‑Spuren von 12 LLMs in 7 Operatoren, erkennt FingerabdrĂŒcke und prognostiziert Antworten.

Weiterlesen
arXiv AI Papers

GTA: Skalierbare Erstellung langer Web-Agentenaufgaben.

GTA schließt das LeistungsgefĂ€lle, indem Crawling, Suchanfragen, Textgenerierung und QualitĂ€tskontrolle kombiniert, um Aufgaben zu erzeugen.

Weiterlesen
arXiv AI Papers

BenchTrace: Neuer Maßstab fĂŒr Reflektion und kontrollierte Evolution selbstlernender LLM-Agenten.

BenchTrace bewertet KI-Agenten mit 1821 Episoden, FAR‑Metrik, zeigt niedrige Reflexion, Engpass Fehlerdiagnose, modellagnostisch.

Weiterlesen
arXiv AI Papers

Daten‑Modell‑KompatibilitĂ€t: SchlĂŒssel fĂŒr effektives LLM‑Reasoning-Transfer.

Die DMC-Metrik bewertet Datenpassung, verbessert Logiktransfer und steigert Distillationsergebnisse.

Weiterlesen
arXiv AI Papers

Deep Research Pipeline erhöht Literaturrecherche-Rekall von 20 % auf 80 %.

Die neue Pipeline steigert die Literatursuche auf 80 % und betont MehrdimensionalitĂ€t.

Weiterlesen
arXiv AI Papers

KI priorisiert Unterrichtsthemen ohne Noten in virtuellen Klassen.

Eine transparente KI‑Schicht priorisiert Lernmodule, bewertet Schwierigkeiten, Lehrer‑Bedenken ohne Noten, korreliert stark mit Feedback.

Weiterlesen
arXiv AI Papers

DenseSteer verbessert kleine Modelle mit dichten mathematischen Schritten.

DenseSteer steigert die Genauigkeit mathematischer Tests der Qwen-2.5-Serie ohne zusÀtzliches Training.

Weiterlesen
arXiv AI Papers

Neues sicheres Agenten-Framework: ePCA nutzt logische BeschrÀnkungen.

Das Papier prĂ€sentiert ein ePCA-Framework, das KI-Agenten zwingt, Absichten formal zu prĂŒfen, Sicherheit zu gewĂ€hrleisten.

Weiterlesen
arXiv AI Papers

OpenClawBench: Neues Benchmark fĂŒr Prozessanomalien in Agenten.

OpenClawBench liefert 31 264 Trajektorien aus sechs Modellen, klassifiziert 2 904 Prozessanomalien, erzielt F1 0,729.

Weiterlesen
arXiv AI Papers

RACE‑Sched: Asynchrones Agenten-Framework verbindet Echtzeit und langfristiges Scheduling.

RACE‑Sched kombiniert symbolische Heuristik mit LLM-Stream, optimiert Dispatch‑Regeln in Echtzeit, ĂŒbertrifft RL‑Modelle.

Weiterlesen
arXiv AI Papers

Mehrere Foundation Models im selbstkonsumierenden Loop: Human Curation kann scheitern.

Modelltraining auf synthetischen Daten verstĂ€rkt Abweichungen, gefĂ€hrdet Alignment, erfordert koordiniertes Human‑In‑Loop‑Management.

Weiterlesen
arXiv AI Papers

LLM‑basierte Service‑Taxonomie: Rekursive Konstruktion fĂŒr Internet of Agents.

A2X reduziert Kontextmangel, klassifiziert LLM‑Services hierarchisch und steigert Trefferquote um 6,2 %.

Weiterlesen
arXiv AI Papers

CoHyDE: Iteratives Co‑Training von LLM‑Rewriter und Dense Encoder fĂŒr Tool‑Retrieval.

CoHyDE optimiert API‑Tool-Suche durch dichten Encoder und LLM‑Rewriter, steigert Retrieval um bis zu 8 %.

Weiterlesen
arXiv AI Papers

LLM-Fine‑Tuning: Beseitigung schĂ€dlicher Nachschreibungen verbessert TrainingsqualitĂ€t.

Harmful Continuation reduziert Fehler, Delete‑Only‑Editor verbessert SFT, HCC adressiert Uncertainty‑Geometry‑Mismatch.

Weiterlesen
arXiv AI Papers

Entropy‑KL Token‑Maskierung: Neue Technik fĂŒr selektives Fine‑Tuning großer Modelle.

EKSFT maskiert Tokens mit hoher Entropie, erhöht Genauigkeit, fördert RL‑Exploration und liefert robustere KI‑Modelle.

Weiterlesen
arXiv AI Papers

RoRo: Rubrikbasierte Prozessbelohnung optimiert Schrittweises Modellrouting.

RoRo verbessert KI-Modellverteilung durch rubrikbasierte Routingbelohnung, steigert Genauigkeit, senkt Kosten.

Weiterlesen
arXiv AI Papers

ConMoE: Prototypen‑Zuweisung komprimiert Mixture‑of‑Experts‑Modelle.

ConMoE reduziert MoE-Modelle ohne GewichtsĂ€nderung, liefert vergleichbare oder bessere Ergebnisse bei 25 % und 50 % Expert Reduction.

Weiterlesen
arXiv AI Papers

PassNet: LLM-gestĂŒtzte Compiler-Pass-Generierung mit TorchInductor.

LLM‑gesteuerte Compileroptimierung steigert Langschwanz‑Workloads um 37 %, Dataset mit 18 000 Graphen, Benchmark PassBench und 3‑fach TorchInductor‑Leistung.

Weiterlesen
arXiv AI Papers

Anthropic nutzt sparse Autoencoder, um Claude 3 Sonnet erklĂ€rbar zu machen.

Sparse Autoencoders enthĂŒllen 34 M Features von Claude 3 Sonnet, erkennen EntitĂ€ten, Konzepte und schĂ€dliche Eigenschaften.

Weiterlesen
arXiv AI Papers

EvoMD-LLM nutzt LLMs zur Simulation reaktiver Molekulardynamik.

EvoMD-LLM tokenisiert Molekulardynamik, reduziert Halluzination, erreicht 66,14 % Genauigkeit, ĂŒbertrifft neuronale Netzwerke.

Weiterlesen
arXiv AI Papers

Zeroth-Order Optimierung verbessert Robustheit der LLM-Sicherheitsausrichtung.

Zeroth-Order-Optimierung stÀrkt Sicherheitsausrichtung von LLMs in wenigen Iterationen ohne Nutzenverlust.

Weiterlesen
arXiv AI Papers

Qwen3-VL-8B-Instruct ĂŒbertrifft Claude und GPT-5.5 im PiSAR Benchmark.

Qwen3‑VL‑8B‑Instruct ĂŒbertrifft Zero‑Shot‑Baselines auf PiSAR, Gemma‑4‑26B‑A4B‑IT hinkt zurĂŒck.

Weiterlesen
arXiv AI Papers

Studie zeigt begrenzte Wirkung von Persona Prompting bei LLMs.

Persona‑Prompting erhöht Expertentiefe, verringert Klarheit; hybride Retrieval performt am besten.

Weiterlesen
arXiv AI Papers

ReasonLight: Multimodales Foundation‑Model fĂŒr Zero‑Shot-Verkehrssteuerung.

ReasonLight optimiert Ampelphasen in Echtzeit und senkt Wartezeiten fĂŒr Notfahrzeuge um 88,7 %.

Weiterlesen
arXiv AI Papers

Agentic ASR: Interaktive Spracherkennung mit Agentenkorrektur.

Agentic ASR verbessert SprachverstĂ€ndnis, zeigt signifikante Verbesserungen durch semantische Korrektur, Intent‑Routing und LLM-basierte Bewertung.

Weiterlesen
arXiv AI Papers

CrystalXRD-Bench testet GPT‑5.4 bei XRD‑Peak-Indexierung.

CrystalXRD‑Bench testet 250 Proben, GPT‑5.4 erreicht Wert 0,5888, Aufgabe ungelöst.

Weiterlesen
arXiv AI Papers

VitalAgent: Tool-gestĂŒtzter Agent mit VitalBench fĂŒr Wearable-Monitoring.

VitalAgent verbessert kontinuierliches Vitalmonitoring um ĂŒber 30 % Genauigkeit gegenĂŒber Prompt- und ReAct-Modellen.

Weiterlesen
arXiv AI Papers

DistractionIF zeigt: GrĂ¶ĂŸere LLMs werden anfĂ€lliger fĂŒr Ablenkungsanweisungen.

DistractionIF zeigt, dass große LLMs bis zu 30 Punkte verlieren; GRPO‑RL erhöht Robustheit um 15,5 %.

Weiterlesen
arXiv AI Papers

Xetrieval erklÀrt Dense Retrieval mechanistisch.

Xetrieval erklÀrt dichte Retriever Relevanzwerte, indem Embeddings in reasoning Features und interpretierbare Attribute umgewandelt werden.

Weiterlesen
arXiv AI Papers

MindGames: Multi-Agenten-Plattform zur Bewertung sozialer Strategien.

Mindgames bewertete 944 LLM-Agenten in vier Spielen und zeigte inkonsistente Regelbefolgung und Leaderboard-Unstimmigkeiten.

Weiterlesen
arXiv AI Papers

DeepSurvey steigert Tiefenanalyse und ZitationszuverlÀssigkeit in KI-Umfragen.

DeepSurvey erstellt automatisierte LiteraturĂŒbersichten mit hoher Content‑Score, verbesserter ZitationsqualitĂ€t und ĂŒberlegener Generalisierung.

Weiterlesen
arXiv AI Papers

UI-KOBE: Graphbasierte Wissensgraphen verbessern leichte mobile GUI-Agenten.

UI-KOBE erstellt einen Wissensgraphen von UI-ZustÀnden, reduziert Planungsaufwand und steigert ZuverlÀssigkeit.

Weiterlesen
arXiv AI Papers

Opt-Verifier: LLMs mit Dual-Verifikation fĂŒr Optimierungsmodelle.

Opt‑Verifier erhöht KI-Optimierungsmodelle um 20 % durch duale ÜberprĂŒfung von Struktur und Lösung.

Weiterlesen
arXiv AI Papers

LLM-Agent nutzt Simulationsdaten zur Batteriedigital‑Twin‑Optimierung.

LLM-Agent optimiert digitale Batterietwins, ĂŒbertrifft Bayesian-Optimierung, demonstriert Degradationsanpassungen.

Weiterlesen
arXiv AI Papers

ParaTool: Tool Calling ohne Kontext fĂŒr LLMs.

ParaTool verbessert Tool‑Calling in Sprachmodellen, reduziert Rechenaufwand und Halluzinationen, steigert Praxisrelevanz.

Weiterlesen
arXiv AI Papers

VLMs nutzen ViewSuite auf ScanNet zur View-Planung.

ViewSuite testet 13 VLMs bei mehrstufiger Kameraview-Planung, zeigt Sequenzierungsfehler, verbessert Qwen2.5‑VL‑7B um 2,5 %.

Weiterlesen
arXiv AI Papers

DeepTool verbessert Tool-Integration mit Prozess-ĂŒberwachtem RL.

DeepTool verbessert Tool‑integriertes Denken, nutzt Synthese‑Pipeline und RL, steigert Leistung erheblich.

Weiterlesen
arXiv AI Papers

GPS-gesteuerte TouristenmobilitÀt: saisonale Vorprioren, LLM-AktivitÀtsketten.

KI‑unterstĂŒtzte Vier‑Stufen‑Simulation modelliert touristische MobilitĂ€t mithilfe aggregierter GPS‑ und Demografie‑Daten.

Weiterlesen
arXiv AI Papers

FinVerBench: LLM-Validierung von Unternehmensfinanzdaten anhand SEC 10-K.

FinVerBench prĂŒft US-Finanzberichte, zeigt LLMs hohe FehleranfĂ€lligkeit und betont kalibrierte UrteilsfĂ€higkeit.

Weiterlesen
arXiv AI Papers

Mind-Omni: Multitask-Framework verbindet 7 Gehirn-, Bild- und Sprachaufgaben mittels diskreter Diffusion.

Mind‑Omni verbindet sieben BCI‑Aufgaben ĂŒber diskretisierte Diffusion, tokenisiert Gehirnsignale und nutzt Q&A‑Dataset.

Weiterlesen
arXiv AI Papers

HiKEY: Hierarchische multimodale Suche verbessert Open-Domain-Q&A.

HiKEY verbindet hierarchisch Text, Tabellen, Bilder, reduziert Token, ĂŒbertrifft Modelle um bis zu 12,9 %.

Weiterlesen
arXiv AI Papers

KI-Storytelling neu: Mehragenten-Framework mit LLMs fĂŒr Brettspiel-Collaboration.

Kinder verbessern mit LLMs ihre Geschichten durch wiederholte Writer‑Editor‑Iterationen im Brettspiel.

Weiterlesen
arXiv AI Papers

Temporale Logit-ObservabilitĂ€t ĂŒbertrifft ASR bei LLM‑Sicherheitsdiagnose.

TLO ermöglicht prĂ€zise Analyse von LLM-Angriffen, indem es Logit‑Spuren auf 2‑D‑Ebene abbildet.

Weiterlesen
arXiv AI Papers

VikingMem: Memory Base Management System fĂŒr LLM-basierte Anwendungen.

Das Memory‑Base-Paradigma erhöht Erinnerungsretrieval um 30 % bei gleicher Latenz.

Weiterlesen
⚠ Hinweis zu KI-generierten Inhalten

Diese Seite enthĂ€lt ausschließlich automatisiert erstellte, KI-generierte Inhalte.

Die Zusammenfassungen wurden vollstĂ€ndig durch KĂŒnstliche Intelligenz erstellt. Es handelt sich nicht um redaktionell geprĂŒfte Inhalte.

Haftungsausschluss: FĂŒr die Richtigkeit, VollstĂ€ndigkeit und AktualitĂ€t der KI-generierten Zusammenfassungen wird keine GewĂ€hr ĂŒbernommen. Die Originalquellen sind jeweils verlinkt. Der Betreiber ĂŒbernimmt keine Haftung fĂŒr Fehler durch die eingesetzten KI-Systeme.

Technische Umsetzung: Python, Ollama, FLUX/Z-Image | Letzte Aktualisierung: Samstag, 30. Mai 2026, 06:19 Uhr