Katalog Plus
Bibliothek der Frankfurt UAS
Bald neuer Katalog: sichern Sie sich schon vorab Ihre persönlichen Merklisten im Nutzerkonto: Anleitung.
Dieses Ergebnis aus IEEE Xplore Digital Library kann Gästen nicht angezeigt werden.  Login für vollen Zugriff.

Efficient MoE Inference on Single Consumer-grade GPU with Dynamic Expert Caching

Title: Efficient MoE Inference on Single Consumer-grade GPU with Dynamic Expert Caching
Authors: Zhang, Rui; Yang, Boxuan; Wang, Rongji; Peng, Xuemei; Wen, Zeyi
Source: 2026 IEEE International Parallel and Distributed Processing Symposium (IPDPS) IPDPS Parallel and Distributed Processing Symposium (IPDPS), 2026 IEEE International. :1219-1232 May, 2026
Relation: 2026 IEEE International Parallel and Distributed Processing Symposium (IPDPS)
Database: IEEE Xplore Digital Library