Gate News Nachrichten, am 25. März hat DeepSeek 17 Stellenangebote veröffentlicht, wobei sich der Schwerpunkt von Grundlagenmodellforschung auf die Produktisierung von Agenten verschoben hat. Drei spezielle Agenten-Positionen decken den gesamten Prozess ab: Algorithmusforschung, Datenbewertung und Infrastruktur. Der Algorithmusforscher konzentriert sich auf die Anwendung von Reinforcement Learning bei der Ausrichtung großer Modelle (RLHF/RLAIF, Belohnungsprozesse, Präferenzlernen); der Datenbewertungsexperte ist verantwortlich für den Aufbau von Bewertungsdatensätzen und die Gestaltung von Testfällen für Planung, Tool-Calls, Multi-Runden-Interaktionen und Langzeitgedächtnis des Agenten; der Infrastrukturingenieur baut die Laufzeitumgebung für Agenten auf, integriert externe Tools in die interne Reinforcement-Learning-Infrastruktur und entwickelt Bewertungsplattformen. Mehrere Stellen betonen in den Zusatzqualifikationen die bevorzugte Nutzung von KI-Programmierwerkzeugen wie Claude Code, Cursor und Copilot. Die Stelle des Full-Stack-Entwicklers erwähnt, dass man als intensiver Nutzer von Vibe Coding kontinuierlich die Modellfähigkeiten in Produkten innovativ einsetzen möchte, wobei der Kernfokus auf dem Aufbau einer nächsten Generation von Container-Orchestrierung und Isolationsplattform liegt, die den Betrieb zahlreicher KI-Agenten unterstützt. Für den Produktmanager im Bereich Modellstrategie wurde eine spezielle Position für Agenten eingerichtet, bei der Kandidaten Erfahrung mit Produkten wie Claude Code, OpenClaw und Manus haben sollten, um wertvolle Anwendungsfälle wie persönliche Assistenten, Deep Research, automatisierte Workflows und multimodale Gerätesteuerung zu erkennen und die Bewertungssysteme sowie Trainingsdatensätze für Agenten zu leiten. Im Vergleich zu Januar, als die Kernstellen auf allgemeine Forschungsrichtungen wie „Deep Learning Researcher - AGI“ fokussierten, liegt der Schwerpunkt bei dieser Rekrutierung deutlich auf der Produktisierung von Agenten.