OpenAI выпустила Открытый исходный код безопасной модели вывода gpt-oss-safeguard

2025-10-29 12:40:22

Генерация тезисов в процессе

【链文】29 октября сообщается, что OpenAI сегодня выпустила открытый исходный код модели безопасного вывода gpt-oss-safeguard (120b, 20b), позволяющий разработчикам предоставлять пользовательские политики для классификации контента во время вывода, вывод модели включает выводы и цепочки вывода. Эта модель основана на открытых весах gpt-oss и использует лицензию Apache 2.0, доступна для загрузки с платформы. Внутренние тесты показали, что она превосходит gpt-5-thinking и gpt-oss по точности при использовании нескольких политик, а ее производительность на внешних наборах данных близка к Safety Reasoner. Ограничения включают: традиционные классификаторы по-прежнему лучше в большом количестве высококачественных помеченных сценариев, время вывода и вычислительная мощность достаточно высоки. ROOST создаст сообщество моделей и опубликует технический отчет.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

10 Лайков