OpenAI выпустила Открытый исходный код безопасной модели вывода gpt-oss-safeguard

robot
Генерация тезисов в процессе

【链文】29 октября сообщается, что OpenAI сегодня выпустила открытый исходный код модели безопасного вывода gpt-oss-safeguard (120b, 20b), позволяющий разработчикам предоставлять пользовательские политики для классификации контента во время вывода, вывод модели включает выводы и цепочки вывода. Эта модель основана на открытых весах gpt-oss и использует лицензию Apache 2.0, доступна для загрузки с платформы. Внутренние тесты показали, что она превосходит gpt-5-thinking и gpt-oss по точности при использовании нескольких политик, а ее производительность на внешних наборах данных близка к Safety Reasoner. Ограничения включают: традиционные классификаторы по-прежнему лучше в большом количестве высококачественных помеченных сценариев, время вывода и вычислительная мощность достаточно высоки. ROOST создаст сообщество моделей и опубликует технический отчет.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Репост
  • Поделиться
комментарий
0/400
MetaNeighborvip
· 15ч назад
Эта безопасность действительно выдержит?
Посмотреть ОригиналОтветить0
BearMarketSurvivorvip
· 15ч назад
Наконец, Открытый исходный код. Неплохо, неплохо.
Посмотреть ОригиналОтветить0
LiquidityLarryvip
· 16ч назад
Открытый исходный код — зачем он нужен, если всё равно нужна Мощность Хэша / хэшрейт для работы
Посмотреть ОригиналОтветить0
BlockTalkvip
· 16ч назад
Вот такая безопасность? Тьфу-тьфу.
Посмотреть ОригиналОтветить0
ZenMinervip
· 16ч назад
Это не просто добавление защитного механизма к открытому моделированию?
Посмотреть ОригиналОтветить0
ShamedApeSellervip
· 16ч назад
GPT тоже управляет тем и другим...
Посмотреть ОригиналОтветить0
  • Закрепить