【链文】29 октября сообщается, что OpenAI сегодня выпустила открытый исходный код модели безопасного вывода gpt-oss-safeguard (120b, 20b), позволяющий разработчикам предоставлять пользовательские политики для классификации контента во время вывода, вывод модели включает выводы и цепочки вывода. Эта модель основана на открытых весах gpt-oss и использует лицензию Apache 2.0, доступна для загрузки с платформы. Внутренние тесты показали, что она превосходит gpt-5-thinking и gpt-oss по точности при использовании нескольких политик, а ее производительность на внешних наборах данных близка к Safety Reasoner. Ограничения включают: традиционные классификаторы по-прежнему лучше в большом количестве высококачественных помеченных сценариев, время вывода и вычислительная мощность достаточно высоки. ROOST создаст сообщество моделей и опубликует технический отчет.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
10 Лайков
Награда
10
6
Репост
Поделиться
комментарий
0/400
MetaNeighbor
· 15ч назад
Эта безопасность действительно выдержит?
Посмотреть ОригиналОтветить0
BearMarketSurvivor
· 15ч назад
Наконец, Открытый исходный код. Неплохо, неплохо.
Посмотреть ОригиналОтветить0
LiquidityLarry
· 16ч назад
Открытый исходный код — зачем он нужен, если всё равно нужна Мощность Хэша / хэшрейт для работы
Посмотреть ОригиналОтветить0
BlockTalk
· 16ч назад
Вот такая безопасность? Тьфу-тьфу.
Посмотреть ОригиналОтветить0
ZenMiner
· 16ч назад
Это не просто добавление защитного механизма к открытому моделированию?
OpenAI выпустила Открытый исходный код безопасной модели вывода gpt-oss-safeguard
【链文】29 октября сообщается, что OpenAI сегодня выпустила открытый исходный код модели безопасного вывода gpt-oss-safeguard (120b, 20b), позволяющий разработчикам предоставлять пользовательские политики для классификации контента во время вывода, вывод модели включает выводы и цепочки вывода. Эта модель основана на открытых весах gpt-oss и использует лицензию Apache 2.0, доступна для загрузки с платформы. Внутренние тесты показали, что она превосходит gpt-5-thinking и gpt-oss по точности при использовании нескольких политик, а ее производительность на внешних наборах данных близка к Safety Reasoner. Ограничения включают: традиционные классификаторы по-прежнему лучше в большом количестве высококачественных помеченных сценариев, время вывода и вычислительная мощность достаточно высоки. ROOST создаст сообщество моделей и опубликует технический отчет.