06:58
28 октября компания Zhizi Engine выпустила мультимодальную большую модель «Meta Multiplication Elephant Chatimg 3.0», которая поддерживает понимание нескольких изображений, локализацию объектов, OCR и другие функции. Согласно отчетам, по сравнению с Chatimg2.0, Chatimg3.0 был модернизирован в двух основных аспектах, включая первый этап предварительного обучения (описание, обнаружение, OCR и другое многозадачное обучение) и второй этап тонкой настройки инструкций (высококачественный набор инструкций искусственного тонкого скрининга).
- 1

