Microsoft Kosmos-1 inson darajasidagi AIga yo'l ochadi

Shu haftaning boshida tadqiqotchilar Microsoft Kosmos-1 multimodal sun'iy intellekt modelini taqdim etdi, u tasvirlarni kontent uchun tahlil qila oladi, vizual jumboqlarni echadi, vizual matnni aniqlashni amalga oshiradi, vizual IQ testlarini oladi va tabiiy til ko'rsatmalarini tushunadi. Tadqiqotchilarning fikricha, bunday sunʼiy intellekt modellari inson darajasidagi qoʻshma vazifalarni bajara oladigan sunʼiy umumiy intellektni (AI) yaratish yoʻlidagi birinchi qadamdir. Ya'ni, bu texnologiya har qanday intellektual vazifada odamning o'rnini bosa oladi. Va bu asosiy biznes hamkori bo'lgan OpenAIning belgilangan maqsadi Microsoft sun'iy intellekt sohasida.

Bunday holda, Kosmos-1 kompaniyaning mutlaqo shaxsiy rivojlanishidir Microsoft. Tadqiqotchilar ularni yaratishni "ko'p modali keng til modeli" (MLLM) deb atashadi, chunki uning ildizlari ChatGPT kabi LLM kabi faqat matnga asoslangan tabiiy tilni qayta ishlashda yotadi. Model kiritilgan tasvirlarni qabul qilishi uchun tadqiqotchilar avval rasmlarni LLM tushunadigan maxsus tokenlar seriyasiga (asosan matn) aylantirishlari kerak.

Kosmos-1 Internetdan olingan ma'lumotlar bazasida, jumladan The Pile (800 GB hajmdagi inglizcha matn resursi) va Common Crawl dan parchalar bo'yicha o'qitildi. Keyin model nutqni tushunish, nutqni yaratish, optik belgilarni tanib olmasdan matn tasnifi, tasvirga sarlavha qo'yish, vizual savollarga javob berish, veb-sahifa savollariga javob berish va mahalliylashtirish bilan tasvirlarni tasniflash uchun bir nechta testlar bilan sinovdan o'tkazildi. Ga binoan Microsoft, Kosmos-1 ushbu testlarning ko'pchiligida hozirgi modellardan ustun keldi.

Shakllar ketma-ketligini taqdim etish va sub'ektdan ketma-ketlikni bajarishni so'rash orqali vizual IQni o'lchaydigan Raven's Progressive Reading testi ayniqsa qiziqarli bo'ldi. Kosmos-1 22% hollarda to‘g‘ri javob bera oldi.

Kelajakda optimallashtirish bilan bu dastlabki qadamlar yanada muhimroq natijalar berishi mumkin, bu esa AI modellariga har qanday ommaviy axborot vositalarini idrok etish va ta'sir qilish imkonini beradi, sun'iy yordamchilarning imkoniyatlarini sezilarli darajada kengaytiradi.

Shuningdek o'qing:

Manbaarstexnika

Ro'yxatdan o'tish

0 Izoh

O'rnatilgan sharhlar

Barcha sharhlarni ko'ring

Boshqa maqolalar

Microsoft inson darajasidagi AIga yo'l ochadigan multimodal yondashuvni taqdim etdi

Oxirgi izohlar