Phi-3-mini - bu yutuq Microsoft sun'iy intellekt sohasida?

Phi sun'iy intellekt modeli tomonidan Microsoft - kichik, arzon va "gallyutsinatsiyalar" dan aziyat chekmaydi. Kelajagi buyuk bo'lishi bashorat qilingan yangi til modeli haqida shunday deyishadi.

GPT mutlaqo ajoyib, lekin shu bilan birga, bu juda qimmat va u hamma uchun mukammal bo'lishi mumkin emas. Bu va boshqa ko'plab sabablarga ko'ra Microsoft ancha kichikroq AI modellari bilan tajriba o'tkazmoqda. Aytilishicha, Phi-3-mini OpenAI muhandislarining ishini hatto sharmanda qiladi.

Shuningdek, qiziqarli: Kelajak tranzistorlari: bizni chiplarning yangi davri kutmoqda

MAZMUNI

1. ChatGPT davo emas

2. Nima haqida ma'lum Microsoft fi

3. Phi-3-mini qanday ishlatish kerak?

4. Microsoft Phi ChatGPT tipidagi modellarni almashtiradimi?

5. Phi-3 dan Microsoft faqat ingliz tilini tushunadi

ChatGPT davo emas

ChatGPT - bu moliyalashtirilgan, takomillashtirilgan va takomillashtirilgan ixtiro Microsoft. Aslida, u tegishli emas Microsoft, va OpenAI kompaniyasi, qaysi Microsoft egalik qilmaydi (u eng yirik investor bo'lmasa ham, etakchi hisoblanadi). GPT tili modeli berdi Microsoft endi yetib olishga shoshilayotgan yirik texnologik korporatsiyalar ustidan ulkan ustunlik. Biroq, GPT bilan bog'liq juda ko'p muammolar mavjud, ularning aksariyatini hali hal qilib bo'lmaydi.

Birinchidan, bu juda ko'p resurs talab qiladigan til modeli. Veb yo'naltirilgan Microsoft OpenAI-ning Copilot yoki ChatGPT juda yuqori operatsion xarajatlarni keltirib chiqaradi Microsoft. Bu nafaqat GPT, balki barcha asosiy til modellarining xususiyatidir. Bundan tashqari, GPT ham raqobatchilari kabi “gallyutsinatsiyalar”ga moyil, ya’ni yolg‘on yoki chalg‘ituvchi ma’lumotlarni o‘z ichiga olgan so‘rovlarga javoblar yaratishi mumkin. Bunday model qanchalik ko'p ma'lumotni o'zlashtirsa, shunga o'xshash tarkibni yaratishga intiladi. Shuning uchun, gallyutsinatsiyalar va yolg'on bayonotlar raqamli barmoqdan so'rilgan afsona emas. Foydalanuvchilar ko'pincha katta til modellari ko'pincha xatoga yo'l qo'yishini, noto'g'ri ma'lumotlarni berishini va mavjud bo'lmagan faktlar ustida ishlayotganini ta'kidlashadi.

Ikkala muammo ham juda jiddiy, shuning uchun OpenAI, Microsoft, Meta, Google va boshqalar nafaqat Katta til modeli texnologiyasini, balki amalda ancha yaxshi natijalar berishi mumkin bo‘lgan Kichik til modelini ham ishlab chiqish ustida ishlamoqda.

Raqamli buxgalterning yordamchisi kvant fizikasi haqida ko'p ma'lumotga ega bo'lishi shart emas. Bu juda kichikroq va kamroq murakkab (va shuning uchun arzonroq) bo'lishi mumkin va faqat uning maqsadi uchun zarur bo'lgan ma'lumotlarga o'rgatish orqali nazariy jihatdan kamroq gallyutsinatsiyalar paydo bo'lishi kerak. Garchi buni qilishdan ko'ra aytish osonroq. GenAI texnologiyasi hali ham yovvoyi IT korxonasi. Garchi ish misli ko'rilmagan sur'atda ketayotgan bo'lsa-da, fundamental masalalar bo'yicha amaliy yutuqlarga erishish hali ham qiyin. Lekin kompaniya Microsoft yaqinda bunday yutuq haqida e'lon qildi. Biz kichik til modeli haqida gapiramiz Microsoft Phi.

Shuningdek, qiziqarli: Tayvan, Xitoy va AQSh texnologik ustunlik uchun qanday kurashmoqda: buyuk chip urushi

Nima haqida ma'lum Microsoft fi

Avvalo shuni ta'kidlash kerakki, tajriba OpenAI kompaniyasi ishtirokisiz o'tkazildi. Ya'ni, bu muhandislarning rivojlanishi Microsoft.

- Reklama -

Modellar Microsoft Phi - bu turli testlarda ajoyib natijalarga erishadigan kichik til modellari (SLM) seriyasidir. Birinchi model Phi-1 1,3 milliard parametrga ega va mavjud SLMlar orasida Python kodlashning eng yaxshi natijalariga erishdi.

Keyinchalik ishlab chiquvchilar tilni tushunish va fikrlashga e'tibor qaratdilar, Phi-1.5 modelini yaratdilar, u ham 1,3 milliard parametrga ega bo'lib, parametrlari besh baravar ko'p bo'lgan modellar bilan taqqoslanadigan ishlash ko'rsatdi.

Phi-2 - bu 2,7 milliard parametrli model bo'lib, u 13 milliard parametrli eng yaxshi bazaviy modellar darajasida ishlaydigan ajoyib fikrlash va tilni tushunish qobiliyatini namoyish etadi. Phi-2 boshqa modellardan modelni masshtablash va maʼlumotlarni kurasiyaga oʻrgatishdagi innovatsiyalari bilan ajralib turadi.

U Azure AI Studio modellari katalogida mavjud bo'lib, u til modellari sohasida tadqiqot va ishlanmalarni osonlashtiradi. Phi-2 2023-yil dekabr oyida ishga tushirilgan. Ishlab chiquvchilar, u Meta-dan Mistral yoki llama 2 kabi ishlaydi, deb ishontirmoqda. Va Phi-3 oldingi versiyadan ham yaxshiroq ishlaydi.

Biroq, hozirgina e'lon qilingan Phi-3 modeli sifat jihatidan mutlaqo yangi. Hech bo'lmaganda taqdim etilgan ma'lumotlardan xulosa chiqarishingiz mumkin Microsoft. Kompaniya ma'lumotlariga ko'ra, barcha ma'lum mezonlarning ko'rsatkichlariga ko'ra, Phi-3 shunga o'xshash o'lchamdagi boshqa har qanday modeldan, jumladan, til tahlili, dasturlash ishi yoki matematik ishlarni bajarishdan yaxshiroq ishlaydi.

Ushbu modelning eng kichik versiyasi bo'lgan Phi-3-mini endigina barcha manfaatdor tomonlar uchun mavjud bo'ldi. Ya'ni, u 23 apreldan beri mavjud. Phi-3-mini 3,8 milliard parametrga ega va o'lchovlarga ko'ra Microsoft, bir xil o'lchamdagi boshqa har qanday modeldan ikki barobar samaraliroq. Uni bulutli servisning AI modellari katalogida topish mumkin Microsoft Azure, Hugging Face mashinasini o'rganish model platformasi va Ollama, mahalliy kompyuterda modellarni ishga tushirish uchun ramka.

U da'vo qilganidek Microsoft, Phi-3-mini kuchli chiplarni talab qilmaydi Nvidia. Model oddiy kompyuter chiplarida ishlashi mumkin. Yoki Internetga ulanmagan telefonga ham mos keladi.

Kamroq quvvat, shuningdek, modellar unchalik aniq bo'lmasligini anglatadi. Phi-3 shifokorlar yoki soliq hisobchilari uchun mos bo'lmaydi, lekin oddiyroq vazifalarda yordam beradi. Masalan, Internetda reklama yoki sharhlarni sarhisob qilish uchun.

Kichikroq modellar kamroq ishlov berishni talab qilganligi sababli, ular xususiy kompaniyalar uchun arzonroq bo'ladi. Ya'ni, ichida Microsoft AIni o'z ishlariga jalb qilishni xohlaydigan, ammo buni juda qimmat deb hisoblaydigan mijozlar ko'proq bo'ladi. Biroq, ular qancha turadi, hozircha aniq emas.

Kichik va o'rta modellar qachon paydo bo'lishi hozircha noma'lum. Ammo ikkinchisi kuchliroq va qimmatroq bo'ladi. Ma'lumki, Phi-3-kichik 7 milliard parametrga ega bo'ladi va Phi-3-medium 14 milliard parametrga ega bo'ladi.

- Reklama -

Shuningdek o'qing:

Phi-3-mini qanday ishlatish kerak?

GPT-4 Turbo kuchli AI chiplarini talab qiladi, ular hali ham juda qimmat. Phi-3 kichik nutq modeli bulutsiz, hatto mobil telefondagi chip bilan ham oflayn rejimda ishlashi mumkin.

Phi-3 - bu oxirgi foydalanuvchilar uchun mahsulot emas, balki ishlab chiquvchilar o'zlarining ilovalarida foydalanishlari va amalga oshirishlari mumkin bo'lgan texnologiya - bulutga asoslangan, ya'ni masofadan joylashgan va mahalliy va oflayn rejimda ishlaydiganlar. U mobil telefonlar, avtomobillar va ularning axborot-ko‘ngilochar tizimlari, hatto IoT sensorlari kabi qurilmalar va ularning komponentlari bilan uzluksiz ishlashi kutilmoqda. Ba'zi stsenariylarda bu texnologiya bebaho bo'lishi mumkin.

Microsoft hatto tasavvurimizni zo‘rg‘a qo‘ymasligimiz uchun aniq misol keltiradi. Tasavvur qiling, dehqon o‘z ekinlarini tekshirib, barglari, poyalari va shoxlarida kasallik belgilarini ko‘rdi. Telekommunikatsiya ustunlaridan uzoqda bo'lganida, u faqat telefonini olib, shikastlangan joyni suratga olishi, uni Phi-3 texnologiyasidan foydalanadigan ilovaga qo'yishi kerak bo'ladi - va model tezda va oflayn rejimda fotosuratni tahlil qiladi va maslahat beradi. bu kasallik bilan qanday aniq kurashish kerak.

U tushuntirganidek Microsoft, GPT muvaffaqiyatining kaliti mashg'ulotlar uchun katta hajmdagi ma'lumotlardan foydalanish edi. Bunday katta ma'lumotlar to'plamlari bilan yuqori sifatli ma'lumotlar haqida gap bo'lishi mumkin emas. Shu bilan birga, Phi modelini o'rgatishda mutlaqo teskari OpenAI yondashuvi qo'llanilgan. Modelni ma'lumot bilan to'ldirish o'rniga, asosiy e'tibor bosqichma-bosqich va chuqur o'rganishga qaratildi.

Xom Internet ma'lumotlaridan foydalanish o'rniga, tadqiqotchilar Microsoft millionlab miniatyura "chaqaloq" hikoyalarini yaratgan TinyStories ma'lumotlar to'plamini yaratdi. Bu hikoyalar juda kichik til modellarini o'rgatish uchun ishlatilgan. Keyinchalik tadqiqotchilar CodeTextbook ma'lumotlar to'plamini yaratish orqali oldinga siljishdi, unda puxta tanlangan, ommaga ochiq ma'lumotlardan foydalanilgan, ta'lim qiymati va kontent sifati uchun filtrlangan. Keyinchalik bu ma'lumotlar bir necha marta filtrlangan va keyingi sintez uchun katta til modeliga (LLM) qaytarilgan.

Bularning barchasi yanada qobiliyatli SLMni o'qitish uchun etarli bo'lgan ma'lumotlar to'plamini yaratishga imkon berdi. Bundan tashqari, Phi-3 modelini ishlab chiqishda xavflarni boshqarish va kamaytirish uchun ko'p darajali yondashuv qo'llanilgan, jumladan baholash, sinov va qo'lda sozlash. Natijada, u da'vo qilganidek Microsoft, Phi-3 modellar oilasidan foydalanadigan ishlab chiquvchilar xavfsizroq va ishonchli ilovalar yaratish uchun Azure AI-da mavjud asboblar to'plamidan foydalanishlari mumkin.

Shuningdek o'qing: Ilmiy nuqtai nazardan teleportatsiya va uning kelajagi

Microsoft Phi ChatGPT tipidagi modellarni almashtiradimi?

Arzimaydi. Kichik til modellari (SLM), hatto yuqori sifatli ma'lumotlarga o'rgatilgan bo'lsa ham, o'z cheklovlariga ega va chuqur o'rganish uchun mo'ljallanmagan. Yirik til modellari (LLM) hajmi va hisoblash quvvati tufayli murakkab fikrlashda SLM dan ustun turadi. LLMlar, ayniqsa, dori-darmonlarni kashf qilish kabi sohalarda foydali bo'ladi va bo'ladi, bu erda katta ilmiy maqolalar to'plamini qidirish va murakkab naqshlarni tahlil qilish kerak. Boshqa tomondan, SLM uzoq matnli hujjatning asosiy fikrlarini umumlashtirish, kontent yaratish yoki mijozlarga xizmat ko'rsatish chatbotlarini yoqish kabi oddiyroq vazifalar uchun ishlatilishi mumkin.

MicrosoftUning so'zlariga ko'ra, allaqachon gibrid modellar to'plamini ichki sifatida ishlatadi, bu erda LLM yetakchilik qiladi va kamroq hisoblash quvvatini talab qiluvchi ma'lum so'rovlarni SLMga yo'naltiradi va u boshqa murakkabroq so'rovlarni o'zi hal qiladi. Phi bulutdan foydalanmasdan, qurilmalarda hisoblash uchun joylashtirilgan. Biroq, kichik til modellari va bulutdagi katta modellar bilan olinishi mumkin bo'lgan aql darajasi o'rtasida hali ham bo'shliq bo'ladi. LLMning uzluksiz rivojlanishi tufayli bu bo'shliq tez orada yo'qolishi dargumon.

Phi-3 hali tashqi mustaqil tomonlar tomonidan tekshirilmagan. Microsoft ba'zida raqobatchilarga nisbatan ekstremal holatlarda 25 baravar yuqori samaradorlik yoki energiya samaradorligi haqida gapiradi, bu juda ajoyib ko'rinadi. Garchi, boshqa tomondan, bu yillar o'tganini unutib bo'lmaydi Microsoft bizni IT innovatsiyalari bo'yicha yaqqol yetakchi ekanligidan biroz ajratdi va ehtimol shuning uchun ham bunga ishonmaymiz. Bir zumda javob beradigan va yaratish o'rniga oflayn rejimda ishlaydigan AIga asoslangan dasturlar? Bu hozirgi inqilobning munosib cho'qqisi bo'lar edi. Afsuski, bitta asosiy muammo bor.

Shuningdek o'qing: Neuralink Telepatiya chipi haqida hamma narsa: bu nima va u qanday ishlaydi

Phi-3 dan Microsoft faqat ingliz tilini tushunadi

Phi-3 ommaviy ravishda unga tashlangan petabaytlarni yutib yubormadi. Modelni puxta va sinchkovlik bilan o'rgatish kichik bir muammoni o'z ichiga oladi. Phi-3 ingliz tilidagi ma'lumotlar bilan o'qitilgan va hozircha boshqa til haqida tasavvurga ega emas. Nafaqat ukrain, balki nemis, ispan, frantsuz yoki xitoy tillarida ham. Albatta, bu butun dunyo bo'ylab ko'pchilik foydalanuvchilarga uning jozibadorligini sezilarli darajada kamaytiradi.

Lekin ichida Microsoft rivojlantirish va takomillashtirish bo‘yicha ishlar olib borilayotganiga ishonch bildirdi. Garchi Ukraina bozori har qanday yirik korporatsiyalar uchun ustuvor ahamiyatga ega ekanligi bilan o'zingizni aldamasligingiz kerak. Shuning uchun biz ukrain tilini qo'llab-quvvatlash uchun juda uzoq vaqt kutishimiz kerak. Ammo bu haqiqat ishqibozlarni va taraqqiyot bilan birga bo'lishni xohlaydiganlarni hech qachon to'xtatmadi.

Shuningdek o'qing:

Muallifdan ko'proq

Ro'yxatdan o'tish

0 Izoh

O'rnatilgan sharhlar

Barcha sharhlarni ko'ring

Boshqa maqolalar