Ehtimol, siz bosh qahramon tasvirni kattalashtirishni va natijani yaxshilashni so'raydigan fantastik filmlar yoki teleko'rsatuvlarni ko'rgansiz - yuzni, davlat raqamini yoki boshqa muhim tafsilotlarni ko'rsatish. Google'ning so'nggi sun'iy intellekt (AI) tizimlari, deb atalmish asosida diffuziya modellari, bu hiylani bajarishga qodir.
Buni o‘zlashtirish qiyin jarayon, chunki u aslida boshqa shunga o‘xshash tasvirlar asosida o‘ta aqlli taxminlar yordamida kamera suratga olmagan tasvirga tafsilotlarni qo‘shishdir.
Google-da bu usul tabiiy tasvir sintezi deb ataladi va ushbu maxsus stsenariyda ultra yuqori tasvir o'lchamlari. Siz kichik, pikselli fotosuratdan boshlaysiz va oxirida aniq, aniq va tabiiy narsaga erishasiz. Bu asl nusxa bo‘lmasligi mumkin, lekin u inson ko‘ziga real ko‘rinadigan darajada yaqin.
Google bu ish uchun ikkita yangi AI vositalarini taqdim etdi. Birinchisi SR3 yoki takroriy takomillashtirish orqali Super-Resolution deb ataladi va u tasvirga shovqin qo'shish va keyin uni olib tashlash orqali ishlaydi. Tasvirlarning katta ma'lumotlar bazasiga va ba'zi bir mashina o'rganish sehriga asoslangan bir qator ehtimollik hisob-kitoblari orqali SR3 past aniqlikdagi pikselli tasvirning o'ta yuqori aniqlikdagi versiyasi qanday ko'rinishini tasavvur qila oladi.
Ikkinchi vosita - CDM yoki Kaskadli diffuziya modellari. Google ularni "quvurlar" deb ta'riflaydi, ular bo'ylab diffuziya modellari, shu jumladan SR3 - yuqori sifatli tasvir o'lchamini oshirishga yo'naltirilishi mumkin. U takomillashtirish modellarini oladi va ularni kattaroq tasvirlarga aylantiradi.
Google ma'lumotlariga ko'ra, turli xil rezolyutsiyalarda turli xil yaxshilash modellaridan foydalangan holda, CDM yondashuvi tasvirni kengaytirishning muqobil usullaridan ustun turishi mumkin. Yangi sun'iy intellekt mexanizmi vizual ob'ektni aniqlashda keng tarqalgan tadqiqot uchun ishlatiladigan o'quv tasvirlarining ulkan ma'lumotlar bazasi ImageNet da sinovdan o'tkazildi.
SR3 va CDM ning yakuniy natijalari ta'sirli. 50 nafar ko‘ngilli inson ishtirokida o‘tkazilgan standart sinovda SR3 tomonidan yaratilgan inson yuzlari tasvirlari 50% ga yaqinida haqiqiy suratlar bilan adashtirilgan va ideal algoritm 50% ga yetishi kerakligini hisobga olsak, bu juda ta’sirli. Ta'kidlash joizki, ushbu kengaytirilgan tasvirlar asl nusxalarga to'liq mos kelmaydi, ular ehtimollik matematikasiga asoslangan sinchkovlik bilan hisoblangan simulyatsiyalardir.
Google o'zining yangi sun'iy intellekt dvigatellari va tegishli texnologiyalaridan ko'proq narsani va'da qilmoqda - nafaqat yuzlar va boshqa tabiiy ob'ektlarning tasvirlarini kengaytirish nuqtai nazaridan, balki ehtimollik modellashtirishning boshqa sohalarida ham.
Shuningdek o'qing: