Root NationАхборХабарҳои ITМисли дар филмҳо: AI-и нави коркарди аксҳои Google миқёс ва такмили онҳоро ба воқеият табдил медиҳад

Мисли дар филмҳо: AI-и нави коркарди аксҳои Google миқёс ва такмили онҳоро ба воқеият табдил медиҳад

-

Эҳтимол шумо филмҳои фантастикӣ ё намоишҳои телевизиониро дидаед, ки дар он қаҳрамони асосӣ хоҳиш мекунад, ки тасвирро васеъ кунад ва натиҷаро беҳтар кунад - нишон додани чеҳра, рақами мошин ё ягон ҷузъиёти дигари калидӣ. Системаҳои охирини зеҳни сунъии Google (AI) дар асоси ба ном моделҳои диффузия, ин найрангро ичро карда метавонанд.

Азхуд кардани ин як раванди душвор аст, зеро он аслан илова кардани тафсилот ба тасвире мебошад, ки камера дар аввал сабт накардааст, бо истифода аз тахминҳои хеле оқилона дар асоси дигар тасвирҳои шабеҳ.

Google

Дар Google, ин усул синтези тасвири табиӣ номида мешавад ва дар ин сенарияи мушаххас, ҳалли ултра-баланди тасвир. Шумо бо як акси хурди пикселӣ оғоз мекунед ва бо чизи равшан, равшан ва табиӣ хотима медиҳед. Он метавонад аслан аслӣ набошад, аммо он ба қадри кофӣ наздик аст, ки ба чашми инсон воқеӣ бошад.

Google барои ин кор ду асбоби нави AI-ро муаррифӣ кард. Аввалин SR3 ё Super-Resolution тавассути такмилдиҳии такрорӣ номида мешавад ва он тавассути илова кардани садо ба тасвир ва сипас нест кардани он кор мекунад. Тавассути як қатор ҳисобҳои эҳтимолӣ дар асоси пойгоҳи бузурги тасвирҳо ва баъзе ҷодуи омӯзиши мошин, SR3 метавонад тасаввур кунад, ки версияи баландсифати тасвири пикселии пастсифат чӣ гуна аст.

Воситаи дуюм CDM ё моделҳои каскади диффузия мебошад. Google онҳоро ҳамчун "қубурҳо" тавсиф мекунад, ки дар он моделҳои диффузия, аз ҷумла SR3, метавонанд барои баланд бардоштани сифати баланд равона карда шаванд. Он моделҳои такмилёфтаро мегирад ва онҳоро ба тасвирҳои калонтар месозад.

Google

Ба гуфтаи Google, бо истифода аз моделҳои гуногуни такмилдиҳӣ дар қарорҳои гуногун, равиши CDM метавонад аз усулҳои алтернативии баланд бардоштани тасвир бартарӣ диҳад. Муҳаррики нави AI дар ImageNet, як пойгоҳи бузурги тасвирҳои таълимӣ, ки одатан барои таҳқиқот дар шинохти объекти визуалӣ истифода мешавад, озмуда шуд.

Натиҷаҳои ниҳоии SR3 ва CDM таъсирбахшанд. Дар озмоиши стандартӣ бо 50 ихтиёриёни инсонӣ, тасвирҳои чеҳраҳои инсон, ки аз ҷониби SR3 сохта шудаанд, тақрибан 50% вақт бо аксҳои воқеӣ иштибоҳ карда шуданд - ва бо назардошти он, ки алгоритми идеалӣ бояд ба 50% ноил шавад, ин таъсирбахш аст. Қайд кардан бамаврид аст, ки ин тасвирҳои мукаммалшуда мувофиқати дақиқи аслӣ нестанд, онҳо моделиронӣ бодиққат дар асоси математикаи эҳтимолият ҳисоб карда шудаанд.

Google

Google аз муҳаррикҳои нави сунъии сунъӣ ва технологияҳои ба он алоқаманд на танҳо дар робита ба афзоиш додани тасвирҳои чеҳраҳо ва дигар объектҳои табиӣ, балки дар дигар соҳаҳои моделсозии эҳтимолӣ ҳам бештар ваъда медиҳад.

Ҳамчунин хонед:

Сарчашмаилмӣ
қайд кардан
Огоҳӣ дар бораи
меҳмон

0 Назарҳо
Баррасиҳои воридшуда
Ҳамаи шарҳҳоро бинед
Барои навсозиҳо обуна шавед