Stable Diffusionqa huk ukhu yachay, qillqamanta-rikch'aman tukuchiq wallpamam, 2022 watapi kacharisqa. Ñawpaqtaqa qillqa sut'inchaykunapi kunrisyunasqa nisqa sut'i rikch'akunata paqarichinanpaqmi llamk'achisqa, ichataq huk llamk'anakunamanpas llamk'achiy atikunmi, ahinataq inpainting, outpainting, chaymanta rikch'amanta rikch'aman t'ikraykunata paqarichiy, qillqa tapuywan pusasqa.[1] Kayqa ruwasqa karqan qallariq-ruruchi Stability AIwan kuska, askha yachay mask'aykachaqkunawan, mana qullqipaq tantanakuykunawan ima.

Stable Diffusionwan mirachisqa utqachi (prompt): huk ch'usaq wamp'uq kawallupi sillakuchkanpa lantiqillqan

Stable Diffusion nisqaqa pakasqa kaq diffusion wallpamam, huk rikch'aq ukhu paqarichiq ankucha llika. Kaypa pukyu qillqa chaymanta wallpama llasayninkuna llapa runaman lluqsichisqa kanku,[2] chaymanta aswan rantiq hardware kaqpi puriyta atin huk tupuykukusqa GPU kaqwan 8 kaqwan aswan pisi kaqwan GB VRAM. Kayqa huk ripuyta ñawpaq kapuqniyuq qillqamanta siq'iman wallpamakunamanta DALL-E chaymanta Midjourneyhina riqsichirqa mayqinkunachus phuyu qaranakunawanlla yaykuy atikunku.[3]

Wiñarichiy

llamk'apuy

Stable Diffusion wiñarichiyqa, qallariq-ruruchi Stability AIwanmi qullqiwan ruwasqa karqan, chaymantapas ruwasqa karqan.[4] Chay wallpamapaq técnica licenciaqa CompVis qutumanta Ludwig Maximilian Munich Yachay Sunturpi lluqsichisqa karqan. Wiñarichiytaqa umallirqaku Patrick Esser Runwaymanta hinaspa Robin Rombach CompVismanta, paykunam karqaku chay investigadorkunamanta, paykunam ñawpaqtaraq inventarqaku arquitectura wallpama de difusión latente nisqa, chaytam servichikurqa Stable Diffusion nisqa. Stability AI nisqapas EleutherAIman LAIONmanpas (huk Alimañamanta mana qullqipaq llamk'aqmi, chaymi huñurqan chay willaku llumpapi, chaypim Stable Diffusion nisqa yachachisqa karqan) chay proyectopa yanapaqninkunahina.

2022 watapi octubre killapin Estabilidad AI nisqa 101 dólares estadounidenses qolqeta huñurqan hunu huk muyupi Lightspeed Venture Partnerswan Coatue Management umalliqninwan.[5]

Allwiyakama

llamk'apuy
 
Stable Diffusionwan llamk'achisqan arquitectura de difusión latente nisqamanta siq'i
 
Stable Diffusion nisqapa llamkachisqan desruido nisqa ruway. wallpamaqa siq'ikunatam paqarichimun, ruyru aleatorio nisqa iterativamente desruido nisqawan, huk yupay ruwasqa llamkanakuna chayanankama, CLIP qillqa codificador nisqawan pusasqa, hamutaykunapi ñawpaqmanta yachachisqa mecanismo de atención nisqawan kuska, chaymi munasqa siq'iqa yachachisqa yuyaypa representacionninta qawachin.

Wasimusika

llamk'apuy

Stable Diffusion nisqaqa huk laya difusión wallpama (DM) nisqatam llamk'achin, chaytam sutichanku difusión latente nisqa wallpama (LDM) nisqawan, CompVis qutu LMU Munich nisqapi ruwasqan. [2] 2015 watapi riqsichisqa, difusión nisqa wallpamakuna yachachisqa kanku, chaywanmi hurqunku qatiqninpi aplicaciones de ruido gaussiano nisqakunata capacitación nisqa siq’ikunapi, chaymi yuyaymanakunman huk secuencia de autocodificadores desruidos nisqa hina . Stable Diffusion nisqaqa 3 rakiyuqmi: autocodificador variacional (VAE), U-Net, chaymanta huk codificador de texto opcional nisqa. [6] VAE codificador nisqaqa siq'ita pixel espaciomanta aswan huch'uy dimensional pakasqa espacioman ñit'in, siq'ip aswan fundamental semántico significadonta hap'ispa. Ruyru gaussiano nisqataqa iterativamentem churakun chay representación latente comprimida nisqaman, ñawpaqman difusión nisqapi. [6] U-Net bloqueqa, ResNet wasanmanta ruwasqa, ñawpaqman difusión nisqamanta qhipaman lluqsiyta desruido ruwan, pakasqa rikuchiyta tarinapaq. Tukuyninpiqa, VAE decodificador nisqa qhipa siq'ita paqarichimun, rikuchiyta pixel espacioman kutichispa. [6] Chay desruido ruwayqa flexible hinam condicionasqa kanman huk cadena de texto nisqapi, huk imagen nisqapi utaq huk modalidad nisqapi. Chay codificasqa condicionamiento willakuyqa U-Nets desruido nisqamanmi churasqa kachkan huk mecanismo de atención cruzada nisqawan . [6] Qillqapi condicionamiento kaqpaq, takyasqa, ñawpaqmanta yachachisqa CLIP ViT-L/14 qillqa codificador llamk'achkan qillqa mañakuykunata huk churasqa espacioman tikranapaq. [2] Yachaysapa runakunam qawarichinku yapasqa eficiencia computacional nisqa capacitacionpaq chaymanta generacionpaq huk ventaja hina LDMs nisqamanta.

Amañay willaku

llamk'apuy

Amañay thatkichinakuna

llamk'apuy

Mana atiykuna

llamk'apuy

Tukuy atiyninkuna

llamk'apuy

Hawa t'inkikuna

llamk'apuy

Pukyukuna

llamk'apuy
  1. Diffuse The Rest - a Hugging Face Space by huggingface
  2. 2,0 2,1 2,2 Stable Diffusion Repository on GitHub Pukyumanta willaypi pantasqa: Etiqueta <ref> no válida; el nombre «stable-diffusion-github» está definido varias veces con contenidos diferentes
  3. The new killer app: Creating AI art will absolutely crush your PC
  4. Korn, Jennifer (2023-01-17). Getty Images suing the makers of popular AI art tool for allegedly stealing photos (en)
  5. Stability AI, the startup behind Stable Diffusion, raises $101M
  6. 6,0 6,1 6,2 6,3 Alammar, Jay. The Illustrated Stable Diffusion
"https://qu.wikipedia.org/w/index.php?title=Stable_Diffusion&oldid=668153" p'anqamanta chaskisqa (Wikipedia, Qhichwa / Quechua)