V benchmarku CVTG-2K, který měří přesnost při umísťování textu na více umístění obrázků, dosáhl GLM-Image skóre přesnosti slova 0,9116, což je první místo mezi modely s otevřeným zdrojovým kódem. Model také vedl test LongText-Bench pro vykreslování rozšířených textových pasáží a dosáhl skóre 0,952 pro angličtinu a 0,979 pro čínštinu v osmi scénářích včetně značek, plakátů a dialogových oken.
Model nativně podporuje více rozlišení od 1024 × 1024 do 2048 × 2048 pixelů bez nutnosti přeškolování, dodala zpráva.
Strategie optimalizace hardwaru
Školení GLM-Image na hardwaru Ascend vyžadovalo, aby Zhipu vyvinul vlastní optimalizační techniky pro architekturu čipů Huawei. Společnost vytvořila školicí sadu, která implementuje dynamické grafové víceúrovňové zřetězené nasazení, což umožňuje souběžné provádění různých fází školicího procesu a snižuje úzká místa.
Zdroj: techadvisor.com