Çinin "Tencent" şirkəti tək təsvir əsasında 3D kosmik effektli video ardıcıllığı yaratmağa qadir olan açıq süni intellekt modelini - "HunyuanWorld-Voyager"i təqdim edib. Alqoritm virtual səhnədə kamera hərəkətini simulyasiya etməyə və 3D modelləşdirmədən 3D effekti yaratmağa imkan verir. Yaradılan hər bir klip 49 kadrdan (2 saniyə) ibarətdir və bir neçə video bir neçə dəqiqəlik videolara birləşdirilə bilər.
“İki sahil” xəbər verir ki, bu barədə "Kommersant" məlumat yayıb.
"HunyuanWorld-Voyager" 100.000-dən çox videoklip üzərində təlim keçib və kamera hərəkət edərkən obyektləri dəqiq yerləşdirmək üçün məkan koherensiyası mexanizmlərindən istifadə edir. Model tərs həndəsi əlaqələri olan çərçivələr istehsal edir ki, bu da digər AI video generatorlarına nisbətən daha möhkəm məkan uyğunluğu təmin edir.
Tencent qeyd edir ki, "HunyuanWorld-Voyager" əhəmiyyətli hesablama resursları tələb edir: 540p səhnələr üçün ən azı 60 GB video yaddaş, daha yüksək ayırdetməli videolar üçün 80 GB tövsiyə olunur. Modelin mənbə kodu Hugging Face platformasında dərc olunub, lakin kommersiya istifadəsi üçün ayrıca lisenziya tələb olunur.