Ugrás a tartalomra
CIVILHETES
  • Belföld
  • Külföld
  • Gazdaság
  • Vélemény
  • +
    • Időjárás
    • Kultúra
      • Film
      • Zene
    • Tudomány
      • Környezet
      • Technika
      • Kütyü
    • Életmód
      • Egészség
      • Gasztro
      • Sport
      • Állati
    • Bulvár
      • Kék
      • Rejtély
    • Fiatal
    • Videó

A valóság vége? – Az OpenAI videógenerátora szövegből generál mozgóképet hihetetlen valósághűen

Technika
2024.02.17.
Profile picture for user Rambo
Rambo
  • facebook-f
  • twitter
  • envelope
  • print

A ChatGPT mögött álló cég következő nagy dobása a Sora – a videógenerátor szöveges parancsokból generál élethű videókat.

Ezzel véget érhet a generált videók inkább abszurd eredményeket hozó csecsemőkora, és beléphetünk az élethű és fiktív álrealitás korába. A Sora azonban ugródeszka is, amely elvezethet az emberivel egyenértékű általános mesterséges intelligenciához.

Tavaly még jókat lehetett szörnyülködni és mulatni a mesterséges intelligencia által generált videókon, de úgy tűnik, ez a korszak lezárult – és ami azt illeti, a fejlődés nem is vett igénybe túl hosszú időt. Azt persze nehéz megmondani, hogy hova vezet az MI fejlődése, ahogy azt is, hogy bizonyos mérföldköveket mikor érünk el – ha egyáltalán –, de az már körvonalazódni látszik, hogy most jó eséllyel nincs szó egy befektetőket vonzó lufiról. Sőt a terület fejlődésének a mértéke még a kutatókat is meglepi.

Hogy túl sokat várunk a mesterséges intelligenciától, indokolatlanul félünk-e tőle esetleg, vagy éppen hogy nem vagyunk tisztában a veszély mértékével – mind olyan kérdés, ami a szakértőket is megosztja – akárhogy is a szöveg és a képgenerálás után itt a következő lépés: a videógenerálás, ami működik is. A héten ugyanis a ChatGPT mögött álló OpenAI bemutatta a Sorát.

Így festett Kalifornia az aranyláz idején. A videót teljesen a Sora generálta:

A Sora egy fejlett mesterséges intelligencia-modell, amelyet arra terveztek, hogy valósághű és fiktív videojeleneteket hozzon létre szöveges utasításokból, és célja a mozgásban lévő fizikai világ szimulációja. A Sorát a közlemény alapján az emeli ki a sorból, hogy akár egy perces videókat is készít (ez jócskán túlmutat az eddig szokásos pár másodperces jeleneteken), és teszi ezt kiváló képminőséggel és a felhasználói utasításokhoz hűen. A Sorát jelenleg a szakértői csapatok értékelik a potenciális kockázatok szempontjából, valamint kreatív szakemberek is dolgoznak most már rajta, hogy visszajelzéseket küldjenek a hatékonyság fokozása érdekében.

A lenti videót a következő utasítással generálták: Egy stílusos nő sétál egy tokiói utcán, amelyet meleg fényű neonok és animált városi táblák töltenek meg. Fekete bőrdzsekit, hosszú piros ruhát és fekete csizmát visel, és fekete táskát hord. Napszemüveget és piros rúzst visel. Magabiztosan és laza módon sétál. Az utca nedves és visszatükröződő, tükrözve a színes fényeket. Sok járókelő sétál körülötte.

A Sora technológiája lehetővé teszi bonyolult jelenetek generálását több szereplővel, változatos mozgásokkal és részletes hátterekkel, miközben megőrzi a nyelv és a fizikai világ mély megértését is. Lenyűgöző képességei ellenére a Sorának akadnak az OpenAI által is bavallott korlátai, például pontatlanságok a bonyolult fizika szimulációk során, valamint a térbeli részletek és az idő múlásával kapcsolatos eseménysorozatok kapcsán is köhög még kicsit a rendszer.

A lenti videó mögötti utastítás csak annyi, hogy a régészek a sivatagban kiástak egy műanyagszéket. Mint látható, a videó jól szemlélteti a modell jelenlegi gyengeségeit:

A biztonság érdekében az OpenAI számos intézkedést hajt végre, mielőtt a Sorát integrálná a termékeibe. A biztonsági szakértők, az úgynevezett “red teamerek” például különféle támadási módszereket és próbálkozásokat alkalmaznak, hogy teszteljék a rendszert. Ezen szakemberek célja, hogy felfedezzék a rendszer esetleges biztonsági réseit és sebezhetőségeit, éppen úgy, mintha valódi támadók lennének. Ezen kívül jelenleg még a félrevezető tartalom észlelésére szolgáló eszközök fejlesztése folyik, valamint a DALL-E 3 meglévő biztonsági protokolljainak az alkalmazása. Ezek a lépések a félretájékoztatással, a gyűlöletkeltő tartalommal és az elfogultsággal kapcsolatos problémák mérséklését célozzák.

A modell diffúziós technikákat alkalmaz, amely a statikus zajból indul ki, majd ezt ismétlődően finomítja, hogy végül tiszta videókat készítsen. A Sora a méretezéshez a transzformátor architektúrát használja fel, és a videókat és a képeket adatfoltok gyűjteményeként kezeli, lehetővé téve a vizuális adatok betanításának a széles skáláját. A DALL-E és GPT modellek korábbi kutatásaira építve a Sora újrafeliratozási technikákat használ a szöveges utasítások jobb betartása érdekében, és képes animálni az állóképeket vagy kiterjeszteni a videókat figyelemre méltó részletességgel.

A Sorát azonban az OpenAI sem csak videogenrátornak, illetve terméknek szánja, ahogy a cég korábbi modelljei is (mint az fentebb tehát olvasható) elvezettek a későbbi modellekhez, úgy a Sora is egy mérföldkő a végső cél, az általános mesterséges intelligencia (AGI) felé vezető úton. Ennek oka pedig, hogy a Sora lehet az alapja azoknak a későbbi modelleknek, amelyek képesek megérteni és így szimulálni a valódi világot – ami tehát az emberi intelligenciával egyenértékű AGI talán legfontosabb jellemzője. (Rakéta)

Címlapkép forrása: openai.com/sora
MESTERSÉGES INTELLIGENCIA
OpenAI
GENERATÍV INTELLIGENCIA
VIDEÓGENERÁTOR
Profile picture for user Rambo
Rambo
Publikálva 2024.02.17. - 06:53
A- A+
  • facebook-f
  • twitter
  • envelope
  • print

 

Választási visszaszámláló

  • Csütörtöktől tovább drágulnak az üzemanyagok

    Csütörtöktől tovább drágulnak az üzemanyagok

  • Menekülő rajt

    Menekülő rajt

  • Bántalmazás hatósági engedéllyel – Határokon átnyúló jogsértés, hamis vád és a gyerekvédelem totális csődje egy magyarországi elhelyezési ügyben

    Bántalmazás hatósági engedéllyel – Határokon átnyúló jogsértés, hamis vád és a gyerekvédelem totális csődje egy magyarországi elhelyezési ügyben

  • Több mint egy éve hatályban van az EU-s sajtószabadság-törvény, de az Orbán-kormány kibújik ez alól is

    Több mint egy éve hatályban van az EU-s sajtószabadság-törvény, de az Orbán-kormány kibújik ez alól is

  • Addig keresték Nagy Mártonék az infláció okát, amíg meg nem találták

    Addig keresték Nagy Mártonék az infláció okát, amíg meg nem találták

  • Kisfaludy-pénzek: egyre furcsább helyeken landolnak a kormányzati támogatások

    Kisfaludy-pénzek: egyre furcsább helyeken landolnak a kormányzati támogatások

  • Leállt Marseille-ban a repülőtér a város körül pusztító erdőtűz miatt

    Leállt Marseille-ban a repülőtér a város körül pusztító erdőtűz miatt

  • Szabotőröket ítéltek el Londonban: a szálak a rettegett Wagner-csoporthoz vezetnek

    Szabotőröket ítéltek el Londonban: a szálak a rettegett Wagner-csoporthoz vezetnek

  • Drámai hírek érkeztek a történelmi erejű természeti katasztrófáról, 161 embert még mindig nem találnak

    Drámai hírek érkeztek a történelmi erejű természeti katasztrófáról, 161 embert még mindig nem találnak

  • Senki sem kényszerít arra, hogy extrém gazdag legyél – interjú a vagyonát szétosztogató osztrák milliárdossal

    Senki sem kényszerít arra, hogy extrém gazdag legyél – interjú a vagyonát szétosztogató osztrák milliárdossal

  • Orbán Balázs sajnálja a civilektől a 8 milliárdot, miközben az általa vezetett MCC csak a Richtertől kapott ugyanennyit tavaly

    Orbán Balázs sajnálja a civilektől a 8 milliárdot, miközben az általa vezetett MCC csak a Richtertől kapott ugyanennyit tavaly

  • Nyomkövetővel tartanák távol a kormány által meghívott vezetőktől az ellenük tüntetőket

    Nyomkövetővel tartanák távol a kormány által meghívott vezetőktől az ellenük tüntetőket

  • Igazságügyi szakértők vizsgálják, ki lehet az újdörögdi kézigránátos baleset felelőse

    Igazságügyi szakértők vizsgálják, ki lehet az újdörögdi kézigránátos baleset felelőse

  • Itt szétlopják az országot, szavakkal már képtelenség megfékezni a gazdasági elit tagjait

    Itt szétlopják az országot, szavakkal már képtelenség megfékezni a gazdasági elit tagjait

  • Kormányzati hátsó szándék látszik a gazdaságra káros, silány elővásárlási szabálynál

    Kormányzati hátsó szándék látszik a gazdaságra káros, silány elővásárlási szabálynál

  • Dopeman szellemesnek vélt szóviccekkel próbálja eladni a tájékozatlanságát

    Dopeman szellemesnek vélt szóviccekkel próbálja eladni a tájékozatlanságát

  • Kínos ügyet feszegettek a Fehér Házban: Trump ingerültté vált, minisztere magyarázkodásra kényszerült

    Kínos ügyet feszegettek a Fehér Házban: Trump ingerültté vált, minisztere magyarázkodásra kényszerült

  • Halálos fenyegetést kapott a bírónő, mert felmentette az egyetemistákat

    Halálos fenyegetést kapott a bírónő, mert felmentette az egyetemistákat

  • Új kampányvegyvert vet be a Tisza vidéken

    Új kampányvegyvert vet be a Tisza vidéken

  • Egy pécsi család elárverezett házát a végrehajtók vezetőinek másik cége vette meg

    Egy pécsi család elárverezett házát a végrehajtók vezetőinek másik cége vette meg

  • Karácsony von der Leyennel tárgyalt – Az EP-ben téma lesz a Pride

    Karácsony von der Leyennel tárgyalt – Az EP-ben téma lesz a Pride

  • Kérek még

Maradjon velünk!

 

  • instagram
  • facebook-f
  • twitter
  • coub
  • youtube

Rovatok

  • Belföld
  • Külföld
  • Gazdaság
  • Vélemény
  • Minden más

Sokat kattintott címkék

Belföld
Külföld
Gazdaság
Vélemény
ORBÁN VIKTOR
Magyar Péter
Fidesz
Időjárás
időjárás-előrejelzés
Magyarország
orvosmeteorológia
Oroszország
Környezet
Tudomány
politika
Kultúra
UKRAJNA
Technika
Novák Katalin
EURÓPAI UNIÓ
BUDAPEST
Egészség
EGÉSZSÉGÜGY
Sport
© 2011-2024 CIVILHETES /Középen állunk/

Lábléc menü

  • Impresszum
  • Jogi nyilatkozat
  • Adatkezelés
  • Régi CIVILHETES
Címlap
CIVILHETES
Független Közéleti Magazin
  • Belföld
  • Külföld
  • Gazdaság
  • Vélemény
  • +
    • Időjárás
    • Kultúra
      • Film
      • Zene
    • Tudomány
      • Környezet
      • Technika
      • Kütyü
    • Életmód
      • Egészség
      • Gasztro
      • Sport
      • Állati
    • Bulvár
      • Kék
      • Rejtély
    • Fiatal
    • Videó
Clear keys input element