V oblasti generování obrazu pomocí umělé inteligence OpenAI nadále představuje pokroky, které, jak se zdá, posouvají hranici možného. Důkazem je prezentace téhož měsíce září DALL-E3, nový algoritmus, který představuje skutečnou revoluci ve světě generování textu na obrázek.
DALL-E3 je model, který vychází z DALL-E 2 a ChatGPT, ale především vyniká v úkolu „překládat“ textové popisy do obrázků s vysokou úrovní detailů a přesností. Výsledky, s ohledem na obrázky, které dosud unikly (některé z nich uvádíme v tomto článku), jsou prostě působivé.
Tento výkonný model AI Je stále v rané fázi vývoje a výzkumu.. To, co je zatím známo, však rozhodně vyvolává nadšení. Je to oznámení budoucnosti technologie generování obrazu, scénáře, který zdánlivě nezná hranic a který nás nepochybně mnohokrát nechá beze slova.
O DALL-E 3 je ještě potřeba prozradit mnoho podrobností, ale s tím, co je již známo, můžeme nakreslit malou prezentaci toho, co nám tento nástroj může nabídnout:
Co je generování textu na obrázek?
To je jedna z oblastí, kde je dopad umělé inteligence na naše životy nejzřetelnější. Modely jako DALL-E 3 vytvářejí neuronové sítě pro transformaci textů na živé, vysoce realistické obrázky.
Tyto modely porozumět a interpretovat naše písmo, zachycovat složité detaily, barvy a kontexty a vytvářet pozoruhodné vizuální reprezentace. Existuje mnoho aplikací pro tento nový způsob generování obrázků: umění, design, tvorba obsahu... Mocný nástroj pro oživení kreativních nápadů.
Nový způsob generování obrázků z textu
DALL-E 3 byl speciálně navržen tak, aby předefinoval způsob generování obrázků z textu. Dosud prezentovaná řešení často zaostávají, protože ignorují určitá slova nebo výrazy. Jinými slovy: pouze uživatelé, kteří jsou odborníky na jazyk rychlého inženýrství, jej mohou využít.
Naopak DALL-E 3 představuje radikální změnu. Pokrok, který znamená, že tuto technologii může používat každý uživatel a získat neuvěřitelné výsledky bez složitostí.
Díky dokonalé integraci s ChatGPT se DALL-E 3 stává kreativním a citlivým partnerem na naše požadavky. Jediné, co musíme udělat, je předat mu naše myšlenky pomocí slov a popisů a nechat algoritmus udělat zbytek práce: dát život našim myšlenkám, generování personalizovaných obrázků s velkým vizuálním dopadem.
větší přesnost
V předchozí verzi DALL-E se vyskytly stejné problémy jako ve zbytku generativních modelů umělé inteligence. Způsob interpretace složitých textových zpráv nebyl vždy správný. Někdy se dokonce koncepty při generování obrázků míchaly, což vedlo k absurdním nebo groteskním výsledkům.
Ale na rozdíl od svých předchůdců DALL-E 3 je navržen tak, aby porozuměl textovým výzvám s pozoruhodnou mírou přesnosti, zachycující nuance a detaily jako nikdy předtím.
Etické otázky a transparentnost
O etické debatě kolem obrázků generovaných umělou inteligencí už mluví mnoho lidí, nejen odborníků. Pro vyvarujte se vytváření obrázků s násilným, pornografickým obsahem nebo obrázků, které mohou podněcovat nenávist, DALL-E 3 obsahuje určitá bezpečnostní opatření, která omezují některé aspekty generování obsahu. Má také filtr, který zabraňuje generování obrázků veřejných osob, čímž chrání jejich soukromí a bojuje proti této formě falešné novinky.
Další starostí těch, kdo jsou za DALL-E 3 odpovědní, je být co nejtransparentnější s jeho uživateli, pokud jde o „realitu“ jejich obrázků. Nemůže tomu být jinak, protože obsah generovaný umělou inteligencí je na internetu stále častější a roste potřeba být co nejtransparentnější při identifikaci uvedeného obsahu. Opět je záměrem vyhnout se podvodům a nedorozuměním a položit základy pro zodpovědné používání této nové technologie. Jestli to není chiméra.
Z tohoto důvodu OpenAI aktivně zkoumá nové způsoby, jak pomoci lidem odlišit obrázky vytvořené umělou inteligencí od obrázků vytvořených lidmi. Nyní se testuje interní nástroj, který již byl pojmenován "klasifikátor provenience". Teoreticky bude díky tomuto přístroji možné určit, zda byl obrázek vygenerován pomocí DALL-E 3, a proto se nejedná o skutečný obrázek.
Datum vydání
Pokud vše půjde podle plánu, DALL-E 3 bude veřejnosti představen v říjnu 2023. První, kdo bude mít možnost vidět, jak nový algoritmus funguje, budou uživatelé ChatGPT Plus a ChatGPT Enterprise. OpenAI hodlá implementovat DALL-E 3 ve fázovaném modelu, tedy dávkování jeho funkcionalit, ačkoliv zatím nepotvrdil konkrétní termín veřejného a bezplatného spuštění.