Obsah a umělá inteligence

Obsah a umělá inteligence: Co se skrývá za humbukem roku

ChatGPT a podobné nástroje vyvolaly v posledních měsících velký rozruch. Mohou být obrovským přínosem, v neposlední řadě při tvorbě obsahu. Zároveň byste si měli být vědomi omezení těchto nástrojů a pochopit, jak dosáhnout obzvláště dobrých výsledků.

V tomto článku vysvětluji, proč je nová generace nabídek AI mnohem lepší. Je to začátek seriálu na toto téma. Téma umělé inteligence prochází již několik desetiletí fázemi nadšení a sklíčenosti.

Předpovědi Elona Muska týkající se autonomních vozidel jsou u nás dobře známé: tato oblast na chvíli zaznamenala rychlý pokrok. Počítačem řízené taxíky a autobusy se zdály být na dosah. Křivka zlepšení se však brzy zploštila a nyní jsou prognózy v této oblasti mnohem opatrnější. V tomto ohledu jsem si zvykl na zdravou skepsi, pokud jde o takováto humbuková témata. 

To se však s ChatGPT rychle rozplynulo. Když jsem ho mohl poprvé vyzkoušet, byl jsem stejně ohromen jako nadšen: tento "chatbot" konečně fungoval tak, jak jeho mnozí předchůdci jen slibovali. Bylo to až neuvěřitelné.

Moderování obsahu ChatGPT
Nástroje umělé inteligence, jako je ChatGPT, mají mnoho oblastí použití.

ChatGPT odpovídá na dotazy úžasně lidským způsobem. A zdá se, že zná odpověď na každou otázku - nebo na několik. Na základě mého vstupu dynamicky upravuje typ, délku a složitost výstupu. Rozumí kontextu konverzace a dokáže čerpat z otázek a faktů, které byly vzneseny již dříve. Dlouhé a složité vstupy zpracovává s malým zpožděním. A také rozumí němčině a reaguje v ní.

Úžasně výkonný generátor textu

Rychle se ukázalo, že ChatGPT je nejen výkonný asistent s umělou inteligencí, ale také generátor textů s umělou inteligencí.

Mé předchozí pokusy s podobnými nástroji byly vždy velkým zklamáním. Produkty nikdy nedokázaly dostát marketingovým slibům. Hodily se snad jen k podněcování nápadů. Z některých z nich se daly vytěžit střípky. Ale texty byly málokdy užitečné jako celek.

S ChatGPT a jeho variantami a konkurenty je to nyní jinak: Při správném použití mohou poskytnout nejen nápady, ale také ucelený koncept a alespoň dobrý první návrh.

"*" povinný údaj

Rád bych se přihlásil k odběru newsletteru, abych byl informován o nových článcích na blogu, e-knihách, funkcích a novinkách ve WordPressu. Svůj souhlas mohu kdykoli odvolat. Více informací v našich Zásadách ochrany osobních údajů.
Toto pole slouží k ověření a nemělo by se měnit.

Jako člověk, který se z velké části živí psaním a editováním, to říkám nerad: to, co ChatGPT přináší, se často vyrovná tomu, co jsem viděl u lidských spisovatelů. Někdy je to dokonce lepší.

Po intenzivním testování se však projeví i omezení a zvláštní zvláštnosti těchto nových nástrojů umělé inteligence. Více informací o tom najdete níže.

Jak se tento pokrok stal možným?

Jak je ale vůbec možné, že došlo k takovému náhlému skoku v kvalitě? Obvykle se uvádějí tři body:

  1. Tréninková data: Dnešní modely AI se učí z existujícího obsahu (text, obrázky, zvuk, kód atd.). Množství dat, která jsou již digitálně k dispozici, se rychle zvyšuje, což velmi pomáhá při trénování.
  2. Výpočetní výkon: Specializované počítače a komponenty značně urychlily procesy tréninku a umožnily vytvářet větší a složitější modely.
  3. algoritmy: V neposlední řadě došlo k významným pokrokům pod kapotou. Například metoda "transformátoru " je považována za hlavní důvod, proč dnes umělá inteligence dokáže porozumět a generovat texty mnohem lépe než před několika lety.

Působivý je také pohled na počet "parametrů " jazykových modelů v posledních letech. Více parametrů umožňuje modelu zakódovat více znalostí a zvládnout složitější úlohy:

  • 2019, GPT-2: 1,5 miliardy parametrů
  • 2020, GPT-3: 175 miliard parametrů
  • 2022, PaLM: 540 miliard parametrů
  • 2022, GPT-4: přibližně 1 bilion parametrů
  • 2022. Claude: přibližně 10 bilionů parametrů

Tato čísla jsou fascinující, ale složitější modely nejsou vždy automaticky lepší nebo vhodnější volbou. Současným trendem je trénovat modely speciálněji pro určité úlohy a vhodně je upravovat. Lze proto očekávat, že kromě obecných nástrojů bude přibývat nabídek, které jsou určeny pro jasně definovaný účel. 

V této souvislosti jsou zajímavé i modely, které jsou navíc trénovány na individuálních datech: Například společnosti mohou do takového systému vkládat všechny své dokumenty a dynamicky získávat odpovědi.

Dalším zajímavým měřením, které se v poslední době dostává více do centra pozornosti, je délka kontextu. Čím větší je tato hodnota, tím více obsahu konverzace může nástroj zahrnout. Více kontextu tedy pomáhá umělé inteligenci vést delší konverzace, ale také zpracovávat větší vstupy. 

V závislosti na případu použití to může znamenat významný rozdíl, pokud nabídka, jako je například Anthropics Claude, zpracovává a analyzuje celé knihy během několika sekund.

Délka kontextu se měří v "tokenech", přičemž token zhruba odpovídá jednomu slovu. Některé příklady:

  • GPT-2: 1 024 žetonů
  • GPT-3: 2 048 žetonů (v nové verzi až 16 000 žetonů)
  • PaLM: 65 536 žetonů
  • GPT-4: až 32 000 žetonů
  • Claude: pravděpodobně kolem 100 000 žetonů

Delší kontext vyžaduje odpovídajícím způsobem větší výpočetní výkon a úložný prostor. Další zvyšování těchto hodnot je proto technickou výzvou.

Tři možnosti použití těchto nástrojů

Ti, kteří chtějí tyto nástroje používat, mají v současné době tři hlavní možnosti:

  1. V cloudu. ChatGPT, Claude, ale také generátory obrázků jako MidJourney nebo Stable Diffusion lze používat jako software jako službu. To znamená, že vlastní data jsou zpracovávána na serverech poskytovatelů. V závislosti na typu informací to může být poměrně problematické. Zároveň musíte být jako uživatel spokojeni s rozhraním a možnostmi nabídky. Společnosti jako OpenAI, Microsoft, Google nebo Anthropic k tomu mají specializované, obzvláště výkonné servery. 
  2. Prostřednictvím rozhraní API. Zejména OpenAI aktivně nabízí svá rozhraní. Ne všechny modely AI jsou okamžitě dostupné všem. Přesto je lze využít buď k implementaci vlastních aplikací, nebo k využití aplikací třetích stran. Zpracování dat zde stále probíhá na serverech společností zabývajících se AI. Kde a jak lze nabídku využít, je však v tomto případě možné přizpůsobit.
  3. Na vlastním počítači nebo serveru. Výkonnější jsou nejen specializované počítače, ale i běžně dostupné notebooky, tablety a dokonce i chytré telefony. S moderními a vhodně vybavenými zařízeními to může stačit k tomu, aby člověk používal nástroje, jako jsou asistenti umělé inteligence, přímo na vlastním počítači. Ty však nejsou tak výkonné jako špičkové aplikace v cloudu. To však není vždy nutné. Místo toho zůstávají v počítači vlastní data uživatele. Kromě toho si lze zvolit software a model podle vlastních potřeb. Příkladem je LM Studio pro Windows a Mac, s jehož pomocí lze na vlastním počítači používat jazykové modely, jako je rodina Meta Llama.

V současné době navíc existuje další trend, který se podle mého názoru stane ještě rozšířenějším: Asistenti s umělou inteligencí, kteří jsou integrovaní do jiných služeb. Příkladem je "Copilot" v Microsoft 365, "Firefly" od Adobe, Bing Chat nebo experimentální, umělou inteligencí podporovaný "Search Generative Experience" (SGE) od Googlu.

Limity nástrojů umělé inteligence

V dalších článcích této série vám podrobněji ukážu, jak já osobně využívám tyto služby k vyhledávání témat, vytváření nápadů a konceptů a tvorbě textů a obrázků. 

Přes všechno nadšení z možností a příležitostí, které tito noví pomocníci umožňují, mají své limity, kterých byste si měli být vědomi, a existuje i oprávněná kritika.

Například služba ChatGPT se naučila poskytovat jazykově správné a rozumně znějící odpovědi. Na to se zaměřuje. Naopak na platnost uvedených faktů a údajů nikoliv. Mohou být pravdivá, nebo mohou být smyšlená. Neměli byste tedy přijímat tvrzení, aniž byste si je ověřili.

V některých úlohách jsou tyto nástroje také zcela mimo své možnosti. Často si například nedokážou dobře poradit s čísly a výpočty.

Poskytovatelé se tomu snaží čelit. Na jedné straně mají být asistenti s umělou inteligencí vychováváni k větší poctivosti. Pokud něco přesně nevědí, měli by to dát jasně najevo. Na druhou stranu OpenAI přidala jako možnost pluginy: Díky tomu má ChatGPT přístup ke specializovaným nástrojům a zdrojům informací pro určitá témata a úkoly. Dalším příkladem je služba Bing Chat: Zdroje svých odpovědí dokládá odkazy a dává jasně najevo, když se jí nějakou informaci nepodařilo najít.

Znalosti asistenta s umělou inteligencí, jako je ChatGPT nebo Claude, navíc často sahají jen do určitého data. Vše, co se stalo od té doby, je neznámé. Tréninkový proces takové umělé inteligence je tak složitý a zdlouhavý, že nové informace nelze jednoduše přidávat. U některých témat si toho musíte být vědomi.

Dalším problémem je, že umělá inteligence může šířit, a tím posilovat předsudky a dezinformace, které našla ve svých tréninkových datech. Umělá inteligence přece nerozumí tomu, co v nich dělá. Obvykle také neprovádí kontrolu a výzkum.

Další věc, která mi u asistentů s umělou inteligencí v každodenním životě vždy chybí: nepoznají mě a neučí se z předchozích konverzací. Jak bylo popsáno výše, na jeden chat připadá určitá délka kontextu. Ale kontext v každém případě končí aktuálním chatem. Pokud začnu novou konverzaci, asistent umělé inteligence neví nic o předchozích interakcích. Doufám, že tyto služby budou v budoucnu ještě osobnější. SHO.AI něco takového slibuje.

Kritika nástrojů umělé inteligence

Zásadní kritikou nástrojů, jako je ChatGPT pro texty nebo Stable Diffusion pro obrázky, je tréninkový materiál. Jak již bylo popsáno, tato data jsou pro proces učení nepostradatelná. Autoři však často nebyli dotázáni, zda chtějí svá díla pro tento účel zpřístupnit, či nikoli. Skutečnost, že generátory obrázků s umělou inteligencí dokáží napodobit styl umělců, vyvolala rozruch. Jedná se o automatizované porušování autorských práv? Nebo je to srovnatelné s lidskými díly, která se také mohou inspirovat a ovlivňovat díly jiných? To jsou vzrušující otázky, které nás budou provázet ještě řadu let. 

Debata o tom bývá někdy bouřlivá. Není divu: někteří umělci se považují za nedobrovolné držitele sponek pro umělou inteligenci, která by je na oplátku mohla učinit zbytečnými. A společnosti vydělávají na produktu, který si vzal jejich práci zadarmo.

OpenAI nyní nabízí možnost, jak v budoucnu pro účely takového školení alespoň zablokovat obsah vlastních webových stránek.

To také vyvolává otázku, zda lze výsledky těchto nástrojů vůbec použít. O tom jsem hovořil s právníkem Dr. Carstenem Ulbrichtem. Jak už to tak bývá, na tuto otázku nelze odpovědět jednoznačně ano ani ne.

V neposlední řadě je zcela otevřená otázka, zda díla požívají autorskoprávní ochrany, pokud pocházejí od UI, a kdo je v tomto případě považován za autora. Podle některých je zde měřítkem to, kolik práce vykonala UI a kolik člověk. 

Závěr o obsahu a umělé inteligenci

Svět umělé inteligence zažívá v posledních měsících velký boom a rozruch. Jak se mi, doufám, podařilo v tomto příspěvku ukázat, nadšení není úplně z čistého nebe. Pokrok je jasně patrný. Nástroje lze využít pro každodenní úkoly a mohou být velkým přínosem.

Přesto nejsou dokonalí, dělají chyby, reagují neočekávaně nebo v úkolu zcela selžou (a mohou to i popřít). Navíc existuje oprávněná kritika toho, jak tyto nástroje pracují a jak získaly své dovednosti.

S ohledem na tyto body v další části seriálu ukážu, jak používám různé nástroje umělé inteligence pro kreativitu a produktivitu.

Vaše otázky týkající se obsahu a umělé inteligence

Jaký je váš názor na umělou inteligenci v oblasti obsahu? Jaké otázky jsou ještě otevřené? Sdělte nám je v komentářích. Chcete být informováni o dalších příspěvcích na téma WordPress a WooCommerce ? Pak nás sledujte na LinkedInFacebooku, Twitteru nebo prostřednictvím našeho newsletteru.

Líbil se vám tento článek?

Svou recenzí nám pomůžete zlepšit náš obsah.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Povinná pole jsou označena *.