ChatPDF: povídejte si s impaktovaným článkem nebo třeba zadávací dokumentací…

V článku „Bude AI vyplňovat návrhy projektů?“ jsme zmínili, že budeme postupně přinášet mj. tipy na zajímavé „AI aplikace“ relevantní z pohledu výzkumníků/výzkumnic a akademických pracovníků/akademických pracovnic. Tímto příspěvkem zahajujeme – doufáme – delší seriál.

Nedlouho po zpřístupnění online aplikace ChatGPT vznikla řada „mladších bratříčků“ této veleúspěšné aplikace. Jednou z nich je i ChatPDF (https://www.chatpdf.com/), která – jak už název napovídá – umožňuje v reálném čase vést dialog o obsahu uživatelem dodaného PDF. Netřeba dodávat, že v akademické m prostředí či prostředí výzkumu se to textovými dokumenty v PDF formátu jen hemží: journalové nebo konferenční články, diplomové a dizertační práce, ale třeba také zadávací dokumentace nejrůznějších veřejných soutěží ve VaVaI, různé strategické dokumenty, směrnice, předpisy, … atp.

Aktivní výzkumník/výzkumnice či akademický pracovník/akademická pracovnice tak často čelí nutnosti v krátkém čase zorientovat se v kvantech takových dokumentů. A právě v tom může aplikace typu ChatPDF pomoci – tato aplikace je dnes jednou z řady aplikací založených na „AI přístupech“, které mohou napomoci zvyšování efektivity každodenní práce, což může poskytnout jistou komparativní výhodu oproti těm, kteří se využívání takovýchto nástrojů z různých důvodů vyhýbají.

Základní ovládání online aplikace

Ovládání webové aplikace je – díky tomu, že jde o jednoúčelovou aplikaci – skutečně jednoduché a intuitivní. Hned na úvodní stránce je rozhraní pro načtení PDF dokumentu z disku uživatele či načtení dokumentu ze zadané URL. Uživatel/ka má též přístup k historii svých chatů.

Po načtení dokumentu lze okamžitě klást dotazy, respektive vést dialog, přičemž je jedno v jakém jazyce je dokument a v jakém jazyce se dotazujeme. Pro naši ukázku jsme zvolili jeden impaktovaný článek z oblasti NLP (počítačového zpracování přirozeného jazyka) a zadávací dokumentaci programu SIGMA DC3 Technologické agentury ČR.

Ukázky obou konverzací jsou k dispozici níže. Nejprve konverzace s „elsevierovským paperem“…

…a následně s „TAČRovskou zadávačkou“:

 

Dostupné verze a jejich omezení

V současné době (2. 5. 2023) je k dispozici free verze s následujícími omezeními: 3 PDF a 50 dotazů denně. Verze Plus umožňuje zpracovávat 50 PDF denně spolu s 1000 dotazy za den. Tato vyšší verze je tarifována 5 USD měsíčně. U obou verzí však platí ještě dodatečná omezení na rozsah a velikost zpracovávaných dokumentů.

K dispozici je rovněž možnost využívat API (application programming interface) pro volání této služby z různých aplikací. Podmínky využívání API jsou pak stanovovány individuálně na základě požadavků.

Příklady možného využití a potenciál API

Příkladů užití tohoto systému si každý dokáže představit hned několik: od poťouchlého, lehce znuděného člena státnicové komise, který do ChatPDF načte diplomovou práci aktuálně se potícího studenta, a následně ho začne znervózňovat otázkami k různým dílčím aspektům obhajované práce, přičemž bude „realtimově“ konfrontovat studentovy odpovědi s analýzou poskytovanou nástrojem ChatPDF až po sumarizaci různých výzkumných zpráv nebo rychlé zjišťování konkrétních informací z rozsáhlých strategických dokumentů psaných veřejnosprávným „newspeakem“.

Skutečná síla takovéhoto nástroje se ale může ukázat při integraci tohoto nástroje do dalších, např. analytických aplikací. Chcete vědět, jak se měnila váha daného bodovaného kritéria napříč různými veřejnými soutěžemi daného poskytovatele, pokud jsou k dispozici pouze v příslušných PDF se zadávacími dokumentacemi? V případě využívání ChatPDF API jde nyní o úlohu, která je zvládnutelná s přiměřenými zdroji. Nebo třeba generování souhrnů a analýz z kolekcí článků: „ve kterých článcích se používá metoda XY?“ atp.

Obecnou vlastností nástrojů tohoto typu (založených na velkých jazykových modelech), je potenciál aplikovat jeden, univerzální přístup na různé třídy úloh – od extrakce informací až po sumarizaci dokumentů.

Nástroje typu ChatPDF či ChatGPT (a jim podobné) poskytují na první pohled okouzlující výsledky, nicméně po chvíli experimentování s více či méně sofistikovanými dotazy (prompty) uživatel/ka zjistí, že není až tak náročné tyto nástroje přivést do úzkých. Pro někoho to může být argument pro paušální zavrhnutí těchto systémů. Jenže v této oblasti (možná více než kde jinde) platí, že to, co dnes vypadá problematicky, bude za pár týdnů či měsíců na prakticky použitelné úrovni a za dalších pár měsíců to překoná schopnosti člověka naprosto signifikantně.

Pro skutečně seriózní práci bude nutné takovéto nástroje evaluovat z pohledu nejrůznějších metrik a z perspektivy těchto výsledků pak tyto nástroje využívat. Každopádně je více než důležité tyto trendy sledovat a neustále přemýšlet o jejich možném nasazení v praxi. Jednou zmeškaný vlak – zejména na drahách AI – se zatraceně těžko dohání…

Martin Víta