Myslím, že dovtedy to nebude dlho trvať OpenAI vstúpi do hry aj pri vývoji vyhľadávacieho nástroja založeného na umelej inteligencii. Nové web crawler GPTBot cu modeširoký jazyk GPT-5 je už vydaný.
Tí, ktorí používajú ChatGPT viem to model širokého jazyka (LLM) momentálne beží GPT-3.5, ktorý je zaškolený na množine údajov aktualizovanej v septembri 2021. Ak teda od tohto dátumu požadujete novšie informácie, ChatGPT nedokáže poskytnúť presné informácie. Samozrejme platí pre bezplatnú verziu, ktorá nepodporuje použitie pomocných pluginov.
so začatím GPTBot, OpenAI má otvorenú cestu pre indexovanie webových stránok prostredníctvom tohto nového web crawler. Tak, ako to už dlhé roky robia spoločnosti ako Google, Microsoft, Yahoo a mnohé ďalšie.
GPT-5 a nový webový robot GPTBot vyvinutý spoločnosťou OpenAI.
nová web crawler GPTBot využíva web agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Vlastníci webových stránok môžu kontrolovať indexovanie webových stránok prostredníctvom súboru robots.txt
pomocou rovnakých smerníc ako pre ostatné web crawlera iných spoločností.
Napríklad, ak si to neželá majiteľ webovej stránky OpenAI na zhromažďovanie informácií zo stránky, môže pridať robots.txt
čiary:
User-agent: GPTBot
Disallow: /
Aj keď sa tak správa web crawler, GPTBot bude mať jasný účel: zbierať verejne dostupné údaje a zároveň sa opatrne vyhýbať zdrojom, ktoré zahŕňajú paywall, zhromažďovanie osobných údajov alebo obsah, ktorý porušuje pravidlá OpenAI.
Existuje však niekoľko kontroverzií, niektoré dokonca vyvolali právne kroky proti spoločnosti OpenAI o súkromí a používaní obsahu bez súhlasu autorov alebo bez uvedenia zdrojov.
V júni vydal japonský regulátor ochrany osobných údajov varovanie OpenAI o neoprávnenom zhromažďovaní údajov. Začiatkom tohto roka používanie dočasne zakázalo aj Taliansko ChatGPT z dôvodu údajného porušovania zákonov Európskej únie o ochrane súkromia.